#信息检索

信息检索中的预训练模型:发展现状与未来趋势

2024年09月05日
Cover of 信息检索中的预训练模型:发展现状与未来趋势

Vec4IR: 面向信息检索的词嵌入框架

2024年09月05日
Cover of Vec4IR: 面向信息检索的词嵌入框架

ir_datasets: 信息检索数据集的统一接口

2024年09月05日
Cover of ir_datasets: 信息检索数据集的统一接口

PISA: 全球学生评估项目与高性能搜索引擎的融合

2024年09月05日
Cover of PISA: 全球学生评估项目与高性能搜索引擎的融合

LLM4IR-Survey: 大型语言模型在信息检索中的应用综述

2024年09月05日
Cover of LLM4IR-Survey: 大型语言模型在信息检索中的应用综述

INTERS: 利用指令微调释放大型语言模型在搜索中的潜力

2024年09月05日
Cover of INTERS: 利用指令微调释放大型语言模型在搜索中的潜力

RetroMAE: 一种革新性的检索导向语言模型预训练方法

2024年09月05日
Cover of RetroMAE: 一种革新性的检索导向语言模型预训练方法

Pyserini: 用于信息检索研究的Python工具包

2024年09月05日
Cover of Pyserini: 用于信息检索研究的Python工具包

Anserini: 一个用于可重复信息检索研究的Lucene工具包

2024年09月05日
Cover of Anserini: 一个用于可重复信息检索研究的Lucene工具包

RAG技术:提升检索增强生成系统的先进方法

2024年09月05日
Cover of RAG技术:提升检索增强生成系统的先进方法
相关项目
Project Cover

agent-search

AgentSearch是一个创新框架,通过结合多家提供商的LLM技术与搜索引擎,增强搜索代理性能。支持搜索结果总结、查询生成与深度检索,还能部署个性化本地搜索解决方案,提供多样的API接入选项。

Project Cover

A-Guide-to-Retrieval-Augmented-LLM

本文深入探讨检索增强大语言模型(Retrieval Augmented LLM)的核心要素、工作原理及实践应用。通过结合外部信息源,该技术显著提高了模型在处理时效性强的数据、保护私有信息及应对长尾知识挑战方面的能力。文章还评估了在实际场景中该技术的效果,提供了一个关于如何有效利用检索增强大语言模型的全面视角。

Project Cover

awesome-azure-openai-llm

提供Azure OpenAI和大型语言模型(LLM)的综合参考,包括服务与技术的详细比较和专有功能介绍。深入探讨私有网络支持、角色认证和AI内容过滤的优势,非常适合希望全面了解并运用Azure OpenAI整合服务的技术用户。

Project Cover

superlinked

Superlinked 是一个计算框架,专注将复杂数据(如结构化和非结构化数据)转化为超模态向量嵌入,适用于RAG、搜索、推荐和分析系统。它结合了预训练模型的便利性和自定义模型的性能。该框架提供多种嵌入类型、定制编码器、组合编码器和动态参数等功能,并支持多种向量数据库,适用于实验和生产环境。

Project Cover

primeqa

PrimeQA是一个开源平台,帮助研究人员和开发人员训练先进的问答模型。用户可以在PrimeQA上复制NLP会议中的实验,下载预训练模型并应用于自定义数据。该平台支持信息检索、多语言阅读理解、问题生成及检索增强的生成技术。PrimeQA在多个排行榜中名列前茅,整合Transformers工具包以提供强大的问答功能,满足领先的研究和开发需求。

Project Cover

splade

SPLADE项目使用BERT的MLM头和稀疏正则化来学习查询和文档的稀疏扩展,优化了检索性能。项目包含训练、索引和检索的代码,并支持在BEIR基准测试中评估。最新版本通过硬负样本采样、蒸馏和改进的预训练语言模型初始化,显著提升了检索效果。此外,SPLADE的稀疏表示优化了倒排索引的使用,提供了显式词汇匹配和可解释性等优点。经过优化的训练和正则化,SPLADE在域内外测试中表现优异,延迟性能与BM25相当。

Project Cover

GraphRAG4OpenWebUI

GraphRAG4OpenWebUI 为 Open WebUI 提供了一个强大而高效的信息检索系统,集成了微软研究院的 GraphRAG 技术,支持本地搜索、全球搜索和 Tavily 搜索。该项目专为需要精确和全面搜索结果的开放网络用户界面设计,并且支持本地语言模型和嵌入模型,增强了灵活性和隐私性。通过多个 API 接口,用户可以轻松实现复杂的信息检索需求。

Project Cover

ChatGPT-RetrievalQA

提供ChatGPT与人类响应的数据集,以训练和评估问答检索模型。数据集基于HC3公开数据,分析ChatGPT和传统检索模型在回答真实性和可靠性上的差异。项目由阿姆斯特丹大学支持,数据格式兼容MSMarco,便于研究人员使用现有脚本。

Project Cover

Awesome-LLM-Long-Context-Modeling

本仓库收集了关于高效变换器、长度外推、长期记忆、增强检索生成(RAG)及长文本建模评估的研究论文和博客,提供专业资源用于探索长上下文模型及其挑战,并讨论优化NLP模型的创新方法,适合深度语言模型和复杂文本建模研究人员及开发者。考虑到用户搜索意图的多样性,建议在SEO描述中提及项目对长文本建模从算法到实际应用的全面影响,以及其对未来研究方向的启示。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号