#信息检索

ColBERT:高效精准的神经网络搜索模型

2024年09月05日
Cover of ColBERT:高效精准的神经网络搜索模型

RAGatouille: 简化先进检索方法在RAG应用中的使用

2024年09月05日
Cover of RAGatouille: 简化先进检索方法在RAG应用中的使用

MS MARCO Web Search: 一个大规模信息丰富的网络数据集

2024年09月04日
Cover of MS MARCO Web Search: 一个大规模信息丰富的网络数据集

Motörhead: 传奇重金属乐队的不朽传奇

2024年09月04日
Cover of Motörhead: 传奇重金属乐队的不朽传奇

ChatGPT-RetrievalQA:探索ChatGPT响应在问答检索模型训练中的应用

2024年09月02日
Cover of ChatGPT-RetrievalQA:探索ChatGPT响应在问答检索模型训练中的应用

GraphRAG4OpenWebUI:整合微软GraphRAG技术的开放式Web界面信息检索系统

2024年08月31日
Cover of GraphRAG4OpenWebUI:整合微软GraphRAG技术的开放式Web界面信息检索系统

Superlinked: 革新企业级AI应用的计算框架

2024年08月31日
Cover of Superlinked: 革新企业级AI应用的计算框架

Azure OpenAI与大型语言模型:探索RAG、LlamaIndex和向量存储

2024年08月30日
Cover of Azure OpenAI与大型语言模型:探索RAG、LlamaIndex和向量存储

AgentSearch:革新搜索代理和本地搜索的强大框架

2024年08月30日
Cover of AgentSearch:革新搜索代理和本地搜索的强大框架

大型语言模型的长文本建模技术:挑战与进展

2024年08月30日
Cover of 大型语言模型的长文本建模技术:挑战与进展
相关项目
Project Cover

agent-search

AgentSearch是一个创新框架,通过结合多家提供商的LLM技术与搜索引擎,增强搜索代理性能。支持搜索结果总结、查询生成与深度检索,还能部署个性化本地搜索解决方案,提供多样的API接入选项。

Project Cover

A-Guide-to-Retrieval-Augmented-LLM

本文深入探讨检索增强大语言模型(Retrieval Augmented LLM)的核心要素、工作原理及实践应用。通过结合外部信息源,该技术显著提高了模型在处理时效性强的数据、保护私有信息及应对长尾知识挑战方面的能力。文章还评估了在实际场景中该技术的效果,提供了一个关于如何有效利用检索增强大语言模型的全面视角。

Project Cover

awesome-azure-openai-llm

提供Azure OpenAI和大型语言模型(LLM)的综合参考,包括服务与技术的详细比较和专有功能介绍。深入探讨私有网络支持、角色认证和AI内容过滤的优势,非常适合希望全面了解并运用Azure OpenAI整合服务的技术用户。

Project Cover

superlinked

Superlinked 是一个计算框架,专注将复杂数据(如结构化和非结构化数据)转化为超模态向量嵌入,适用于RAG、搜索、推荐和分析系统。它结合了预训练模型的便利性和自定义模型的性能。该框架提供多种嵌入类型、定制编码器、组合编码器和动态参数等功能,并支持多种向量数据库,适用于实验和生产环境。

Project Cover

primeqa

PrimeQA是一个开源平台,帮助研究人员和开发人员训练先进的问答模型。用户可以在PrimeQA上复制NLP会议中的实验,下载预训练模型并应用于自定义数据。该平台支持信息检索、多语言阅读理解、问题生成及检索增强的生成技术。PrimeQA在多个排行榜中名列前茅,整合Transformers工具包以提供强大的问答功能,满足领先的研究和开发需求。

Project Cover

splade

SPLADE项目使用BERT的MLM头和稀疏正则化来学习查询和文档的稀疏扩展,优化了检索性能。项目包含训练、索引和检索的代码,并支持在BEIR基准测试中评估。最新版本通过硬负样本采样、蒸馏和改进的预训练语言模型初始化,显著提升了检索效果。此外,SPLADE的稀疏表示优化了倒排索引的使用,提供了显式词汇匹配和可解释性等优点。经过优化的训练和正则化,SPLADE在域内外测试中表现优异,延迟性能与BM25相当。

Project Cover

GraphRAG4OpenWebUI

GraphRAG4OpenWebUI 为 Open WebUI 提供了一个强大而高效的信息检索系统,集成了微软研究院的 GraphRAG 技术,支持本地搜索、全球搜索和 Tavily 搜索。该项目专为需要精确和全面搜索结果的开放网络用户界面设计,并且支持本地语言模型和嵌入模型,增强了灵活性和隐私性。通过多个 API 接口,用户可以轻松实现复杂的信息检索需求。

Project Cover

ChatGPT-RetrievalQA

提供ChatGPT与人类响应的数据集,以训练和评估问答检索模型。数据集基于HC3公开数据,分析ChatGPT和传统检索模型在回答真实性和可靠性上的差异。项目由阿姆斯特丹大学支持,数据格式兼容MSMarco,便于研究人员使用现有脚本。

Project Cover

Awesome-LLM-Long-Context-Modeling

本仓库收集了关于高效变换器、长度外推、长期记忆、增强检索生成(RAG)及长文本建模评估的研究论文和博客,提供专业资源用于探索长上下文模型及其挑战,并讨论优化NLP模型的创新方法,适合深度语言模型和复杂文本建模研究人员及开发者。考虑到用户搜索意图的多样性,建议在SEO描述中提及项目对长文本建模从算法到实际应用的全面影响,以及其对未来研究方向的启示。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号