Project Icon

rag-using-langchain-amazon-bedrock-and-opensearch

基于Amazon Bedrock和OpenSearch构建检索增强生成系统

这个开源项目展示了如何使用Amazon Bedrock的Titan模型和OpenSearch的向量引擎来构建检索增强生成(RAG)系统。项目利用LangChain框架将嵌入文本存储在OpenSearch中,为语言模型提供更精准的上下文。开发者可以选择Amazon Bedrock提供的多种基础模型,包括Anthropic Claude和AI21 Labs的Jurassic系列。项目文档详细介绍了从OpenSearch集群部署到数据加载和查询的全过程,为有意实践RAG技术的开发者提供了完整的参考。

rag-search - 智能数据检索和排名优化工具
API 请求FastAPIGithubRAG Search APIthinkany.ai开源项目机器学习模型
RAG Search API是由thinkany.ai开发,旨在优化搜索结果的效率与准确性。这一API实现了多样化的搜索功能,包括信息重排、筛选详细数据等,并能通过FastAPI快速部署。其简便的安装过程使得开发者能够轻松集成此技术,从而提升数据处理的效能。
CRUD_RAG - 全面评估中文检索增强生成系统的基准测试
CRUD-RAGGithub中文基准测试大语言模型开源项目检索增强生成评估系统
CRUD_RAG是一个全面的中文检索增强生成(RAG)系统评估基准。该项目包含36166个测试样本,覆盖CRUD操作,支持多种评估指标。CRUD_RAG提供原生中文数据集、评估任务和基线模型,并具备一键式评估功能。这一工具可助力研究人员和开发者全面评估和优化中文RAG系统性能,推动中文自然语言处理技术的进步。
rag-sequence-nq - RAG序列模型:知识密集型NLP任务的检索增强生成方案
GithubHuggingfaceRAGfacebook开源项目检索增强生成模型自然语言处理问答系统
RAG-Sequence模型是基于《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》论文研发的开源项目。该模型集成了问题编码器、检索器和生成器,可从wiki_dpr数据集提取相关段落并生成答案。经过wiki_dpr问答数据集的端到端微调,这个不区分大小写的模型能够处理各类事实性问题。开发者可通过Hugging Face的transformers库轻松应用此模型,为知识密集型NLP任务提供高效解决方案。
ragflow - 基于深度文档理解的高效RAG工作流引擎
GithubLLMRAGFlow兼容异构数据源开源项目深度文档理解自动化RAG工作流程
RAGFlow是一个基于深度文档理解的开源RAG引擎,适用于各种规模的企业。结合大型语言模型,它提供可靠的问答功能和可信的引用。RAGFlow支持多种数据格式,包括文本、图片和音频文件,并且兼容本地和远程LLM,提供自动化、无缝集成的RAG工作流,便于通过直观的API进行业务整合。
beyondllm - RAG系统开发与部署的一站式工具包
AI教育BeyondLLMGithubRAG系统大语言模型开源项目
BeyondLLM是一个面向检索增强生成(RAG)系统的综合开发工具包。它集成了自动化流程、可定制评估指标和多种大型语言模型支持,简化RAG系统的实验、评估和部署过程。该工具有助于减少LLM幻觉,提升系统可靠性,支持RAG应用的快速迭代和监控。BeyondLLM兼容Python 3.8-3.11版本,为开发者提供简洁高效的API接口。
local-rag-example - 结合Langchain和Streamlit技术构建本地化聊天式PDF应用
ChatPDFGithubLangchainOllamaRAGStreamlit开源项目
优化描述,以如何在本地机器上快速建立和运行ChatPDF为核心,突出其隐私保护和成本效益的特点。进一步细化技术栈的用途,即Langchain、Ollama和Streamlit如何具体提升操作效率和用户界面体验。
bedrock-claude-chat - 使用Anthropic Claude模型和Amazon Bedrock构建智能聊天机器人
AWSAmazon BedrockAnthropicBedrock Claude ChatGithubLLM开源项目
本项目示例介绍了如何使用Anthropic公司提供的Claude模型和Amazon Bedrock的生成式AI来构建智能聊天机器人。该项目支持多种语言和个性化设置,并可通过API发布。提供详细的管理员仪表板、自动任务处理,以及简易的部署流程。项目架构基于AWS管理服务,确保应用程序的可扩展性、可靠性和安全性。
BCEmbedding - 双语跨语言嵌入模型提升检索增强生成效果
BCEmbeddingGithubRAG双语开源项目语义表示跨语言
BCEmbedding是一款双语和跨语言嵌入模型,针对检索增强生成(RAG)任务进行优化。该模型包含EmbeddingModel和RerankerModel两个组件,分别用于语义向量生成和搜索结果优化。BCEmbedding在中英文语义表示和RAG评估中展现出优异性能,支持多语言和多领域应用。该项目提供了便捷的API接口,可直接集成到RAG系统中,已在实际产品中得到应用验证。
finetune-embedding - 利用合成数据微调嵌入模型提升RAG检索效果
GithubLlamaIndexRAG合成数据嵌入模型微调开源项目检索性能
finetune-embedding项目展示了利用合成数据微调嵌入模型来提升RAG性能的方法。该项目详细介绍了使用大语言模型生成合成数据集、微调开源嵌入模型和评估模型效果的步骤。在小规模金融PDF文档数据集上的实验证明,微调后的嵌入模型能显著提高检索性能。这种方法通过大语言模型生成假设性问题,无需人工标注即可创建高质量训练数据,为RAG系统优化提供了新思路。
rags - 使用自然语言从数据源创建RAG管道
GithubOpenAIRAGsStreamlit开源项目数据管道自然语言处理
RAGs是一个基于Streamlit的应用程序,使用自然语言从数据源创建RAG管道。用户可以描述任务和参数,查看和修改生成的参数,并通过RAG代理查询数据。项目支持多种LLM和嵌入模型,默认使用OpenAI构建代理。该应用程序提供了一个标准的聊天界面,能够通过Top-K向量搜索或总结功能满足查询需求。了解更多关于安装和配置的信息,请访问GitHub页面或加入Discord社区。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

问小白

问小白是一个基于 DeepSeek R1 模型的智能对话平台,专为用户提供高效、贴心的对话体验。实时在线,支持深度思考和联网搜索。免费不限次数,帮用户写作、创作、分析和规划,各种任务随时完成!

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

Trae

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号