#RAG

rag_api - 基于FastAPI的异步文档索引与检索框架
RAGFastAPILangchain向量数据库嵌入式检索Github开源项目
这是一个基于FastAPI和Langchain的异步文档索引和检索框架。它利用PostgreSQL/pgvector进行向量存储,按文件ID组织嵌入向量。该框架提供文档管理、向量存储和异步操作功能,可集成到LibreChat或应用于其他ID导向的场景。支持多种向量数据库和嵌入模型,并包含详细的配置指南。
awesome-llm-webapps - 开源LLM网络应用汇总和对比分析
LLM开源Web应用聊天机器人RAGGithub开源项目
该项目收集并分析了多种开源LLM网络应用,涵盖聊天机器人、自然语言界面等类型。通过比较各项目的功能特点,为开发者选择合适的应用提供参考。收录的项目均为开源且活跃维护,包含从基础API到完整生产系统等不同复杂度。
genai-quickstart-pocs - Amazon Bedrock生成式AI应用示例集
Amazon Bedrock生成式AIRAG模型评估语言模型Github开源项目
项目展示了多个Amazon Bedrock生成式AI应用实例,包括文档摘要、RAG问答、图像生成等。提供Python和.NET两种实现,并集成Streamlit前端,方便快速验证概念。这些示例为开发者提供了丰富的参考,有助于构建创新AI解决方案。
SaltAI_Language_Toolkit - 整合式AI语言处理工具包 多功能技术集成
SaltAIComfyUIRAGLLMAI开发工具Github开源项目
SaltAI Language Toolkit是一个开源项目,整合了Llama-Index、AutoGen和LlaVA-Next等技术,与ComfyUI的节点界面结合。工具包提供检索增强生成、多智能体对话和视觉语言处理功能,增强AI语言处理能力。支持Git、Pip和ComfyUI Manager安装。项目提供示例工作流程,展示了搜索、对话和数据处理应用。
PubSec-Info-Assistant - 基于Azure和OpenAI的企业智能助手系统
Azure AI SearchOpenAIRAG信息助手大语言模型Github开源项目
该项目整合Azure AI Search和OpenAI语言模型,打造智能助手系统。采用检索增强生成技术,实现基于企业数据的自然语言交互。功能包括数据检索、多语言翻译、个性化设置、思考过程解释和引用验证。系统为企业提供数据智能管理和高级人机对话能力,适用于各类信息查询和决策支持场景。
LangSaaS - 面向开发者的RAG聊天机器人SaaS模板
AI工具LangSaaSRAGchatbotNextJSLangChain
LangSaaS为开发者提供了一个用于创建基于检索增强生成(RAG)技术的AI聊天机器人应用的SaaS模板。该模板集成了现代化前端(Next.js)和后端(Python环境中的LangChain),以及LangChain、Qdrant、Cohere、UnstructuredIO和Stripe支付网关等工具。开发者可以利用这一模板快速构建和部署RAG聊天机器人应用,大幅缩短开发周期。LangSaaS的模块化架构使其具有良好的可定制性,能够满足不同项目的特定需求。
SciPhi Cloud - 综合RAG开发平台助力AI应用快速部署和优化
AI工具RAGSciPhi CloudAI应用向量搜索文档管理
SciPhi Cloud是一个专注于检索增强生成(RAG)应用的综合开发平台。平台集成了用户认证、文档管理、混合向量搜索等功能,支持多种文件格式快速导入,并应用最新RAG技术。内置分析工具助力开发者持续优化系统性能。SciPhi Cloud提供直观的界面和强大的API,可轻松集成各种LLM提供商,加速RAG应用的开发和部署过程,为AI创新提供全方位支持。
LastMile AI - 全面的生成式AI开发工具集,加速应用从原型到生产
AI工具RAG生成式AI提示工程模型评估AI开发平台
LastMile AI是面向工程师的生成式AI开发平台。它整合RAG工作台、AIConfig和服务网格等工具,支持RAG管道调试、提示词优化和模型管理。平台助力开发者高效将AI原型转化为生产应用,同时提供自动评估、版本控制和统一API等功能,为企业级AI应用开发提供全方位支持。
Lycee AI - 全面的AI教育与应用开发学习平台
AI工具DSPyLangChainRAG生成式AIAI课程
Lycee AI作为在线人工智能教育平台,提供从入门到高级的全面AI课程。课程内容包括生成式AI、DSPy编程和LangChain应用等热门主题。平台设计注重实践,通过项目式学习帮助学员掌握AI技术并应用于实际工作。Lycee AI的课程体系覆盖AI领域多个方面,适合个人学习者和企业团队提升AI能力,增强在快速发展的AI行业中的竞争力。
GPT-Zip.Link - Web RAG提示压缩工具大幅降低GPT-4输入成本
AI工具GPT-ZipRAG压缩API成本节省
GPT-Zip.Link是一个专门用于压缩Web RAG提示内容的工具,可将GPT-4输入令牌数量减少高达87%。通过简单的URL复制粘贴,该工具可轻松集成到各种编程语言中。它不仅降低了成本,还提高了处理效率,加快了GPT-4的响应速度,简化了数据复杂性。GPT-Zip.Link为AI驱动的内容生成和分析提供了一种高效且经济的优化方案。
Neum AI - 开源框架助力构建高效RAG数据管道
AI工具RAG数据管道嵌入向量数据库Neum AI
Neum AI框架专注于简化RAG和语义搜索的数据基础设施构建。它整合了多种连接器,便于快速创建数据管道,高效处理各类数据。框架兼顾本地开发与云端部署,满足不同规模需求。其核心功能包括实时数据同步、全面可观测性和智能检索,有效提升数据管理效率。Neum AI为构建可靠、高性能的RAG系统提供了全面解决方案。
Teammate AI Services - GenAI应用开发的迭代式提示工程平台
AI工具GenAI提示工程RAGLLM开源AI模型
Teammate AI Services为开发者提供迭代式提示工程和RAG开发工具,涵盖GenAI开发全生命周期。平台包括敏捷提示开发(Lang)、无代码RAG构建(Aug)、LLM可观察性(Intel)和开源模型API(Infer)等功能。通过整合提示、RAG和模型配置于单一API,简化了GenAI应用的开发和管理流程,有助于提升输出质量和准确性。
rag - 高效检索增强生成系统RAG实现
RAGtxtai向量搜索图搜索LLMGithub开源项目
RAG with txtai项目实现了一个基于Streamlit的检索增强生成应用。系统集成了向量RAG和图RAG两种方法,通过控制语言模型的上下文来增强回答的准确性。项目支持Docker容器和Python虚拟环境部署,可灵活添加自定义数据并通过环境变量配置模型参数。这一versatile的RAG系统适用于广泛的知识检索和智能问答应用场景。
graph-rag - 自动生成知识图谱和文档网络以增强RAG性能
Knowledge Graph RAG知识图谱文档网络RAG搜索Github开源项目
graph-rag项目旨在提升检索增强生成(RAG)的性能。它自动从文档中提取实体和关系,构建知识图谱和文档关联网络。这些图谱可用于搜索相关实体或查找相互关联的文档,增强大型语言模型的上下文信息。该项目在处理医疗等专业领域文档时尤为有效,能提高信息检索和知识推理效率。
localGPT - 本地化文档交互系统 保护隐私无忧
LocalGPTRAGLangChain本地文档对话隐私保护Github开源项目
作为开源项目,LocalGPT实现了本地文档的安全交互。系统采用多种开源模型和嵌入技术,支持语言模型重复使用,具备聊天历史记录功能。LocalGPT通过LangChain工具在本地环境中解析文档、创建嵌入,并利用本地语言模型理解问题、生成答案。该项目适合对数据隐私有高要求的应用场景,可在多个平台上运行,支持多种文件格式。
sec-insights - 基于LlamaIndex的SEC文档智能分析工具
SEC InsightsRAGLlamaIndexFastAPIOpenAIGithub开源项目
SEC Insights是一个开源项目,利用LlamaIndex的RAG技术分析SEC 10-K和10-Q文档。该工具提供聊天式问答、源数据引用和PDF查看等功能,还可通过API回答定量问题。项目使用React和FastAPI构建,支持本地和云端部署,为开发者提供了完整的RAG应用参考。
rag-chatbot - RAG聊天机器人 支持多PDF智能对话和灵活部署
RAGPDF聊天本地运行GradioHuggingfaceGithub开源项目
rag-chatbot项目采用检索增强生成(RAG)技术,实现了与多个PDF文档的智能交互。系统支持本地运行和Kaggle环境,可灵活选择Huggingface或Ollama的各类模型。其特色功能包括多PDF并行处理、跨语言对话潜力和简易部署流程。项目持续优化中,未来将引入高级文档管理和ReAct Agent等功能,适用于研究、教育和企业等多种场景。
awesome-LLM-resourses - 中文大语言模型全面资源汇总 数据处理到评估应有尽有
大语言模型LLM微调推理评估RAGGithub开源项目
该项目汇总了中文大语言模型(LLM)领域的全面资源,包含数据处理、微调、推理和评估等多个环节的开源工具。资源库涵盖最新LLM技术,并收录RAG系统和AI代理等前沿应用。项目为LLM研究者和开发者提供了丰富的工具和信息,有助于推进相关项目的开发与应用。
MindSQL - 简化数据库交互的智能RAG库
MindSQLRAG数据库交互大语言模型Python库Github开源项目
MindSQL是一个Python RAG库,旨在简化数据库交互。它支持PostgreSQL、MySQL和SQLite等主流数据库,并可扩展至Snowflake和BigQuery。通过整合大型语言模型和向量存储,MindSQL实现了自然语言数据查询和可视化。这个库只需几行代码即可使用,适用于数据分析和数据库管理。
rag-using-langchain-amazon-bedrock-and-opensearch - 基于Amazon Bedrock和OpenSearch构建检索增强生成系统
RAGAmazon BedrockLangChainOpenSearchTitanGithub开源项目
这个开源项目展示了如何使用Amazon Bedrock的Titan模型和OpenSearch的向量引擎来构建检索增强生成(RAG)系统。项目利用LangChain框架将嵌入文本存储在OpenSearch中,为语言模型提供更精准的上下文。开发者可以选择Amazon Bedrock提供的多种基础模型,包括Anthropic Claude和AI21 Labs的Jurassic系列。项目文档详细介绍了从OpenSearch集群部署到数据加载和查询的全过程,为有意实践RAG技术的开发者提供了完整的参考。
langchain4j-aideepin - 融合大语言模型和Langchain4j的开源RAG智能对话系统
LangChain4j-AIDeepinRAG大语言模型知识库AI绘图Github开源项目
LangChain4j-AIDeepin是一个基于大语言模型和Langchain4j框架的开源RAG系统。该项目提供多会话、图片生成、知识库和智能搜索等功能,支持多种AI模型和搜索引擎。系统包含用户端和管理端,采用Java和Vue3技术栈开发,支持离线部署。这是一个功能丰富、灵活可定制的AI应用开发平台。
GenAI-Showcase - 生成式AI应用案例和资源的开源数据库
生成式AIMongoDBRAGAI代理向量数据库Github开源项目
GenAI-Showcase是一个开源项目,汇集了生成式AI的最新应用案例和资源。项目涵盖检索增强生成(RAG)、AI代理以及多个行业的具体应用。它展示了MongoDB在RAG流程和AI代理中的集成应用,包括作为向量数据库、操作数据库和内存提供者。项目提供了实用的代码示例、框架指南,并整合了先进AI模型,为开发者和研究者提供了丰富的学习和参考资料。
JamAIBase - 集成嵌入式数据库的开源RAG后端平台
JamAI BaseRAG嵌入式数据库AI增强LLMGithub开源项目
JamAI Base集成了SQLite和LanceDB,提供内存管理和RAG功能。平台通过直观界面和API实现LLM、向量嵌入和重排序管理。它支持多种表格功能,高效处理大规模数据。采用声明式范式,简化操作,易用性强,可扩展性高。适用于需要AI增强检索功能的后端系统开发。
contoso-chat - Azure AI Studio打造智能零售对话系统
Azure AI StudioPromptflowRAGAzure OpenAIContoso ChatGithub开源项目
项目展示了使用Azure AI Studio和Promptflow构建智能零售对话系统的方法。系统采用检索增强生成模式,结合产品目录和客户购买历史来回答查询。开发者可学习提示工程、评估运行、解决方案部署和负责任AI实践。项目提供模型配置示例、对话和评估提示、Prompty资产及应用代码,适合开发零售AI助手的团队参考。
Vectorize - 将非结构化数据高效转换为优化的向量搜索索引
AI工具VectorizeRAG生成式AI向量搜索大型语言模型
Vectorize提供专为RAG设计的工具,将非结构化数据转化为优化的向量搜索索引。平台支持多种数据来源连接,帮助企业迅速构建生成式应用,提升客户体验和生产力。
rag-sequence-nq - RAG序列模型:知识密集型NLP任务的检索增强生成方案
RAGHuggingface模型facebookGithub检索增强生成开源项目自然语言处理问答系统
RAG-Sequence模型是基于《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》论文研发的开源项目。该模型集成了问题编码器、检索器和生成器,可从wiki_dpr数据集提取相关段落并生成答案。经过wiki_dpr问答数据集的端到端微调,这个不区分大小写的模型能够处理各类事实性问题。开发者可通过Hugging Face的transformers库轻松应用此模型,为知识密集型NLP任务提供高效解决方案。
text2vec-base-chinese-rag - 基于CoSENT框架的中文RAG文本嵌入模型
开源项目模型RAG向量检索LangchainGithubFAISS自然语言处理Huggingface
text2vec-base-chinese-rag采用CoSENT训练框架构建,专注于中文文本理解和RAG任务。模型支持文本相似度计算,集成Langchain和FAISS向量存储功能,实现高效文档检索。项目提供自定义LLM的RAG实现示例,便于开发者快速应用和扩展。
rag-token-nq - RAG技术驱动的智能问答生成模型
RAG开源项目自然语言处理transformer模型问答系统Huggingface知识检索Github
RAG-token-nq是一个结合DPR和BART技术的智能问答模型,通过检索wiki_dpr数据集实现知识增强。模型包含问题编码器、检索器和生成器,能够针对事实性问题生成准确答案。基于uncased处理机制,该模型在知识密集型自然语言处理任务中表现优异。
rag-token-base - 基于检索增强生成的知识型自然语言处理模型
Github模型检索增强生成开源项目知识密集型NLP任务Huggingface问题编码器RAG生成器
RAG-Token-Base是一个开源的自然语言处理模型,集成了问题编码器、检索器和生成器三个核心组件。模型采用DPR编码器和BART生成器架构,通过结合外部知识实现高质量的文本生成。其灵活的检索器配置功能使其适用于各类知识密集型的语言处理任务。
bce-embedding-base_v1 - 中英双语语义表征模型提升RAG检索性能
BCEmbedding开源项目模型GithubHuggingface双语语义表征RAG跨语种
bce-embedding-base_v1是一个针对检索增强生成(RAG)优化的中英双语语义表征模型。该模型在中英文语义搜索和问答任务中表现出色,适用于多个领域,并可方便地集成到langchain和llamaindex等框架。无需特殊指令,bce-embedding-base_v1能高效召回相关文本,为RAG应用提供可靠的语义基础。