#向量数据库

examples - Pinecone向量数据库与AI应用示例
PineconeAI向量数据库Jupyter NotebookGoogle ColabGithub开源项目
这个资源库包含Pinecone向量数据库及常见AI模式、工具和算法的示例应用和Jupyter Notebooks,供用户下载、学习和修改。资源库分为生产就绪示例和学习探索示例,并提供详细的入门指南和Google Colab的实验指导。欢迎反馈和贡献以改进该社区资源。
vectordb - 基于C++实施高效的图遍历向量索引技术
Epsilla向量数据库性能优化自然语言搜索云原生架构Github开源项目
Epsilla,这款开源矢量数据库以其高性能的向量检索、成本效率及可扩展性而备受欢迎。拥有完整的数据库管理系统功能并支持深度学习与自然语言处理查询,Epsilla同时实现云原生的无服务器多租户架构,并与多种生态系统无缝集成。
vectordb-recipes - 探索GenAI应用构建的综合教程与实用代码示例
LanceDB向量数据库GenAIPythonJavaScriptGithub开源项目
vectordb-recipes项目展示了如何利用Python和Web应用结合使用LanceDB和其他工具构建GenAI应用的完整示例和教程,实现从简单到复杂的快速开发。LanceDB无需额外设置,可直接融入Python数据生态系统,还支持类型化TypeScript SDK和服务器中的向量搜索。
NeumAI - 优化大规模检索增强生成的开发者数据平台
Neum AI大语言模型数据平台向量数据库RAGGithub开源项目
Neum AI是一个数据平台,帮助开发者利用检索增强生成(RAG)技术。它从现有数据源提取数据,生成向量嵌入,并导入向量数据库进行相似性搜索。平台具有高吞吐量分布式架构,处理数十亿数据点,内置数据连接器和实时同步功能,确保数据最新,并支持元数据混合检索,提供全面的RAG解决方案。
cognita - RAG系统模块化与扩展平台
Cognita索引部署API向量数据库Github开源项目
Cognita整合了Langchain和LlamaIndex技术,提供了一套模块化且API驱动的RAG组件和无代码UI,适合本地及生产环境使用。新功能包括内置Metadatastore、Docker Compose快速部署及多样化的嵌入和重排序服务。此平台使得用户无需代码即可管理文档和实施QnA,优化了试验和部署的效率。
VectorDB-Plugin-for-LM-Studio - 增强LM Studio的向量数据库插件
LM Studio向量数据库Windows系统Python 3.11Nvidia GPUGithub开源项目
VectorDB-Plugin-for-LM-Studio为Windows系统提供的插件,通过Nvidia GPU加速,增强LM Studio处理图像、音频文件和文本转语音回放。该插件支持多种文件类型,并通过先进的向量数据库管理功能,实现多媒体内容的高效查询和管理。它是专业人员和技术爱好者处理大量数据的理想选择。
embedJs - 开源Node.js框架,助力构建基于检索的生成应用与大型语言模型
EmbedJsLLMRAGApplicationBuilder向量数据库加载器Github开源项目
EmbedJs为一个开源Node.js框架,使开发者能轻松构建个性化的LLM应用。它不仅支持分割数据、生成嵌入和存储优化,还提供多种向量数据库和数据加载器选项,有效提升应用的整体性能和响应能力。适用于需要高精度回答和上下文交互的复杂场景。
chatWeb - 智能文本摘要与互动式问题解答工具
ChatWebGPT3.5文本摘要向量数据库文本抽取Github开源项目
ChatWeb,具备智能页面内容抓取和文档处理功能,可基于GPT3.5技术从网页、PDF、DOCX、TXT文件中自动抽取文本并生成精准摘要。此外,ChatWeb提供基于内容的智能问答,能够针对用户的问题提供最相关的信息回答,无论您是在进行学术研究还是需要日常信息收集,都能获得高效的辅助。
LangChain-Chinese-Getting-Started-Guide - LangChain中文入门教程
LangChainOpenAI APILLM模型文档分割器向量数据库Github开源项目
LangChain中文入门教程提供详细指南助开发者有效利用多种Language Models。它适时更新,涵盖丰富实战案例,展示如何集成OpenAI、Hugging Face等模型。教程还详述如何自定义API请求,以满足不同开发需求。
milvus - 支持嵌入相似性搜索与AI应用的开源的云原生向量数据库
Milvus向量数据库嵌入相似搜索AI应用开放源代码Github开源项目
Milvus是一个开源向量数据库,专为提高嵌入相似性搜索和AI应用的效率。2.0版本采用云原生设计,支持存储与计算分离,全无状态组件提升弹性与灵活性。主要功能包括毫秒级查询、简化非结构化数据管理、高可靠性、强扩展性和混合搜索等。已有超过1000家企业用户和27000+ GitHub星标,并受到活跃的开源社区支持。
elasticsearch-labs - 收录了可执行的Python笔记本、示例应用和资源,用于测试Elastic平台的各种功能
Elasticsearch搜索引擎AI/MLPython笔记本向量数据库Github开源项目
该项目收录了可执行的Python笔记本、示例应用和资源,用于测试Elastic平台的各种功能。通过本项目,可以学习如何利用Elasticsearch作为向量数据库,支持混合和语义搜索,并构建检索增强生成、摘要和问答等应用场景。还可以测试Elastic的前沿功能,例如Elastic Learned Sparse Encoder和递归排序融合。项目还支持与OpenAI、Hugging Face等集成,为AI/ML驱动的应用提供基础,探索更多高级搜索体验。
DocumentGPT - 允许用户上传PDF文档并与AI聊天机器人互动,并通过向量数据库实现研究文档语义搜索的web应用
DocumentGPT语义搜索向量数据库AI聊天机器人OpenAI Chat APIGithub开源项目
DocumentGPT是一个基于OpenAI Chat API的web应用,允许用户上传PDF文档并与AI聊天机器人互动,还可以通过向量数据库进行语义搜索。用户能在应用内查看文档内容、进行Google/YouTube搜索并获取自动搜索建议,同时提供上下文丰富的搜索结果及其来源验证。欢迎尝试Streamlit Cloud上的部署版本,且GitHub上开放了贡献和反馈渠道。
7-docs - OpenAI API助力知识库构建与智能问答
7-docsOpenAICLI工具向量数据库内容查询Github开源项目
7-docs是一套基于OpenAI的工具,利用命令行工具`@7-docs/cli`和函数部署工具`@7-docs/edge`,可将内容存储到矢量数据库并进行查询。用户可以像使用ChatGPT一样互动,还能自定义实现聊天功能,特别适合需要快速获取精准信息的应用场景。
bootcamp - 探索非结构化数据处理与相似性搜索应用的构建
Milvus向量数据库反向图像搜索聊天机器人自然语言处理Github开源项目
该项目展示了如何使用Milvus向量数据库处理诸如图片、音频和视频等非结构化数据,并构建相似性搜索应用,如聊天机器人、推荐系统、反向图片搜索和分子搜索等。项目还包括Jupyter Notebook和Docker的本地运行解决方案,方便在本地机器上部署和运行示例应用。
weaviate - 高性能、扩展性强、多模块支持的开源向量数据库
Weaviate向量数据库机器学习开源快速搜索Github开源项目
Weaviate 是一个云原生的开源向量数据库,采用先进的机器学习模型将文本、图片等数据转化为可搜索的向量。它不仅速度快,还具备高度灵活性,支持在导入数据时进行向量化或上传现成的向量。此外,Weaviate 可通过多种模块与 OpenAI、Cohere、HuggingFace 等热门服务和模型库集成。其设计从快速原型开发到大规模生产部署均能应对,并具备推荐、摘要和神经搜索等功能。
embedding_studio - 能将嵌入模型与向量数据库转换为搜索引擎的开源框架
Embedding Studio开源框架search engine嵌入模型向量数据库Github开源项目
Embedding Studio是一个开源框架,能将嵌入模型与向量数据库转换为搜索引擎,具备点击流收集、搜索体验改进和模型自动适应等功能。适合处理大量目录和非结构化数据的平台,帮助持续优化搜索效果。
chatgpt-retrieval-plugin - 增强AI模型的文档访问和语义搜索能力的独立的检索后端
ChatGPTRetrieval Plugin向量数据库自然语言查询文档嵌入Github开源项目
ChatGPT检索插件是一个独立的检索后端,为AI模型提供语义搜索和文档检索功能。它利用OpenAI的嵌入模型和向量数据库技术,可处理多种数据源的文档,支持元数据过滤,并提供灵活的部署选项。该插件可与ChatGPT自定义GPT、函数调用或插件模型集成,使开发者能够构建高度定制化的文档访问系统,适用于个人用户和企业内部知识管理。
haystack-cookbook - Haystack框架的多样化NLP应用案例集
HaystackRAG自然语言处理大语言模型向量数据库Github开源项目
Haystack-cookbook是一个开源项目,集成了多种自然语言处理任务的实践案例。项目展示了如何使用Haystack框架,结合各类模型、向量数据库和检索技术构建NLP应用。内容涵盖文本问答、多语言处理、语音识别和信息提取等领域,为开发者提供了丰富的代码示例和学习资源。项目通过Jupyter Notebook形式呈现多个实用案例,包括使用不同的语言模型、向量数据库进行文本检索、问答系统构建等。这些示例涵盖了从基础NLP任务到高级应用的广泛场景,有助于开发者快速上手Haystack框架并探索其在实际项目中的应用潜力。
vlite - 高效轻量的开源向量数据库
vlite向量数据库嵌入式存储RAGLangChainGithub开源项目
vlite是一款开源的轻量级向量数据库,无需额外配置即可使用。该项目支持多种文件格式导入,内置嵌入生成功能,并采用CTX文件格式存储用户上下文。vlite在索引和检索速度方面表现优异,同时具有更小的磁盘占用。这使其成为RAG、智能代理和ChatGPT插件等AI应用的理想选择。vlite还提供LangChain集成,有助于快速构建高性能AI应用。
vector-io - 多平台向量数据集迁移工具 支持主流向量数据库
Vector IO向量数据库数据导入导出向量数据集开源项目Github
Vector IO是一个向量数据集迁移工具,采用通用格式实现多种向量数据库间的数据转换。目前支持Pinecone、Qdrant、Milvus等主流数据库,提供命令行接口进行数据导入导出和重新嵌入。该开源项目正不断扩展兼容的数据库类型,欢迎社区参与贡献。
babyagi - 基于AI的自主任务管理框架
BabyAGI人工智能任务管理OpenAI向量数据库Github开源项目
BabyAGI是一个结合OpenAI和向量数据库的任务管理框架。该系统能自动创建、排序和执行任务,基于设定目标和历史结果生成新任务。支持OpenAI和Llama等多种语言模型,适合长期任务管理。BabyAGI以简洁和可扩展性著称,为AI自主代理研究提供了基础平台。
rag_api - 基于FastAPI的异步文档索引与检索框架
RAGFastAPILangchain向量数据库嵌入式检索Github开源项目
这是一个基于FastAPI和Langchain的异步文档索引和检索框架。它利用PostgreSQL/pgvector进行向量存储,按文件ID组织嵌入向量。该框架提供文档管理、向量存储和异步操作功能,可集成到LibreChat或应用于其他ID导向的场景。支持多种向量数据库和嵌入模型,并包含详细的配置指南。
prompttools - 全面LLM实验评估工具集
PromptToolsLLM提示词实验向量数据库人工智能Github开源项目
PromptTools是一套开源的LLM实验工具集,支持向量数据库和提示词的测试与评估。该工具兼容OpenAI、Anthropic等多个主流API,提供代码、笔记本和本地playground界面。开发者可以便捷地比较不同模型和参数性能,并评估向量数据库检索准确性,有效提升AI开发效率。
milvus-sdk-go - Milvus官方Go语言SDK - 向量数据库开发工具包
MilvusGo SDK向量数据库API文档代码贡献Github开源项目
milvus-sdk-go是Milvus向量数据库的官方Go语言开发工具包,提供丰富API用于连接服务器、管理集合和分区、执行向量搜索等操作。该SDK支持多个Milvus版本,兼容性和稳定性良好。开发者可通过go get命令轻松安装,快速将Milvus功能集成到Go应用中。适用于需要在Go项目中使用高性能向量数据库的开发者。
Easy-RAG - 构建高效RAG系统 集成多功能知识库和先进对话能力
Easy-RAG知识库向量数据库大模型聊天知识图谱Github开源项目
Easy-RAG是一个功能全面的检索增强生成(RAG)系统,支持多种文件格式的知识库管理。系统整合了Chroma、FAISS等向量数据库,并采用rerank技术提高信息检索效率。它具备纯大模型多轮对话和基于知识库的问答能力,适合学习、使用和自主扩展。Easy-RAG还支持音频视频的语音转文本功能,为构建智能对话系统提供了全面的解决方案。
rag-stack - 基于RAG技术的企业级智能问答平台
RAGstack检索增强生成开源LLM向量数据库企业知识库Github开源项目
RAGstack是一个基于检索增强生成(RAG)技术的企业级智能问答平台。该项目支持Llama 2、Falcon和GPT4All等开源大语言模型,利用Qdrant向量数据库实现高效文档检索。RAGstack提供简洁的服务器和用户界面,支持PDF文档上传和智能问答。系统可在本地运行,也可轻松部署到各大主流云平台,为企业提供安全可控的私有化知识问答解决方案。
vectra - 基于Node.js的本地向量数据库 适用于轻量级AI应用
Vectra向量数据库Node.js本地索引相似度搜索Github开源项目
Vectra是Node.js环境下的本地向量数据库,功能类似Pinecone和Qdrant,但采用本地文件存储方式。该项目主要用于处理小型静态数据集,具备元数据索引和相似度排序查询功能。Vectra特点在于快速加载和迅速查询响应,适合应用于提示工程和少样本学习等AI场景。此外,Vectra支持跨语言操作,可与Python等语言绑定协同工作。
indexify - 构建快速数据管道 实时处理非结构化数据的开源引擎
Indexify数据管道非结构化数据提取器向量数据库Github开源项目
Indexify是一个开源引擎,用于构建处理非结构化数据的快速数据管道。它支持视频、音频、图像和文档处理,使用可重用提取器进行数据嵌入、转换和特征提取。系统能自动更新向量数据库和结构化数据库,支持增量提取,并提供提取器SDK。Indexify预置多种提取器,兼容多种LLM框架和存储系统,可本地运行原型。这些特性使其成为实时RAG应用和智能体的高效数据处理解决方案。
MyScale - 创新SQL向量数据库助力AI应用高效开发
AI工具MyScale向量数据库SQL人工智能搜索
MyScale是一款融合向量搜索和SQL分析的创新数据库,为AI应用开发提供高性能解决方案。它支持高效的向量搜索、文本搜索和复杂查询,有效提升RAG效果。MyScale的MSTG向量引擎显著提高了速度并降低了成本。作为关系型向量数据库,MyScale支持高级SQL向量联合查询,并易于与主流AI开发框架集成。此外,MyScale还提供全面的全文搜索功能和安全合规保障,适合构建各类生产级AI应用。
Infrabase.ai - 全面的AI基础设施工具和服务发现平台
AI工具AI基础设施工具目录向量数据库提示工程推理API
Infrabase.ai提供全面的AI基础设施工具和服务目录,涵盖向量数据库、提示工程、可观察性分析、推理API、框架技术栈、微调、音频处理和AI代理等类别。网站汇集详细产品信息、截图和试用链接,帮助开发者和企业快速比较、选择适合AI项目的解决方案,是了解AI基础设施全景的重要资源。
RecoFeed - 本地化个性化推荐引擎 确保数据隐私安全
AI工具RecoFeed个性化推荐向量数据库本地处理用户隐私
RecoFeed是一款本地化AI个性化推荐引擎,利用CloseVector跨平台向量数据库在用户设备上实时生成推荐,确保数据隐私。支持文章、产品、视频等多种内容的实时推荐,基础功能免费。适合开发者构建用户推荐源。目前处于封闭测试阶段,可申请试用。
FringeSift - AI驱动的爱丁堡艺穗节演出搜索平台
AI工具AIEdinburghChatGPT向量数据库OpenAI
FringeSift是一个基于AI技术的爱丁堡艺穗节演出搜索平台。用户可通过文本查询输入个人兴趣,系统利用ChatGPT分析并总结结果,提供精准的演出推荐。该平台简化了演出信息浏览过程,帮助观众更轻松地发现符合个人喜好的节目。FringeSift在八月份艺穗节期间每日提供有限次数的AI辅助搜索,为艺穗节观众带来智能化的节目筛选体验。
Neum AI - 开源框架助力构建高效RAG数据管道
AI工具RAG数据管道嵌入向量数据库Neum AI
Neum AI框架专注于简化RAG和语义搜索的数据基础设施构建。它整合了多种连接器,便于快速创建数据管道,高效处理各类数据。框架兼顾本地开发与云端部署,满足不同规模需求。其核心功能包括实时数据同步、全面可观测性和智能检索,有效提升数据管理效率。Neum AI为构建可靠、高性能的RAG系统提供了全面解决方案。
onprem - 本地运行大型语言模型 安全处理私密数据
OnPrem.LLM大语言模型本地部署向量数据库代码生成Github开源项目
OnPrem.LLM是一个Python工具包,支持在本地机器上运行大型语言模型,处理非公开数据。该工具兼容本地LLM和OpenAI API,提供文档问答、文本摘要和信息提取等功能。适用于需要在防火墙内处理敏感信息的企业,可轻松将本地LLM集成到实际应用中。
pymilvus - Milvus向量数据库的官方Python SDK
MilvusPython SDKPyMilvus向量数据库安装指南Github开源项目
pymilvus是Milvus向量数据库的官方Python SDK,提供简洁而强大的API接口。支持向量检索和数据管理,兼容多个Milvus版本。通过pip易于安装,具备良好的兼容性和完善的文档。适用于开发各类基于向量的AI应用。
godot-llm - 大语言模型助力游戏开发的开源插件
Godot LLM大语言模型文本生成文本嵌入向量数据库Github开源项目
Godot-LLM是一个集成大语言模型功能的Godot引擎插件。它提供文本生成、文本嵌入、多模态文本生成和向量数据库等功能,适用于NPC模型、游戏机制和设计辅助。该插件支持在普通硬件上本地运行小型LLM模型,并包含检索增强生成(RAG)组件,有助于创建更智能的游戏世界和角色互动。