什么是Super-RAG?
Super-RAG是一个超高性能的RAG(检索增强生成)管道工具,专为AI应用设计。它提供了一个简单的API,集成了摘要生成、检索/重排序和代码解释器等功能。
核心特性
Super-RAG具有以下主要特性:
- 支持多种文档格式和向量数据库
- 提供生产就绪的REST API
- 可自定义的文本分割/分块
- 支持使用不同的编码模型(包括专有和开源)对数据进行编码
- 内置代码解释器模式,用于计算性问答场景
- 通过唯一ID进行会话管理,支持缓存
安装指南
要开始使用Super-RAG,您可以按照以下步骤进行安装:
- 克隆仓库:
git clone https://github.com/superagent-ai/super-rag
cd super-rag
- 设置虚拟环境:
# 使用virtualenv
virtualenv env
source env/bin/activate
# 或使用venv
python3 -m venv env
source env/bin/activate
-
安装所需的包
-
将
.env.example
重命名为.env
,并设置环境变量 -
运行服务器:
uvicorn main:app --reload
使用指南
Super-RAG提供了一个内置的REST API,由FastAPI驱动。您可以通过以下端点使用该API:
/api/v1/ingest
: 用于摄取文档/api/v1/query
: 用于查询文档/api/v1/delete
: 用于删除文档
详细的API使用说明可以在项目GitHub页面找到。
支持的编码器和向量数据库
Super-RAG支持多种编码器和向量数据库:
编码器:
- OpenAI
- Cohere
- HuggingFace
- FastEmbed
- Mistral (即将推出)
- Anthropic (即将推出)
向量数据库:
- Pinecone
- Qdrant
- Weaviate
- Astra
- PGVector
- Chroma (即将推出)
云API
Super-RAG提供了一个云API,是开始使用的最简单方式。该API在合理限制内免费使用。
更多资源
Super-RAG是一个强大而灵活的RAG工具,适用于各种AI应用场景。无论您是想构建问答系统、知识库还是其他智能应用,Super-RAG都能为您提供所需的性能和功能。🚀🤖