注册(1000个块免费) | 文档 | 会议链接 | Discord | Matrix
Trieve 是一个用于构建混合向量搜索、推荐和 RAG 的全方位基础设施
快捷链接
功能
- 🔒 在您的 VPC 或本地托管:购买许可证以使用我们现成的 Docker 容器和 Terraform 模板在您的公司 VPC 或本地托管。
- 🧠 语义密集向量搜索:与 OpenAI 或 Jina 嵌入模型和 Qdrant 集成以提供语义向量搜索。
- 🔍 容错全文本/神经搜索:每个上传的块都通过 naver/efficient-splade-VI-BT-large-query 向量化,以实现容错、高质量的神经稀疏向量搜索。
- 🖊️ 子句高亮:在搜索时高亮显示块中的匹配词或句子,并将它们加粗以增强用户体验。特别鸣谢 simsearch 库!
- 🌟 推荐:使用推荐 API 查找相似的块(如果使用分组,则查找相似的文件)。非常适合有用户收藏、书签或点赞内容的平台。
- 🤖 方便的 RAG API 路由:我们与 OpenRouter 集成,为您提供访问任何 LLM 的权限,以便进行 RAG。尝试我们的路由,用于基于主题的内存管理的完全托管 RAG 或 选择您自己的上下文 RAG。
- 💼 携带您自己的模型:如果您愿意,您可以携带自己的文本嵌入、SPLADE、交叉编码器重排和/或大语言模型(LLM),并将其接入我们的基础设施。
- 🔄 具有交叉编码器重排序的混合搜索:为获得最佳结果,请使用具有 BAAI/bge-reranker-large 重排序优化的混合搜索。
- 📆 新近偏向:轻松调整搜索结果的偏向,以防止陈旧内容。
- 🛠️ 可调的基于流行度的排序(商品化):根据流行度、总销量或任何其他任意指标对索引文档进行加权,以实现可调的相关性。
- 🕳️ 过滤:支持日期范围、子字符串匹配、标签、数字和其他类型的过滤器。
- 🧐 重复检测:查看我们的文档,了解 基于冲突的重复检测 方法,了解我们如何处理重复。这是一个您可以开启或关闭的设置。
- 👥 分组:将多个块标记为同一文件的一部分,并在文件级别上搜索,以确保同一顶级结果不会出现两次。
我们的功能是否缺少您的使用场景需要的功能? - 请致电 628-222-4090,创建 Github 问题,或加入 Matrix 社区 告诉我们!我们是一家仍然非常亲力亲为的小公司,渴望构建您所需的功能;我们提供专业服务。
路线图
我们接下来一段时间的两个首要任务如下。可能会根据当前或潜在客户的需求而更改。
- 可观察性和指标(可能会与 Clickhouse 相关)
- 基准测试(目标是 1M、10M 和 100M 向量基准)
- SDK(可以从 OpenAPI 规范生成,但我们希望进一步测试)
如何贡献
- 在 问题标签 中找到您想要解决的问题。
- Fork 仓库并将其克隆到您的本地计算机。
- 使用描述性名称创建一个新分支:
git checkout -b your-branch-name
。 - 在您的 fork 分支上通过添加或删除代码解决该问题。
- 在本地测试您的更改以确保它们不会破坏任何东西。
- 使用描述性提交信息提交您的更改:
git commit -m "Add descriptive commit message here"
。 - 将您的更改推送到您的 fork 仓库:
git push origin your-branch-name
。 - 向主仓库打开一个拉取请求,并在 PR 描述中描述您的更改。
自托管 API 和 UI
我们有一份完整的自托管指南,可以在我们的 文档页面 上找到。
使用 Linux 进行本地开发
安装 apt 包
sudo apt install curl \
gcc \
g++ \
make \
pkg-config \
python3 \
python3-pip \
libpq-dev \
libssl-dev \
openssl
安装 NodeJS 和 Yarn
您可以使用其安装脚本安装 NVM。
curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.5/install.sh | bash
您应该重新启动终端以使用 NVM 更新 bash 配置文件。然后,您可以安装 NodeJS LTS 版本和 Yarn。
nvm install --lts
npm install -g yarn
创建服务器临时目录
mkdir server/tmp
安装 cargo-watch
cargo install cargo-watch
设置环境变量
cp .env.chat ./chat/.env
cp .env.search ./search/.env
cp .env.server ./server/.env
cp .env.dashboard ./dashboard/.env
将您的 LLM_API_KEY
添加到 ./server/.env
获取密钥后的步骤
- 打开
./server/.env
文件。