Denser Retriever
📝 说明
Denser Retriever 将多种搜索技术结合到一个平台中。它利用 梯度提升(xgboost) 机器学习技术来结合:
- 基于关键词的搜索,专注于获取查询中提到的精确内容。
- 向量数据库,非常适合寻找可能相关的广泛答案。
- 机器学习重新排序器,微调结果以确保最相关的答案排在前列。
我们在 MTEB 数据集上的实验表明,通过 xgboost 模型(表示为 ES+VS+RR_n)结合关键词搜索、向量搜索和重新排序器,可以显著提升向量搜索(VS)的基线。
🚀 特性
Denser Retriever 的初始版本提供以下特性。
- 支持异构检索器,如 关键词搜索、向量搜索 和 ML 模型重新排序
- 利用 xgboost 机器学习技术有效结合异构检索器
- 在 MTEB 检索基准测试中实现 最先进的准确性
- 展示如何使用 Denser Retriever 为 端到端应用程序(如聊天机器人和语义搜索)提供动力
📦 安装
我们建议通过 Anaconda 安装 Python,因为我们收到反馈,在使用 https://www.python.org/downloads/ 提供的安装程序时存在 Numpy 安装问题。我们正在努力提供解决方案。 要安装 Denser Retriever,您可以运行:
Pip
pip install git+https://github.com/denser-org/denser-retriever.git#main
Poetry
poetry add git+https://github.com/denser-org/denser-retriever.git#main
📃 文档
官方文档托管在 retriever.denser.ai 上。 点击这里开始。
👨🏼💻 开发
您可以在本地机器上开始开发 Denser Retriever。
详见 DEVELOPMENT.md。
🛡 许可证
此项目根据 MIT
许可证条款授权。
查看更多详情请参见 LICENSE。
📃 引用
@misc{denser-retriever,
author = {denser-org},
title = {An enterprise-grade AI retriever designed to streamline AI integration into your applications, ensuring cutting-edge accuracy.},
year = {2024},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/denser-org/denser-retriever}}
}