项目介绍:Denser Retriever
Denser Retriever 是一个企业级人工智能检索系统,旨在简化人工智能在应用程序中的集成,确保达到最前沿的准确性。该项目通过结合多种搜索技术,为用户提供更全面和高效的搜索体验。
项目描述
Denser Retriever 将多个搜索技术集成到一个平台中,利用 梯度提升(xgboost) 机器学习技术来组合:
- 关键词搜索,专注于准确获取查询中提到的内容。
- 向量数据库,适合查找广泛的潜在相关答案。
- 机器学习重排序器,微调结果,确保最相关的答案位于列表顶部。
根据我们在 MTEB 数据集上的实验显示,通过关键词搜索、向量搜索和使用 xgboost 模型的重排序器(ES+VS+RR_n)的组合,可以显著提升向量搜索(VS)的基线效果。
项目功能
Denser Retriever 的初始版本提供以下功能:
- 支持异构检索器,例如 关键词搜索、向量搜索 和 机器学习模型重排序。
- 利用 xgboost 机器学习技术有效整合异构检索器。
- 在 MTEB 检索基准测试中表现出 最先进的准确性。
- 展示如何利用 Denser Retriever 支持如聊天机器人和语义搜索的 端到端应用程序。
安装指南
建议通过 Anaconda 安装 Python,因为直接使用 python.org 的安装程序可能会遇到 Numpy 安装问题,我们正在努力解决这一问题。要安装 Denser Retriever,可以运行以下命令:
使用 Pip
pip install git+https://github.com/denser-org/denser-retriever.git#main
使用 Poetry
poetry add git+https://github.com/denser-org/denser-retriever.git#main
开发信息
用户可以在本地机器上开始开发 Denser Retriever。更多详细信息可以参见 DEVELOPMENT.md。
许可证
Denser Retriever 项目根据 MIT
许可证条款进行许可。有关详情,请查看 LICENSE 文件。
这就是对 Denser Retriever 项目的详细介绍。它作为一款企业级 AI 检索工具,通过结合多种技术特点,为用户提供了高效、准确的搜索方案,旨在推动人工智能的广泛应用。