项目介绍:Infinity
项目概述
Infinity 是一款前沿的 AI 原生数据库,专门为大语言模型(LLM)应用而设计。它能够提供极其快速的混合搜索,支持密集向量、稀疏向量、张量以及全文搜索。这种多功能性使其成为搜索、推荐系统、问答系统、对话 AI、智能助手、内容生成等多种 RAG(检索增强生成)应用的理想选择。
性能表现
Infinity 因其卓越的性能而著称:
- 在百万级别的向量数据集上,实现了0.1毫秒的查询延迟和每秒15000+次查询。
- 在3300万文档的全文搜索中,达到了1毫秒的延迟和每秒12000+次查询。
如需详细性能指标,请参阅基准测试报告。
主要特性
极快的搜索速度
Infinity 提供了超快的搜索能力,确保在密集嵌入、稀疏嵌入、张量和全文搜索中都能高效运行。此外,支持多种重排序算法如 RRF、加权总和和 ColBERT。
丰富的数据类型
它支持多种数据类型,包括字符串、数值类型、向量等,以满足不同应用场景的需求。
易用性
Infinity 提供了直观的 Python API,并采用单二进制结构无依赖设计,极大简化了部署过程。对 AI 开发者极为友好,可嵌入 Python 作为模块使用。
快速开始
Infinity 支持嵌入模式和客户端-服务器模式,开发者可以根据需求选择合适的使用方式。
嵌入模式
在嵌入模式下,开发者可以轻松将 Infinity 集成到 Python 应用中,避免与后端服务器连接。以下是快速入门的简单步骤:
pip install infinity-embedded-sdk==0.5.0.dev2
示例代码展示了如何在嵌入模式下进行密集向量搜索。
部署客户端-服务器模式
如希望以服务端和客户端独立进程的方式部署 Infinity,请参阅部署指南。
从源码构建
参阅源码构建指南。
文档资源
发展规划
请查看 Infinity 2024年发展规划。
社区交流
Infinity 项目不断创新,以满足新一代 AI 应用的需求。用户和开发者可以通过多种途径参与社区,与开发团队互动,推动项目进步。无论是对于复杂的 AI 应用,还是日常数据处理,Infinity 都是一个强大且灵活的解决方案。