#矢量搜索

lance - 优化机器学习工作流程的高性能列式数据格式
LanceParquet机器学习矢量搜索数据格式Github开源项目
Lance是为机器学习工作流程优化的现代列式数据格式,提供比Parquet快100倍的随机访问性能,支持矢量索引和数据版本控制。兼容pandas、DuckDB、Polars和pyarrow,适用于搜索引擎、大规模机器学习训练以及复杂数据的存储和查询,如机器人数据和大型图像。更多集成支持即将推出。
lancedb - 高效管理与检索嵌入的开源多模态向量数据库
LanceDB矢量搜索嵌入管理多模态数据GPU支持Github开源项目
LanceDB 是一款开源的多模态向量数据库,具备持久存储功能,能够简化嵌入的管理与检索。它支持生产级别的向量搜索,无需管理服务器,可存储、查询和过滤向量、元数据以及多模态数据(包括文本、图片、视频、点云等)。它还支持向量相似性搜索、全文搜索和SQL查询,并提供原生的Python和JavaScript/TypeScript支持,同时实现零拷贝和自动版本管理。LanceDB 与 LangChain、LlamaIndex、Apache-Arrow、Pandas、Polars、DuckDB 等多个生态系统集成。其核心由Rust编写,基于Lance构建,专为高性能机器学习工作负载而设计。
recipes - Weaviate的全面功能和集成解决方案
Weaviate集成矢量搜索生成功能多租户Github开源项目
本库包含多个Weaviate的端到端示例,介绍了向量搜索、混合搜索、生成式搜索、重排、多租户等功能,并展示了与谷歌、AWS、Confluent、Spark、LangChain等技术的集成。欢迎社区用户提出建议并贡献,以不断完善项目。