#相似度搜索

vearch - 云原生分布式向量数据库,支持高效相似性搜索
Github开源项目云原生分布式数据库向量搜索Vearch相似度搜索
Vearch是一个提供云原生分布式向量数据库的开源项目,专注于实现嵌入向量的高效相似性搜索。支持混合搜索与标量过滤,具备从百万对象中毫秒级别检索的高性能。同时,Vearch还具备复制和弹性扩展的能力。提供的文档资源包括Restful API、OpenAPI和多语言SDK,适用于构建可视化搜索系统和作为AI内存后端。
usearch - 快速轻量的开源向量搜索引擎
Github开源项目多语言支持向量搜索引擎相似度搜索USearchHNSW算法
USearch是一个开源的单文件相似性搜索引擎,专注于向量和文本搜索。该引擎比FAISS性能提升10倍,支持多种编程语言和平台。USearch提供SIMD优化和自定义度量功能,具有高内存效率,可从磁盘直接查看大型索引。它兼容多种数据库,适用于语义搜索、聚类等场景,为向量搜索提供了灵活高效的解决方案。
autofaiss - 自动构建高效Faiss近邻搜索索引
Github开源项目嵌入向量相似度搜索FaissAutoFaissKNN索引
AutoFaiss是一个开源工具,用于自动创建高效的Faiss近邻搜索索引。该工具根据内存和查询速度限制,自动选择最佳索引参数,以获得最高召回率。AutoFaiss能处理大规模数据集,在有限内存下构建高效索引,实现毫秒级查询。它提供Python API和命令行接口,支持内存和磁盘上的嵌入向量,并可与PySpark集成进行分布式索引构建。
vectra - 基于Node.js的本地向量数据库 适用于轻量级AI应用
Github开源项目Node.js向量数据库相似度搜索Vectra本地索引
Vectra是Node.js环境下的本地向量数据库,功能类似Pinecone和Qdrant,但采用本地文件存储方式。该项目主要用于处理小型静态数据集,具备元数据索引和相似度排序查询功能。Vectra特点在于快速加载和迅速查询响应,适合应用于提示工程和少样本学习等AI场景。此外,Vectra支持跨语言操作,可与Python等语言绑定协同工作。
Snapvault - 将截图转化为洞察的AI驱动管理工具
AI工具AI摘要知识管理相似度搜索Snapvault快照
Snapvault是创新AI截图管理工具,将图像转化为可操作洞察。提供AI摘要生成、相似度搜索和智能对话功能,助力高效管理视觉信息。未来将推出标签系统、共享集合和团队协作空间,打造全方位视觉信息管理解决方案。
all-MiniLM-L6-v2-onnx - 高效文本嵌入和相似度搜索的ONNX解决方案
Github开源项目模型ONNXHuggingfaceFastEmbed文本分类sentence-transformers相似度搜索
all-MiniLM-L6-v2模型的ONNX版本是一个用于文本分类和相似度搜索的工具。该模型与Qdrant兼容,支持IDF修饰符,并可通过FastEmbed库进行推理。它能生成文本嵌入向量,适用于多种自然语言处理任务,尤其在需要进行文本相似度比较的场景中表现优异。使用该模型可以简化文本处理流程,提高相关应用的效率。
bge-base-en-v1.5-onnx-Q - BAAI/bge-base-en-v1.5的量化ONNX版本用于文本嵌入和相似度搜索
Github开源项目模型HuggingfaceFastEmbed文本分类嵌入模型相似度搜索BAAI/bge-base-en-v1.5
该项目提供了BAAI/bge-base-en-v1.5模型的量化ONNX版本,专注于文本嵌入和相似度搜索。通过FastEmbed库,用户可以轻松生成文本嵌入并进行相似度计算。量化后的模型在保持原有性能的基础上,显著提升了推理速度和资源效率,适用于需要高效文本处理的各种应用场景。
Splade_PP_en_v1 - ONNX稀疏向量模型助力高性能文本检索
Github开源项目模型ONNXHuggingface文本分类Splade相似度搜索稀疏向量编码
Splade_PP_en_v1是一个文本分类和相似度搜索模型的ONNX实现版本。模型基于FastEmbed框架运行,可将输入文本转换为稀疏向量表示,适用于文本检索和相似度计算。项目支持Python API接口调用,可进行批量文本处理,采用Apache-2.0开源许可证。
gte-large-onnx - ONNX格式文本向量模型实现快速分类与相似度搜索
Github开源项目模型推理模型ONNXHuggingface文本嵌入文本分类相似度搜索
gte-large-onnx是thenlper/gte-large模型的ONNX移植版本,用于文本分类和相似度搜索任务。该模型与FastEmbed框架集成,支持通过API调用生成文本嵌入向量,实现批量文本处理。基于Apache-2.0许可证开源,可用于构建文本相似度检索和文档分类等应用