#相似度搜索

vearch - 云原生分布式向量数据库，支持高效相似性搜索

Github开源项目云原生分布式数据库向量搜索Vearch相似度搜索

Vearch是一个提供云原生分布式向量数据库的开源项目，专注于实现嵌入向量的高效相似性搜索。支持混合搜索与标量过滤，具备从百万对象中毫秒级别检索的高性能。同时，Vearch还具备复制和弹性扩展的能力。提供的文档资源包括Restful API、OpenAPI和多语言SDK，适用于构建可视化搜索系统和作为AI内存后端。

usearch - 快速轻量的开源向量搜索引擎

Github开源项目多语言支持向量搜索引擎相似度搜索USearchHNSW算法

USearch是一个开源的单文件相似性搜索引擎,专注于向量和文本搜索。该引擎比FAISS性能提升10倍,支持多种编程语言和平台。USearch提供SIMD优化和自定义度量功能,具有高内存效率,可从磁盘直接查看大型索引。它兼容多种数据库,适用于语义搜索、聚类等场景,为向量搜索提供了灵活高效的解决方案。

autofaiss - 自动构建高效Faiss近邻搜索索引

Github开源项目嵌入向量相似度搜索FaissAutoFaissKNN索引

AutoFaiss是一个开源工具，用于自动创建高效的Faiss近邻搜索索引。该工具根据内存和查询速度限制，自动选择最佳索引参数，以获得最高召回率。AutoFaiss能处理大规模数据集，在有限内存下构建高效索引，实现毫秒级查询。它提供Python API和命令行接口，支持内存和磁盘上的嵌入向量，并可与PySpark集成进行分布式索引构建。

vectra - 基于Node.js的本地向量数据库适用于轻量级AI应用

Github开源项目Node.js向量数据库相似度搜索Vectra本地索引

Vectra是Node.js环境下的本地向量数据库，功能类似Pinecone和Qdrant，但采用本地文件存储方式。该项目主要用于处理小型静态数据集，具备元数据索引和相似度排序查询功能。Vectra特点在于快速加载和迅速查询响应，适合应用于提示工程和少样本学习等AI场景。此外，Vectra支持跨语言操作，可与Python等语言绑定协同工作。

Snapvault - 将截图转化为洞察的AI驱动管理工具

AI工具AI摘要知识管理相似度搜索Snapvault快照

Snapvault是创新AI截图管理工具，将图像转化为可操作洞察。提供AI摘要生成、相似度搜索和智能对话功能，助力高效管理视觉信息。未来将推出标签系统、共享集合和团队协作空间，打造全方位视觉信息管理解决方案。

all-MiniLM-L6-v2-onnx - 高效文本嵌入和相似度搜索的ONNX解决方案

Github开源项目模型ONNXHuggingfaceFastEmbed文本分类sentence-transformers相似度搜索

all-MiniLM-L6-v2模型的ONNX版本是一个用于文本分类和相似度搜索的工具。该模型与Qdrant兼容，支持IDF修饰符，并可通过FastEmbed库进行推理。它能生成文本嵌入向量，适用于多种自然语言处理任务，尤其在需要进行文本相似度比较的场景中表现优异。使用该模型可以简化文本处理流程，提高相关应用的效率。

bge-base-en-v1.5-onnx-Q - BAAI/bge-base-en-v1.5的量化ONNX版本用于文本嵌入和相似度搜索

Github开源项目模型HuggingfaceFastEmbed文本分类嵌入模型相似度搜索BAAI/bge-base-en-v1.5

该项目提供了BAAI/bge-base-en-v1.5模型的量化ONNX版本，专注于文本嵌入和相似度搜索。通过FastEmbed库，用户可以轻松生成文本嵌入并进行相似度计算。量化后的模型在保持原有性能的基础上，显著提升了推理速度和资源效率，适用于需要高效文本处理的各种应用场景。

Splade_PP_en_v1 - ONNX稀疏向量模型助力高性能文本检索

Github开源项目模型ONNXHuggingface文本分类Splade相似度搜索稀疏向量编码

Splade_PP_en_v1是一个文本分类和相似度搜索模型的ONNX实现版本。模型基于FastEmbed框架运行，可将输入文本转换为稀疏向量表示，适用于文本检索和相似度计算。项目支持Python API接口调用，可进行批量文本处理，采用Apache-2.0开源许可证。

gte-large-onnx - ONNX格式文本向量模型实现快速分类与相似度搜索

Github开源项目模型推理模型ONNXHuggingface文本嵌入文本分类相似度搜索

gte-large-onnx是thenlper/gte-large模型的ONNX移植版本，用于文本分类和相似度搜索任务。该模型与FastEmbed框架集成，支持通过API调用生成文本嵌入向量，实现批量文本处理。基于Apache-2.0许可证开源，可用于构建文本相似度检索和文档分类等应用

相关文章

Article Cover

Vearch: 高效智能的AI原生向量数据库

Article Cover

Vectra: 本地化向量数据库解决方案

Article Cover

USearch: 高性能向量搜索与聚类引擎

Article Cover

Vectra: 本地向量数据库的创新应用

Article Cover

AutoFaiss: 自动创建最优Faiss KNN索引

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号