#余弦相似度

Client-Vector-Search: 革新客户端向量搜索的利器

3 个月前

client-vector-search 搜索库嵌入技术余弦相似度索引创建 Github 开源项目

3 个月前

Vector Storage: 轻量级浏览器向量数据库解决方案

3 个月前

Vector Storage 相似性搜索 OpenAI嵌入余弦相似度 IndexedDB Github 开源项目

3 个月前

相关项目

vector-storage

Vector Storage 是一个高效轻量的向量数据库，通过浏览器的 IndexedDB 存储文档向量。利用 OpenAI 嵌入技术，该工具将文本文档转换为向量，并基于余弦相似度进行相似文档搜索。主要功能包括文档向量存储管理、基于元数据和内容的搜索过滤、自动管理存储大小及使用 LRU 机制。简单易用，适用于需要高效文本检索的场景。

client-vector-search

client-vector-search是一个高效的客户端向量搜索库，支持嵌入、搜索和缓存操作，适用于浏览器和服务器端。该库默认使用transformers进行文档嵌入，计算嵌入间的余弦相似度，支持客户端索引创建和搜索，并具有浏览器缓存功能。相比OpenAI和Pinecone等VectorDB，它具有更快的性能和更高的效率，特别适用于快速处理数百到数千个向量的应用场景。该项目将持续维护和改进，并计划引入HNSW索引等新功能。

bge-large-en-v1.5

该开源项目使用ONNX权重，以在Transformers.js环境下实现模型兼容。通过特征提取管道，用户能够高效计算句子嵌入，实现文本语义分析与快速检索，提升JavaScript环境下的文本处理效率。

halong_embedding

这个模型专注于越南语文本嵌入，利用RAG以提高生产效率，并采用Matryoshka损失来实现嵌入截断，从而加快比较速度。微调于intfloat/multilingual-e5-base模型，该模型适用于语义文本相似性、搜索和文本分类等任务，映射到784维密集向量空间，支持多语种处理。在多个余弦相似度指标中具有卓越表现，如cosine accuracy@10达到0.9687，提供高效的信息检索和分类解决方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com