#文本嵌入

fast_vector_similarity入门学习资料 - 高效向量相似度计算库

2 个月前

fastembed-rs学习资料汇总 - Rust实现的高性能向量嵌入和重排序库

2 个月前

FastEmbed-rs 文本嵌入 Rust 量化模型 ONNX Github 开源项目

2 个月前

CLIP-as-service入门学习资料 - 低延迟高扩展性的图像和文本嵌入服务

2 个月前

CLIP-as-service 神经搜索图像嵌入文本嵌入多模态解决方案 Github 开源项目

2 个月前

clip-retrieval 学习资料汇总 - 轻松计算CLIP嵌入并构建检索系统

2 个月前

clip-retrieval 语义搜索图像嵌入文本嵌入机器学习 Github 开源项目

2 个月前

AnglE 学习资料汇总 - 强大的句子嵌入训练和推理框架

2 个月前

长句模型 Github 开源项目 AnglE 文本嵌入语义文本相似性 BERT

2 个月前

Talk2Arxiv入门指南 - 通过ChatGPT与任何ArXiv论文对话的开源项目

2 个月前

Talk2Arxiv PDF解析文本嵌入向量数据库集成 GROBID Github 开源项目

2 个月前

FastEmbed学习资料汇总 - 快速、准确、轻量级的Python嵌入生成库

2 个月前

FastEmbed 文本嵌入 Qdrant ONNX Runtime 多语言模型 Github 开源项目

2 个月前

Luotuo-Text-Embedding: 基于OpenAI API蒸馏的生成式文本嵌入模型

3 个月前

Luotuo Embedding 文本嵌入 BERT OpenAI 骆驼 Github 开源项目

3 个月前

Compel: 提升文本嵌入系统的提示词效果

3 个月前

Compel 文本嵌入提示词权重 Stable Diffusion 关键词混合 Github 开源项目

3 个月前

Godot LLM: 为游戏开发引入大语言模型的强大插件

3 个月前

Godot LLM 大语言模型文本生成文本嵌入向量数据库 Github 开源项目

3 个月前

相关项目

AnglE

AnglE框架可通过多样化的模型策略和损失函数，进行基于BERT和LLM模型的句子嵌入训练和推理，已在众多语义相似度任务中表现卓越。

fastembed

FastEmbed，一个为速度和效率优化的Python库，支持多语言且易于扩展的嵌入式模型生成工具，适用于服务器和GPU环境。简化高效编码，无需依赖庞大的数据下载，适用于多种数据类型和复杂任务，是开发精确嵌入系统的理想工具。

clip-retrieval

clip-retrieval 提供一个建立语义搜索系统的强大工具，使得用户能够迅速实现图像和文本的嵌入计算及索引构建。该项目能在20小时内处理超过1亿的图文嵌入，支持远程查询、数据过滤以及简洁的前端用户界面，适用于学术研究和商业应用。

clip-as-service

CLIP-as-service是一款以神经网络为基础，专注于提供高效且易于扩展的图像和文本嵌入服务。其面向大规模数据处理，支持多种并发请求，适合集成到各种神经网络搜索框架中。这个服务通过简洁的API和自动负载均衡，让用户无需深厚技术背景即可便捷使用。同时，该服务能与Jina和DocArray等神经搜索生态系统紧密结合，助力开发者快速部署多模态和跨模态应用。

fastembed-rs

FastEmbed-rs为基于Rust的高效文本嵌入工具，无需Tokio依赖，支持同步操作。允许使用Hugging Face等多种模型，并通过并行处理实现高效批量嵌入。支持加载自定义.ONNX模型，提供简洁API以快速实现文本嵌入和重排，适合追求高性能文本处理的开发者。

fast_vector_similarity

此库高效计算向量间多种相似度，广泛用于数据分析、机器学习和统计。支持Spearman等级相关系数、Kendall相关系数等多种相似度，提供Python绑定，易于集成。基于Rust开发，采用并行计算和矢量优化，并支持数据采样以提升计算稳健性，兼容现代语言模型生成的高维文本嵌入。

flair

Flair 是一个强大的自然语言处理库，支持命名实体识别、情感分析、词性标注等多种功能，并且支持多种语言。通过简易接口，用户可以轻松使用和整合多种词和文档嵌入，基于 PyTorch 框架进行模型训练和实验。Flair 还对生物医学文本有特殊支持，并提供最新的命名实体识别模型，性能媲美甚至超过当前最优结果。用户可以在 Hugging Face 平台上访问并试用这些模型。

instructor-embedding

INSTRUCTOR是一种指令微调的文本嵌入模型，无需额外训练即可生成定制化的文本嵌入，支持多种任务和领域，覆盖70项不同的嵌入任务，表现卓越。最新更新包括优化的代码结构和硬负样本检查点。用户可以通过本地或Colab轻松安装和使用INSTRUCTOR进行文本分类、信息检索和聚类等任务，并提供详细的安装及使用指南。

talk2arxiv

Talk2Arxiv是一款专为学术论文PDF设计的开源响应式RAG（检索增强生成）系统，利用GROBID进行高效文本提取，并使用Cohere的EmbedV3模型进行精准文本嵌入。该系统不仅能缓存研究论文，减少重复处理，还通过Qdrant进行存储和查询，确保内容的相关性和准确性。前端采用Typescript, ReactJS等技术搭建，后端依赖Flask, Gunicorn实现，为学术研究提供流畅高效的在线阅读体验。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com