#文本嵌入

fast_vector_similarity入门学习资料 - 高效向量相似度计算库

2 个月前
Cover of fast_vector_similarity入门学习资料 - 高效向量相似度计算库

fastembed-rs学习资料汇总 - Rust实现的高性能向量嵌入和重排序库

2 个月前
Cover of fastembed-rs学习资料汇总 - Rust实现的高性能向量嵌入和重排序库

CLIP-as-service入门学习资料 - 低延迟高扩展性的图像和文本嵌入服务

2 个月前
Cover of CLIP-as-service入门学习资料 - 低延迟高扩展性的图像和文本嵌入服务

clip-retrieval 学习资料汇总 - 轻松计算CLIP嵌入并构建检索系统

2 个月前
Cover of clip-retrieval 学习资料汇总 - 轻松计算CLIP嵌入并构建检索系统

AnglE 学习资料汇总 - 强大的句子嵌入训练和推理框架

2 个月前
Cover of AnglE 学习资料汇总 - 强大的句子嵌入训练和推理框架

Talk2Arxiv入门指南 - 通过ChatGPT与任何ArXiv论文对话的开源项目

2 个月前
Cover of Talk2Arxiv入门指南 - 通过ChatGPT与任何ArXiv论文对话的开源项目

FastEmbed学习资料汇总 - 快速、准确、轻量级的Python嵌入生成库

2 个月前
Cover of FastEmbed学习资料汇总 - 快速、准确、轻量级的Python嵌入生成库

Luotuo-Text-Embedding: 基于OpenAI API蒸馏的生成式文本嵌入模型

3 个月前
Cover of Luotuo-Text-Embedding: 基于OpenAI API蒸馏的生成式文本嵌入模型

Compel: 提升文本嵌入系统的提示词效果

3 个月前
Cover of Compel: 提升文本嵌入系统的提示词效果

Godot LLM: 为游戏开发引入大语言模型的强大插件

3 个月前
Cover of Godot LLM: 为游戏开发引入大语言模型的强大插件
相关项目
Project Cover

AnglE

AnglE框架可通过多样化的模型策略和损失函数,进行基于BERT和LLM模型的句子嵌入训练和推理,已在众多语义相似度任务中表现卓越。

Project Cover

fastembed

FastEmbed,一个为速度和效率优化的Python库,支持多语言且易于扩展的嵌入式模型生成工具,适用于服务器和GPU环境。简化高效编码,无需依赖庞大的数据下载,适用于多种数据类型和复杂任务,是开发精确嵌入系统的理想工具。

Project Cover

clip-retrieval

clip-retrieval 提供一个建立语义搜索系统的强大工具,使得用户能够迅速实现图像和文本的嵌入计算及索引构建。该项目能在20小时内处理超过1亿的图文嵌入,支持远程查询、数据过滤以及简洁的前端用户界面,适用于学术研究和商业应用。

Project Cover

clip-as-service

CLIP-as-service是一款以神经网络为基础,专注于提供高效且易于扩展的图像和文本嵌入服务。其面向大规模数据处理,支持多种并发请求,适合集成到各种神经网络搜索框架中。这个服务通过简洁的API和自动负载均衡,让用户无需深厚技术背景即可便捷使用。同时,该服务能与Jina和DocArray等神经搜索生态系统紧密结合,助力开发者快速部署多模态和跨模态应用。

Project Cover

fastembed-rs

FastEmbed-rs为基于Rust的高效文本嵌入工具,无需Tokio依赖,支持同步操作。允许使用Hugging Face等多种模型,并通过并行处理实现高效批量嵌入。支持加载自定义.ONNX模型,提供简洁API以快速实现文本嵌入和重排,适合追求高性能文本处理的开发者。

Project Cover

fast_vector_similarity

此库高效计算向量间多种相似度,广泛用于数据分析、机器学习和统计。支持Spearman等级相关系数、Kendall相关系数等多种相似度,提供Python绑定,易于集成。基于Rust开发,采用并行计算和矢量优化,并支持数据采样以提升计算稳健性,兼容现代语言模型生成的高维文本嵌入。

Project Cover

flair

Flair 是一个强大的自然语言处理库,支持命名实体识别、情感分析、词性标注等多种功能,并且支持多种语言。通过简易接口,用户可以轻松使用和整合多种词和文档嵌入,基于 PyTorch 框架进行模型训练和实验。Flair 还对生物医学文本有特殊支持,并提供最新的命名实体识别模型,性能媲美甚至超过当前最优结果。用户可以在 Hugging Face 平台上访问并试用这些模型。

Project Cover

instructor-embedding

INSTRUCTOR是一种指令微调的文本嵌入模型,无需额外训练即可生成定制化的文本嵌入,支持多种任务和领域,覆盖70项不同的嵌入任务,表现卓越。最新更新包括优化的代码结构和硬负样本检查点。用户可以通过本地或Colab轻松安装和使用INSTRUCTOR进行文本分类、信息检索和聚类等任务,并提供详细的安装及使用指南。

Project Cover

talk2arxiv

Talk2Arxiv是一款专为学术论文PDF设计的开源响应式RAG(检索增强生成)系统,利用GROBID进行高效文本提取,并使用Cohere的EmbedV3模型进行精准文本嵌入。该系统不仅能缓存研究论文,减少重复处理,还通过Qdrant进行存储和查询,确保内容的相关性和准确性。前端采用Typescript, ReactJS等技术搭建,后端依赖Flask, Gunicorn实现,为学术研究提供流畅高效的在线阅读体验。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号