#Jina AI
reader - LLM输入优化与网络搜索工具
ReaderJina AIURL转换网络搜索免费APIGithub开源项目
Reader 提供读取和搜索功能,将任意URL转换为LLM友好的输入,提升代理和RAG系统的输出质量。同时,搜索功能使LLM获取最新的网络知识。该工具免费、稳定、可扩展,适合生产环境使用。
vectordb - 精简而强大的Python向量数据库,支持本地、内部和云端部署,全面支持CRUD操作
VectorDBJina AIDocArrayPythongRPCGithub开源项目
`vectordb` 是一款轻量级的Python向量数据库,支持本地、内部和云端部署。它具有全面的CRUD操作和扩展选项,包括分片和复制,可适应各种环境。结合DocArray的检索能力和Jina的扩展性能,vectordb提供了简洁而强大的用户体验。同时,它支持gRPC、HTTP和WebSocket等通信协议,能在多种场景中灵活应用,极大地方便了开发人员。
jina-clip-v1 - 集成文本图像检索与文本相似度分析的多模态嵌入模型
文本检索Huggingface模型GithubJina AI开源项目多模态嵌入图像检索CLIP
jina-clip-v1是Jina AI开发的英语多模态嵌入模型,支持高效文本-图像和文本-文本检索。它结合了传统文本嵌入和跨模态模型的优势,适用于多模态检索增强生成应用。该模型在Flickr和MSCOCO跨模态检索任务中表现出色,文本相似度评估能力也与专业文本嵌入模型相当。
jina-reranker-v1-tiny-en - 快速文本重排序解决方案,支持最长8192个token处理
reranker模型GithubALiBi知识蒸馏文本分类Jina AIHuggingface开源项目
jina-reranker-v1-tiny-en在JinaBERT模型基础上通过知识蒸馏技术实现高效文本重排序,支持最长8192个token的处理,适用于高速度需求场景,并确保结果的准确性。提供多种接入方式,包括Jina AI Reranker API、sentence-transformers库及transformers.js等。该模型表现优异,确保搜索结果的相关性和准确性。
jina-reranker-v1-turbo-en - 高速文本重排序方案,专为长文本和搜索优化设计
Github模型jina-reranker-v1-turbo-en知识蒸馏开源项目Jina AI文本重排HuggingfaceBERT架构
jina-reranker-v1-turbo-en使用JinaBERT,旨在实现快捷的文本重排序,可处理最多8,192个标记的长文本。通过知识蒸馏提升运行速度,同时确保高精度。6层结构和37.8百万参数设置使其成为神经搜索的有效工具。尽管其NDCG@10评分略低于旧版本,但因速度优势适合快速处理需求。模型对于多种环境可通过Jina AI Reranker API或transformers库轻松集成和使用。
相关文章