#MS Marco
msmarco-MiniLM-L12-en-de-v1 - 基于MS MARCO的英德双语文本重排序模型
Github开源项目自然语言处理模型Huggingface信息检索MS Marco跨语言检索模型德英翻译
基于MS MARCO数据集开发的英德双语跨编码器模型,主要用于文本段落重排序。模型在TREC-DL19评测中NDCG@10分别达到72.94(英-英)和66.07(德-英),在GermanDPR数据集上MRR@10为49.91。支持SentenceTransformers和Transformers框架,处理速度为900对文档/秒,适用于跨语言信息检索场景。
ms-marco-TinyBERT-L-6 - 跨编码器在信息检索与重排序中的应用
Github开源项目模型Huggingface信息检索模型性能Cross-EncoderMS MarcoSentenceTransformers
TinyBERT-L-6模型在MS Marco Passage Ranking任务中进行了优化,解决信息检索中的查询与段落排序问题。该模型通过交叉编码器实现高效的信息检索,提升查准率并缩短排序时间。支持Transformers与SentenceTransformers工具使用,简化实现流程,展示良好性能。项目提供详尽的训练代码和性能评估,助力深度学习场景下的信息处理任务优化。