#文档排序
rank_bm25 - Python实现的BM25文本检索算法库
Github开源项目搜索引擎文本处理BM25文档排序相关性算法
Rank-BM25是一个开源的Python文本检索库,实现了多种BM25算法变体,如Okapi BM25、BM25L和BM25+。该项目提供简洁的API,支持文档索引、评分和排序。用户可自行处理文本预处理,灵活应用于各类检索任务。Rank-BM25适合构建小型搜索引擎或用于信息检索研究,具有易用性和可扩展性。
monot5-large-msmarco - MSMarco文本重排序优化版T5-large模型
Github开源项目模型训练模型数据集HuggingfaceMS MARCO文档排序T5-large
MonoT5-large是一个在MS MARCO数据集上训练的文本重排序模型,主要用于优化搜索结果的排序。模型支持MS MARCO passages和Robust04文档处理,能有效提升文本搜索的准确性,适用于各类文档重排序场景。