#Pyserini
pyserini - Python信息检索工具包 支持多种检索模型
Pyserini信息检索搜索工具索引构建实验复现Github开源项目
Pyserini是一个Python信息检索工具包,支持稀疏和密集表示检索。该工具包集成了Anserini和Faiss库,可用于多阶段排序的首轮检索。Pyserini提供预构建索引、查询、评估脚本等功能,方便在标准IR测试集上复现实验。它支持传统词法模型、学习型稀疏检索模型、密集检索模型及混合检索模型,并有详细的使用指南。
tct_colbert-v2-hnp-msmarco - TCT-ColBERT-V2 模型的变体再现与知识蒸馏整合
知识蒸馏密集检索PyseriniHuggingface否定样本Github开源项目模型TCT-ColBERT-V2
该项目旨在再现 TCT-ColBERT-V2 的变体,通过知识蒸馏与批内负例实现高效密集检索。详细的实验报告已发布在 Pyserini 上,为研究人员提供再现过程和结果分析。