热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#BERT_Dot
distilbert-dot-tas_b-b256-msmarco - 基于平衡主题感知采样的高效密集检索方案
知识蒸馏
文本检索
DistilBert
开源项目
模型
Huggingface
MSMARCO
Github
BERT_Dot
本项目提供了一个基于DistilBERT的密集文本检索模型,采用双编码器结构和点积评分机制。该模型使用平衡主题感知采样(TAS-B)方法在MS MARCO数据集上训练,可用于候选集重排序或直接进行向量索引密集检索。模型在多个测试集上展现出优于BM25基线的检索性能。其特点包括高效训练(单GPU 48小时内完成)和保留原始DistilBERT的6层架构。这一方案为高效密集检索提供了新的解决思路。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号