#MS MARCO数据集
msmarco-bert-base-dot-v5 - BERT语义搜索模型 用于高效文本编码和相似度计算
模型BERTGithub开源项目HuggingfaceMS MARCO数据集嵌入向量sentence-transformers语义搜索
msmarco-bert-base-dot-v5是一个语义搜索模型,基于sentence-transformers框架开发。该模型将文本映射到768维向量空间,在MS MARCO数据集上训练而成。它能高效进行文本编码和相似度计算,支持通过sentence-transformers或HuggingFace Transformers库集成使用。这个模型适用于语义搜索等多种自然语言处理任务,为开发者提供了便捷的文本分析工具。
opensearch-neural-sparse-encoding-v1 - 跨平台高效搜索的稀疏检索模型
Lucene倒排索引稀疏检索HuggingfaceMS MARCO数据集Github开源项目OpenSearch模型查询扩展
此开源项目展示了一个学习型稀疏检索模型,通过将查询和文档编码为稀疏向量,提供高效的搜索解决方案。模型在MS MARCO数据集上进行训练,并在BEIR基准测试中展示了优良的搜索相关性与推理速度。支持OpenSearch神经稀疏功能,能与Lucene倒排索引结合,进行高效的索引与搜索。该项目提供多个模型版本,适应不同的数据集与应用需求。使用者能在OpenSearch集群内或通过HuggingFace模型API进行模型的外部运行。