相关项目
Chinese-Word-Vectors
该项目集成了多种中文词向量模型,涵盖稠密和稀疏表示方法,以及词、n-gram、字符等上下文特征。同时提供中文类比推理数据集CA8和评估工具包,便于模型质量评估。这些预训练资源可应用于多种自然语言处理任务,为相关研究和开发工作提供了有力支持。
SapBERT-from-PubMedBERT-fulltext-mean-token
SapBERT是基于PubMedBERT开发的生物医学预训练模型,采用自对齐技术优化实体语义表示。该模型在医学实体链接任务中表现卓越,创下多项基准测试新纪录。它能有效捕捉精细语义关系,为实体链接等任务提供强大支持。研究人员可通过简单的代码实现实体嵌入提取,便于进行生物医学文本分析。