pubmed-rct
PubMed 200k RCT是一个包含约20万篇随机对照试验摘要的数据集,共230万个句子。这些句子被标注为背景、目标、方法、结果或结论五种角色。该数据集为医学文献中的连续句子分类提供了资源,有助于开发更准确的短文本分类算法,同时为研究人员提供了高效浏览文献的工具。PubMed 200k RCT的发布将促进自然语言处理在医学领域的应用。