Project Icon

pubmed-rct

大规模医学摘要句子分类数据集

PubMed 200k RCT是一个包含约20万篇随机对照试验摘要的数据集,共230万个句子。这些句子被标注为背景、目标、方法、结果或结论五种角色。该数据集为医学文献中的连续句子分类提供了资源,有助于开发更准确的短文本分类算法,同时为研究人员提供了高效浏览文献的工具。PubMed 200k RCT的发布将促进自然语言处理在医学领域的应用。

BiomedCLIP-PubMedBERT_256-vit_base_patch16_224 - 基于PubMedBERT的生物医学视觉语言基础模型
BiomedCLIPGithubHuggingfacePubMedBERT图像分类开源项目模型生物医学视觉语言处理
BiomedCLIP是一个生物医学视觉语言基础模型,集成了PubMedBERT和Vision Transformer技术。该模型通过1500万医学图像-文本对的预训练,能够执行跨模态检索和图像分类等任务。在多个标准数据集上,BiomedCLIP显著提升了性能基准。这一模型为生物医学视觉语言处理研究奠定了坚实基础,在放射学等领域具有广泛应用前景。
CRUD_RAG - 全面评估中文检索增强生成系统的基准测试
CRUD-RAGGithub中文基准测试大语言模型开源项目检索增强生成评估系统
CRUD_RAG是一个全面的中文检索增强生成(RAG)系统评估基准。该项目包含36166个测试样本,覆盖CRUD操作,支持多种评估指标。CRUD_RAG提供原生中文数据集、评估任务和基线模型,并具备一键式评估功能。这一工具可助力研究人员和开发者全面评估和优化中文RAG系统性能,推动中文自然语言处理技术的进步。
MedTrinity-25M - 多粒度标注医学数据集推动医疗AI进步
GithubMedTrinity-25M医学数据集多模态多粒度标注大规模开源项目
MedTrinity-25M是一个大规模医学多模态数据集,包含2500万条多粒度标注。该数据集整合了医学图像和文本信息,采用创新处理流程和先进语言模型生成精细描述。它显著提升了医学视觉问答性能,为医疗AI发展提供重要资源。项目还开源了相关模型和代码,推动医学AI领域的开放协作。
WellcomeBertMesh - 基于PubMedBERT的生物医学文献主题分类模型
GithubHuggingfacePubMedBert医学分类开源项目文本分析机器学习模型生物医学
WellcomeBertMesh是一款由WellcomeTrust开发的生物医学文本分类模型,基于最新的PubMedBERT架构,专门用于为生物医学文献和研究基金分配MeSH主题标签。该模型采用多标签注意力机制,在2.2百万篇PubMed文献上训练,实现了63%的微观F1分数。该模型可应用于研究基金申请审核和生物医学文献分类等领域的主题标注工作。
bluebert_pubmed_mimic_uncased_L-12_H-768_A-12 - 基于PubMed和MIMIC-III数据的BlueBERT医学自然语言处理模型
BERTBlueBertGithubHuggingface临床笔记医学文本开源项目模型自然语言处理
BlueBERT是一个经过PubMed文献摘要和MIMIC-III临床笔记预训练的BERT模型,适用于医学自然语言处理。它使用NLTK进行文本预处理,提高了对医学文本的理解能力,是临床研究和医学信息检索的有效工具。
meditron-7b - 在医学领域提升大型语言模型性能的创新方法
GPT预训练GithubHuggingfaceLlama-2Meditron医学大语言模型开源项目模型
Meditron-7B是开源的医学大型语言模型,通过持久的预训练,结合选定的PubMed文献和国际医学指南数据,提高了医疗推理任务的能力。该模型在文本生成和医疗问答方面显示了潜力,但实际使用需经过更多测试和适应调整。
biomedical - 生物医学数据集库促进机器学习研究
BigBIOGithub开源项目数据标准化机器学习生物医学数据集自然语言处理
BigBIO是一个基于Huggingface datasets库开发的生物医学数据加载器库。该项目提供超过126个生物医学数据集的轻量级访问,覆盖10余种语言和12个任务类别。BigBIO致力于提高数据处理的可重复性,完善数据集来源和许可等属性的文档,并简化自然语言提示和多任务学习的元数据集生成。此外,BigBIO还支持多个主流英语生物医学基准测试中的大部分数据集。
meditron - 医疗大语言模型助力临床决策支持
GithubLlama-2Meditron医学推理医疗大语言模型开源开源项目
Meditron是一套开源医疗大语言模型,包含7B和70B两个版本。这些模型基于Llama-2,通过在医学语料库上持续预训练而来。Meditron-70B在医学推理任务中的表现超越了Llama-2-70B、GPT-3.5和Flan-PaLM。虽然Meditron旨在提升临床决策支持,但在实际医疗应用中仍需谨慎,并进行充分的测试和临床试验。
MedCAT - 从电子健康记录中提取信息并链接到生物医学术语库
GithubMedCATSNOMED-CTUMLS开源项目生物医学本体论电子健康记录
MedCAT是一款用于从电子健康记录(EHR)中提取信息并将其链接到生物医学术语库(如SNOMED-CT和UMLS)的工具。它支持多个模型,包括UMLS小型模型、完整的SNOMED国际模型和荷兰UMLS模型等。用户可以通过UMLS用户认证下载最新的模型包。项目持续更新,新增功能包括医疗文本否定检测和患者时间线深度生成建模。此外,还发布了多篇相关研究论文。安装简单,可选择支持GPU或CPU。
pubmed_parser - Python解析库:PubMed和MEDLINE XML数据
GithubPubmed ParserPython库XML解析医药数据开源项目自然语言处理
Pubmed Parser是一个Python库,用于解析PubMed开放获取(OA)子集和MEDLINE XML数据集。该库使用lxml库将信息转换为Python字典,适用于文本挖掘和自然语言处理。功能涵盖文章信息、参考文献、图片说明、段落、表格及资助信息的解析。更多详情和应用实例,请参考API和文档。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号