#科学文献

Darwin - 材料科学、化学和物理领域的LLaMA模型

Github开源项目LLaMA开放源代码DarwinAI带动科学研究科学文献

Darwin是一个开源项目，致力于在科学文献和数据集上预训练和微调LLaMA模型，特别针对材料科学、化学和物理领域。Darwin整合了结构化和非结构化的科学知识，提升了语言模型在科学研究中的效率。基于7B LLaMA模型，Darwin在实验带隙预测和金属分类任务中表现优异，超过了Fine-tuned GPT3.5和专用机器学习模型。尽管仍在开发中，Darwin在解决科学问题方面已展现出巨大潜力。

grobid - 基于机器学习的高效文献数据解析工具

Github开源项目机器学习Deep LearningGROBID科学文献PDF处理

GROBID 是一个将PDF等原始文档转换为结构化XML/TEI编码文档的机器学习库，专为技术和科学出版物设计。功能包括文献标题和参考文献的提取、全文结构化以及PDF坐标解析等。提供丰富的Web服务API、Docker镜像和批处理能力，适用于高效大规模的文献处理，适合生产环境。其深度学习模型显著提升解析精度，并已被众多科研机构和平台采用，支持Linux和macOS操作系统。

Semantic Scholar - 智能科研文献搜索与分析平台

APIAI工具科学文献AI研究工具Semantic ScholarSemantic Reader

Semantic Scholar是一款免费的科研文献搜索和分析平台，由先进的人工智能技术驱动。它通过语义分析理解科学文献，帮助学者快速发现相关研究。平台收录超2.2亿篇跨学科论文，提供语义阅读器和开放API。Semantic Scholar致力于通过丰富的上下文信息，让科研阅读更便捷、更深入，为研究人员提供强大的文献发现和分析支持。

specter2_base - 科学文献嵌入模型支持多任务适配

Github开源项目自然语言处理语义搜索模型Huggingface科学文献嵌入向量SPECTER2

SPECTER2是一个生成科学文献嵌入的开源模型。它基于600万篇论文引用关系训练，通过适配器支持分类、回归、近似检索和即时搜索等任务。该模型在SciRepEval和MDCR等基准测试中表现出色，为文献检索、分类和推荐等应用提供高质量的文献表示。

相关文章

Article Cover

Darwin项目：自然科学领域的开源大语言模型

Article Cover

GROBID: 一款强大的学术文献信息提取工具

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号