热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#MinerU
MinerU - 开源工具实现PDF到机器可读格式的高效转换
MinerU
PDF处理
文本提取
机器学习
开源工具
Github
开源项目
MinerU是一个开源的PDF转换工具,专注于科研文献处理。它能将PDF转换为markdown和JSON等机器可读格式,同时保留原文档结构和语义连贯性。该工具支持移除页眉页脚,处理多列布局,提取图像和表格,以及将公式转换为LaTeX格式。MinerU兼容多种操作系统和硬件环境,可在CPU或GPU上运行,为大规模语言模型的发展提供数据支持。
1
1
相关文章
MinerU:一站式开源高质量数据提取工具
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号