热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#MinerU
MinerU:一站式开源高质量数据提取工具
2 个月前
MinerU是一个强大的开源工具,专门用于从PDF、网页和电子书中提取高质量数据。它为用户提供了一个一站式的解决方案,简化了复杂文档的数据提取过程。
MinerU
PDF处理
文本提取
机器学习
开源工具
Github
开源项目
2 个月前
相关项目
MinerU
MinerU是一个开源的PDF转换工具,专注于科研文献处理。它能将PDF转换为markdown和JSON等机器可读格式,同时保留原文档结构和语义连贯性。该工具支持移除页眉页脚,处理多列布局,提取图像和表格,以及将公式转换为LaTeX格式。MinerU兼容多种操作系统和硬件环境,可在CPU或GPU上运行,为大规模语言模型的发展提供数据支持。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号