#文档AI

deepdoctection - 文档AI：基于深度学习的提取与布局分析工具包

deepdoctection文档AI深度学习OCR模型Github开源项目

deepdoctection是一个Python库，通过深度学习模型实现文档提取和布局分析，支持对象检测、OCR和文本挖掘。此集成框架结合Tensorflow或PyTorch等库，适用于PDF或扫描图片文档处理，支持文档布局分析、表格识别和文本分类等任务，致力于解决实际应用问题，是文档处理领域开发者的理想选择。

layoutlmv2-large-uncased - 提升多模态文档处理能力的先进预训练模型

开源项目模型GithubLayoutLMv2Huggingface文档AI多模态图像理解预训练

LayoutLMv2通过整合文本、布局和图像的新预训练任务，增强文档理解能力，广泛应用于FUNSD、CORD等视觉丰富文档项目，提高性能，适合多种下游任务。

layoutxlm-base - 跨语言文档智能分析的多模态预训练技术

跨语言理解文档AILayoutXLM视觉文档理解多模态预训练HuggingfaceGithub开源项目模型

LayoutXLM作为LayoutLMv2的语言扩展版本，整合文本、布局和图像信息，实现文档智能处理。这个预训练模型专注于解决视觉文档理解中的语言障碍，经XFUND数据集测试，在跨语言文档处理任务中展现出优异性能。

markuplm-base - 结合文本与标记语言的文档理解预训练模型

Github模型MarkupLM文档AI信息提取开源项目网页问答Huggingface多模态预训练

MarkupLM是一个文本和标记语言的多模态预训练模型，主要应用于网页问答和信息提取等文档理解任务。通过简单高效的预训练方法，该模型在多个文档理解数据集上取得了领先成果，为文档智能处理提供了新的技术方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号