#LayoutLM

layoutlm-base-uncased - LayoutLM模型融合文本布局图像信息提升文档AI效能

LayoutLM文本布局Huggingface开源项目模型文档AIGithub文档理解预训练模型

LayoutLM是一种文档AI预训练模型，结合文本、布局和图像信息，提升文档图像理解和信息提取能力。该模型在表单和收据理解等任务中表现优异。LayoutLM-base-uncased版本采用12层结构，768维隐藏层，12个注意力头，共113M参数，经1100万份文档2轮训练。这一模型为文档AI领域带来突破，提高了复杂文档处理效率。

layoutlm-large-uncased - 微软开发的多模态文档理解大型预训练模型

Huggingface模型多模态学习Github预训练模型信息提取开源项目文档理解LayoutLM

LayoutLM-large-uncased是微软开发的大型多模态文档理解预训练模型。该模型融合文本、版面布局和图像信息，在表单和收据理解等文档AI任务中表现出色。模型架构包括24层、1024隐藏单元、16个注意力头，总计3.43亿参数。经过1100万份文档的2轮预训练，LayoutLM为文档图像理解和信息提取任务提供了高效解决方案。

layoutlm-document-qa - LayoutLM文档智能问答模型

模型Github视觉问答开源项目HuggingfaceLayoutLM图像识别自然语言处理文档问答

LayoutLM文档智能问答模型是一个经过SQuAD2.0和DocVQA数据集微调的多模态模型。它能够准确回答发票、合同等各类文档图像中的问题，支持简单的Python代码调用。该模型为文档信息提取和理解提供了高效便捷的解决方案，适用于多种文档处理场景。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号