#LayoutLM

layoutlm-base-uncased - LayoutLM模型融合文本布局图像信息提升文档AI效能
LayoutLM文本布局Huggingface开源项目模型文档AIGithub文档理解预训练模型
LayoutLM是一种文档AI预训练模型,结合文本、布局和图像信息,提升文档图像理解和信息提取能力。该模型在表单和收据理解等任务中表现优异。LayoutLM-base-uncased版本采用12层结构,768维隐藏层,12个注意力头,共113M参数,经1100万份文档2轮训练。这一模型为文档AI领域带来突破,提高了复杂文档处理效率。
layoutlm-large-uncased - 微软开发的多模态文档理解大型预训练模型
Huggingface模型多模态学习Github预训练模型信息提取开源项目文档理解LayoutLM
LayoutLM-large-uncased是微软开发的大型多模态文档理解预训练模型。该模型融合文本、版面布局和图像信息,在表单和收据理解等文档AI任务中表现出色。模型架构包括24层、1024隐藏单元、16个注意力头,总计3.43亿参数。经过1100万份文档的2轮预训练,LayoutLM为文档图像理解和信息提取任务提供了高效解决方案。
layoutlm-document-qa - LayoutLM文档智能问答模型
模型Github视觉问答开源项目HuggingfaceLayoutLM图像识别自然语言处理文档问答
LayoutLM文档智能问答模型是一个经过SQuAD2.0和DocVQA数据集微调的多模态模型。它能够准确回答发票、合同等各类文档图像中的问题,支持简单的Python代码调用。该模型为文档信息提取和理解提供了高效便捷的解决方案,适用于多种文档处理场景。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号