#LayoutLMv3
layoutlmv3-large - 统一文本和图像掩码的文档AI预训练模型
模型开源项目多模态模型文档AI预训练HuggingfaceTransformerGithubLayoutLMv3
LayoutLMv3是一种用于文档AI的多模态Transformer模型,由Microsoft Document AI项目开发。该模型采用统一的文本和图像掩码预训练方法,架构简单且通用。LayoutLMv3可应用于表单理解、收据识别、文档视觉问答等文本相关任务,以及文档图像分类和布局分析等图像相关任务。这种灵活性使其成为文档AI领域的通用预训练模型,为多种文档处理任务提供了有力支持。
layoutlmv3-base - 多模态文档AI预训练模型
文本图像掩码HuggingfaceDocument AI模型Github开源项目多模态预训练LayoutLMv3文档人工智能
LayoutLMv3是一款文档AI预训练模型,采用统一的文本和图像掩码方法。该模型架构简单,训练目标明确,适用于多种文档AI任务。通过微调,LayoutLMv3可用于表单理解、收据识别、文档问答等文本相关任务,以及文档图像分类、文档布局分析等图像相关任务。作为通用预训练模型,LayoutLMv3在文档AI领域的多项任务中表现出色。