#文档AI
deepdoctection - 文档AI:基于深度学习的提取与布局分析工具包
deepdoctection文档AI深度学习OCR模型Github开源项目
deepdoctection是一个Python库,通过深度学习模型实现文档提取和布局分析,支持对象检测、OCR和文本挖掘。此集成框架结合Tensorflow或PyTorch等库,适用于PDF或扫描图片文档处理,支持文档布局分析、表格识别和文本分类等任务,致力于解决实际应用问题,是文档处理领域开发者的理想选择。
layoutlmv2-large-uncased - 提升多模态文档处理能力的先进预训练模型
开源项目模型GithubLayoutLMv2Huggingface文档AI多模态图像理解预训练
LayoutLMv2通过整合文本、布局和图像的新预训练任务,增强文档理解能力,广泛应用于FUNSD、CORD等视觉丰富文档项目,提高性能,适合多种下游任务。
layoutxlm-base - 跨语言文档智能分析的多模态预训练技术
跨语言理解文档AILayoutXLM视觉文档理解多模态预训练HuggingfaceGithub开源项目模型
LayoutXLM作为LayoutLMv2的语言扩展版本,整合文本、布局和图像信息,实现文档智能处理。这个预训练模型专注于解决视觉文档理解中的语言障碍,经XFUND数据集测试,在跨语言文档处理任务中展现出优异性能。
markuplm-base - 结合文本与标记语言的文档理解预训练模型
Github模型MarkupLM文档AI信息提取开源项目网页问答Huggingface多模态预训练
MarkupLM是一个文本和标记语言的多模态预训练模型,主要应用于网页问答和信息提取等文档理解任务。通过简单高效的预训练方法,该模型在多个文档理解数据集上取得了领先成果,为文档智能处理提供了新的技术方案。