#表格识别

PaddleOCR - 领先的OCR工具库，支持多语言和多硬件平台

Github开源项目模型训练PaddleOCROCR文本识别表格识别热门

PaddleOCR旨在为开发者提供一套丰富、领先且实用的OCR工具库，帮助开发者快速训练并部署OCR模型。它不仅支持中英文识别，还支持多语言和多硬件平台，包括最新的PP-OCRv4模型，有效提高了中英文场景下的识别精确度。适用于移动端和服务器端，适配多种开发需求。

Pix2Text - 开源Python工具，支持高精度数学公式检测和80多种语言的文本识别

Github开源项目开源OCR表格识别Pix2Text数学公式检测

Pix2Text是一款免费开源的Python工具，主要功能与Mathpix类似，能够将复杂布局的图像、表格、文本和数学公式转换为Markdown格式。它支持超过80种语言的文本识别，包括简体中文、繁体中文、英语和越南语。最新的V1.1.1版本引入了新的数学公式检测模型，大幅提升了识别准确性。用户也可以通过在线服务和演示来体验其强大功能。

PDF-Extract-Kit - 全面高效的PDF文档内容提取工具包

Github开源项目表格识别PDF提取文档内容布局检测公式识别

PDF-Extract-Kit是一款集成多种先进技术的PDF内容提取工具包。它结合了LayoutLMv3布局分析、YOLOv8公式检测、UniMERNet公式识别、StructEqTable表格识别和PaddleOCR文字识别等功能,能够准确高效地提取各类PDF文档中的结构化内容。该工具适用于学术论文、教科书、研究报告和财务报表等多种文档类型,即使面对扫描质量欠佳或带有水印的PDF文件,也能保持稳定的提取效果。

TF-ID - 开源AI模型助力学术论文表格和图像高效提取

Github开源项目表格识别学术论文图像识别对象检测TF-ID

TF-ID是一系列用于从学术论文中提取表格和图像的目标检测模型。项目开源了训练代码、模型权重和标注数据集。TF-ID包含四个版本，分为基础和大型模型，可提取有无标题文本的表格和图像。模型基于Florence-2微调，测试准确率达98.06%。项目提供使用示例和完整训练指南，方便研究者复现和应用。

unitable - 整合表格识别任务的统一框架

Github开源项目表格识别TransformerUniTable自监督预训练表格结构

UniTable是一个创新的表格识别框架，统一了训练范式、目标和模型架构。它利用自监督预训练和语言建模，有效处理表格结构、单元格内容和边界框识别。该项目在四个大型数据集上展现最先进性能，并提供完整的推理流程Jupyter Notebook，支持多数据集微调和全面表格识别。

RapidStructure - 全面文档图像处理与结构化解析工具集

Github开源项目表格识别文档分析版面分析RapidStructure版面还原

RapidStructure是一个开源的文档图像处理工具集,提供文档方向分类、版面分析和表格识别等功能。该项目实现了从文档图像到结构化数据的完整处理流程,包括新增的版面还原功能。RapidStructure可与RapidOCR配合使用,支持Linux、Windows和Mac平台,兼容Python 3.6及以上版本。

surya_tablerec - 基于transformers的高效表格识别模型提升文档分析效率

Github开源项目表格识别模型transformersHuggingfacesurya

surya_tablerec是一个基于transformers库的开源表格识别模型，专为surya项目开发。该模型能够识别和提取文档中的表格结构，适用于处理各种复杂的表格布局。surya_tablerec可帮助研究人员和数据分析师从大量文档中快速提取表格信息，提高文档分析效率。该项目采用CC-BY-NC-SA-4.0许可证，可用于非商业用途。

相关文章

Article Cover

Pix2Text: 开源的图像文字识别和公式转换工具

Article Cover

PDF-Extract-Kit: 高质量PDF内容提取的全面解决方案

Article Cover

UniTable: 一个统一的表格基础模型

Article Cover

RapidStructure: 强大的文档结构化解析工具

Article Cover

PaddleOCR学习资源汇总 - 强大的多语种OCR工具库

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号