#表格识别

PaddleOCR学习资源汇总 - 强大的多语种OCR工具库

2 个月前

PaddleOCR OCR 模型训练文本识别表格识别 Github 开源项目热门

2 个月前

RapidStructure: 强大的文档结构化解析工具

3 个月前

文档分析版面分析表格识别 RapidStructure 版面还原 Github 开源项目

3 个月前

UniTable: 一个统一的表格基础模型

3 个月前

UniTable 表格识别自监督预训练 Transformer 表格结构 Github 开源项目

3 个月前

PDF-Extract-Kit: 高质量PDF内容提取的全面解决方案

3 个月前

PDF提取文档内容布局检测公式识别表格识别 Github 开源项目

3 个月前

Pix2Text: 开源的图像文字识别和公式转换工具

3 个月前

Pix2Text OCR 数学公式检测表格识别开源 Github 开源项目

3 个月前

相关项目

PaddleOCR

PaddleOCR旨在为开发者提供一套丰富、领先且实用的OCR工具库，帮助开发者快速训练并部署OCR模型。它不仅支持中英文识别，还支持多语言和多硬件平台，包括最新的PP-OCRv4模型，有效提高了中英文场景下的识别精确度。适用于移动端和服务器端，适配多种开发需求。

Pix2Text

Pix2Text是一款免费开源的Python工具，主要功能与Mathpix类似，能够将复杂布局的图像、表格、文本和数学公式转换为Markdown格式。它支持超过80种语言的文本识别，包括简体中文、繁体中文、英语和越南语。最新的V1.1.1版本引入了新的数学公式检测模型，大幅提升了识别准确性。用户也可以通过在线服务和演示来体验其强大功能。

PDF-Extract-Kit

PDF-Extract-Kit是一款集成多种先进技术的PDF内容提取工具包。它结合了LayoutLMv3布局分析、YOLOv8公式检测、UniMERNet公式识别、StructEqTable表格识别和PaddleOCR文字识别等功能,能够准确高效地提取各类PDF文档中的结构化内容。该工具适用于学术论文、教科书、研究报告和财务报表等多种文档类型,即使面对扫描质量欠佳或带有水印的PDF文件,也能保持稳定的提取效果。

TF-ID

TF-ID是一系列用于从学术论文中提取表格和图像的目标检测模型。项目开源了训练代码、模型权重和标注数据集。TF-ID包含四个版本，分为基础和大型模型，可提取有无标题文本的表格和图像。模型基于Florence-2微调，测试准确率达98.06%。项目提供使用示例和完整训练指南，方便研究者复现和应用。

unitable

UniTable是一个创新的表格识别框架，统一了训练范式、目标和模型架构。它利用自监督预训练和语言建模，有效处理表格结构、单元格内容和边界框识别。该项目在四个大型数据集上展现最先进性能，并提供完整的推理流程Jupyter Notebook，支持多数据集微调和全面表格识别。

RapidStructure

RapidStructure是一个开源的文档图像处理工具集,提供文档方向分类、版面分析和表格识别等功能。该项目实现了从文档图像到结构化数据的完整处理流程,包括新增的版面还原功能。RapidStructure可与RapidOCR配合使用,支持Linux、Windows和Mac平台,兼容Python 3.6及以上版本。

surya_tablerec

surya_tablerec是一个基于transformers库的开源表格识别模型，专为surya项目开发。该模型能够识别和提取文档中的表格结构，适用于处理各种复杂的表格布局。surya_tablerec可帮助研究人员和数据分析师从大量文档中快速提取表格信息，提高文档分析效率。该项目采用CC-BY-NC-SA-4.0许可证，可用于非商业用途。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com