#表格识别
PaddleOCR - 领先的OCR工具库,支持多语言和多硬件平台
Github开源项目模型训练PaddleOCROCR文本识别表格识别热门
PaddleOCR旨在为开发者提供一套丰富、领先且实用的OCR工具库,帮助开发者快速训练并部署OCR模型。它不仅支持中英文识别,还支持多语言和多硬件平台,包括最新的PP-OCRv4模型,有效提高了中英文场景下的识别精确度。适用于移动端和服务器端,适配多种开发需求。
Pix2Text - 开源Python工具,支持高精度数学公式检测和80多种语言的文本识别
Github开源项目开源OCR表格识别Pix2Text数学公式检测
Pix2Text是一款免费开源的Python工具,主要功能与Mathpix类似,能够将复杂布局的图像、表格、文本和数学公式转换为Markdown格式。它支持超过80种语言的文本识别,包括简体中文、繁体中文、英语和越南语。最新的V1.1.1版本引入了新的数学公式检测模型,大幅提升了识别准确性。用户也可以通过在线服务和演示来体验其强大功能。
PDF-Extract-Kit - 全面高效的PDF文档内容提取工具包
Github开源项目表格识别PDF提取文档内容布局检测公式识别
PDF-Extract-Kit是一款集成多种先进技术的PDF内容提取工具包。它结合了LayoutLMv3布局分析、YOLOv8公式检测、UniMERNet公式识别、StructEqTable表格识别和PaddleOCR文字识别等功能,能够准确高效地提取各类PDF文档中的结构化内容。该工具适用于学术论文、教科书、研究报告和财务报表等多种文档类型,即使面对扫描质量欠佳或带有水印的PDF文件,也能保持稳定的提取效果。
TF-ID - 开源AI模型助力学术论文表格和图像高效提取
Github开源项目表格识别学术论文图像识别对象检测TF-ID
TF-ID是一系列用于从学术论文中提取表格和图像的目标检测模型。项目开源了训练代码、模型权重和标注数据集。TF-ID包含四个版本,分为基础和大型模型,可提取有无标题文本的表格和图像。模型基于Florence-2微调,测试准确率达98.06%。项目提供使用示例和完整训练指南,方便研究者复现和应用。
unitable - 整合表格识别任务的统一框架
Github开源项目表格识别TransformerUniTable自监督预训练表格结构
UniTable是一个创新的表格识别框架,统一了训练范式、目标和模型架构。它利用自监督预训练和语言建模,有效处理表格结构、单元格内容和边界框识别。该项目在四个大型数据集上展现最先进性能,并提供完整的推理流程Jupyter Notebook,支持多数据集微调和全面表格识别。
RapidStructure - 全面文档图像处理与结构化解析工具集
Github开源项目表格识别文档分析版面分析RapidStructure版面还原
RapidStructure是一个开源的文档图像处理工具集,提供文档方向分类、版面分析和表格识别等功能。该项目实现了从文档图像到结构化数据的完整处理流程,包括新增的版面还原功能。RapidStructure可与RapidOCR配合使用,支持Linux、Windows和Mac平台,兼容Python 3.6及以上版本。
surya_tablerec - 基于transformers的高效表格识别模型 提升文档分析效率
Github开源项目表格识别模型transformersHuggingfacesurya
surya_tablerec是一个基于transformers库的开源表格识别模型,专为surya项目开发。该模型能够识别和提取文档中的表格结构,适用于处理各种复杂的表格布局。surya_tablerec可帮助研究人员和数据分析师从大量文档中快速提取表格信息,提高文档分析效率。该项目采用CC-BY-NC-SA-4.0许可证,可用于非商业用途。
相关文章