#文本检测

BetterOCR学习资料汇总 - 结合多个OCR引擎和LLM的高级文本识别工具

2024年09月10日
Cover of BetterOCR学习资料汇总 - 结合多个OCR引擎和LLM的高级文本识别工具

MMOCR: 一站式文字检测、识别与理解工具箱 - OpenMMLab开源项目介绍

2024年09月10日
Cover of MMOCR: 一站式文字检测、识别与理解工具箱 - OpenMMLab开源项目介绍

探索OCR技术的前沿:解析GitHub热门项目awesome-ocr

2024年09月05日
Cover of 探索OCR技术的前沿:解析GitHub热门项目awesome-ocr

PanelCleaner: AI驱动的漫画对话框清理工具

2024年09月05日
Cover of PanelCleaner: AI驱动的漫画对话框清理工具

Mokuro: 在浏览器中阅读日语漫画的革命性工具

2024年09月05日
Cover of Mokuro: 在浏览器中阅读日语漫画的革命性工具

MindOCR: 基于 MindSpore 的强大光学字符识别工具箱

2024年09月05日
Cover of MindOCR: 基于 MindSpore 的强大光学字符识别工具箱

PaddleOCR2Pytorch: 将PaddleOCR模型转换为PyTorch的开源项目

2024年09月05日
Cover of PaddleOCR2Pytorch: 将PaddleOCR模型转换为PyTorch的开源项目

BetterOCR: 融合多个OCR引擎与LLM的文本识别利器

2024年08月31日
Cover of BetterOCR: 融合多个OCR引擎与LLM的文本识别利器

MMOCR: 全面的文本检测、识别和理解工具箱

2024年08月30日
Cover of MMOCR: 全面的文本检测、识别和理解工具箱
相关项目
Project Cover

mmocr

MMOCR是一个基于PyTorch和mmdetection的开源工具箱,提供全面的文本检测、文本识别及信息提取解决方案。它支持多种先进模型和模块化设计,允许用户自定义优化器、数据预处理和模型组件。最新版本v1.0.0新增支持SCUT-CTW1500、SynthText和MJSynth数据集,更新了FAQ和文档,并添加了新教程笔记本。适用于PyTorch 1.6+,欢迎研究人员和开发者贡献改进。

Project Cover

BetterOCR

BetterOCR通过结合EasyOCR、Tesseract和Pororo等OCR引擎,并使用LLM技术,解决多语言文本检测难题。支持自定义上下文以提高文本识别的精度,即使是罕见或非传统词汇也能保证高准确性。支持异步操作和改进的界面,并持续快速开发中。欢迎贡献与参与,共同提升OCR技术。

Project Cover

PaddleOCR2Pytorch

PaddleOCR2Pytorch是一个开源项目,致力于将PaddleOCR模型转换为PyTorch框架可用的版本。项目支持多种OCR算法,涵盖文本检测、方向分类和文本识别,同时提供丰富的预训练模型。它不仅使PyTorch用户能够便捷使用PaddleOCR的优质模型,还为跨深度学习框架的模型转换提供了实用参考。

Project Cover

mindocr

MindOCR是一个基于MindSpore的开源OCR开发工具箱,集成主流文本检测和识别算法。该工具箱提供易用的训练和推理接口,加速文本检测识别模型的开发和部署。MindOCR支持DBNet、CRNN等多种算法,采用模块化设计,并提供高性能预训练模型。研究人员和开发者可以利用MindOCR快速构建OCR应用,实现高效的图像文本理解。

Project Cover

mokuro

mokuro是一个开源项目,为日语学习者提供了便捷的漫画阅读工具。该工具通过文本检测和OCR技术,将日本漫画中的文字转换为可选文本。mokuro离线处理漫画页面,生成包含OCR结果的.mokuro文件,用户可通过网页阅读器浏览处理后的漫画。支持弹出字典功能,方便学习者查询生词。此外,mokuro具备多卷处理能力,并兼容旧版HTML格式,适合各类漫画爱好者和日语学习者使用。

Project Cover

PanelCleaner

PanelCleaner 是一款开源的漫画文本清理工具,采用机器学习技术精确识别文本区域并生成高质量遮罩。该工具能自动清理简单对话气泡,支持批量处理和自定义清理参数,并提供OCR文本提取功能。通过直观的图形界面,PanelCleaner 可大幅提高漫画翻译效率,减少重复性工作,同时避免误删非文本内容。

Project Cover

awesome-ocr

该项目整合了OCR领域的多种前沿工具和技术,涵盖图像校正、文本检测、表格识别和手写识别等方面。它提供了从预处理到后处理的完整OCR解决方案,包含大量开源实现和相关研究论文链接。这个资源库对从事文档分析和文本提取的开发者及研究人员具有重要参考价值。

Project Cover

surya_det3

surya_det3是surya项目中的一个文本检测模型,基于vikp/line_detector_3开发。该模型主要用于识别和定位文档中的文本行,可处理不同字体、布局和语言。作为开源项目的一部分,surya_det3为文档分析和信息提取提供了基础支持。

Project Cover

roberta-large-openai-detector

RoBERTa大型模型微调的GPT-2文本检测器是OpenAI开发的开源工具,专门用于识别GPT-2模型生成的文本。该模型对1.5B参数GPT-2生成的内容有约95%的检测准确率。它支持合成文本生成研究,但也可能被滥用于逃避检测。使用时应注意模型局限性,并与其他方法结合以提高检测效果。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号