#文本检测

BetterOCR学习资料汇总 - 结合多个OCR引擎和LLM的高级文本识别工具

3 个月前

BetterOCR OCR引擎 LLM 文本检测多语言支持 Github 开源项目

3 个月前

MMOCR: 一站式文字检测、识别与理解工具箱 - OpenMMLab开源项目介绍

3 个月前

OpenMMLab MMOCR PyTorch 文本检测文本识别 Github 开源项目

3 个月前

探索OCR技术的前沿:解析GitHub热门项目awesome-ocr

3 个月前

OCR 文本检测文档分析图像处理深度学习 Github 开源项目

3 个月前

PanelCleaner: AI驱动的漫画对话框清理工具

3 个月前

Panel Cleaner 机器学习文本检测图像处理 OCR Github 开源项目

3 个月前

Mokuro: 在浏览器中阅读日语漫画的革命性工具

3 个月前

mokuro 日语漫画 OCR技术阅读器文本检测 Github 开源项目

3 个月前

MindOCR: 基于 MindSpore 的强大光学字符识别工具箱

3 个月前

MindOCR OCR工具箱 MindSpore 文本检测文字识别 Github 开源项目

3 个月前

PaddleOCR2Pytorch: 将PaddleOCR模型转换为PyTorch的开源项目

3 个月前

PaddleOCR OCR系统文本检测文本识别多语言识别 Github 开源项目

3 个月前

BetterOCR: 融合多个OCR引擎与LLM的文本识别利器

2024年08月31日

BetterOCR OCR引擎 LLM 文本检测多语言支持 Github 开源项目

2024年08月31日

MMOCR: 全面的文本检测、识别和理解工具箱

2024年08月30日

OpenMMLab MMOCR PyTorch 文本检测文本识别 Github 开源项目

2024年08月30日

相关项目

mmocr

MMOCR是一个基于PyTorch和mmdetection的开源工具箱，提供全面的文本检测、文本识别及信息提取解决方案。它支持多种先进模型和模块化设计，允许用户自定义优化器、数据预处理和模型组件。最新版本v1.0.0新增支持SCUT-CTW1500、SynthText和MJSynth数据集，更新了FAQ和文档，并添加了新教程笔记本。适用于PyTorch 1.6+，欢迎研究人员和开发者贡献改进。

BetterOCR

BetterOCR通过结合EasyOCR、Tesseract和Pororo等OCR引擎，并使用LLM技术，解决多语言文本检测难题。支持自定义上下文以提高文本识别的精度，即使是罕见或非传统词汇也能保证高准确性。支持异步操作和改进的界面，并持续快速开发中。欢迎贡献与参与，共同提升OCR技术。

PaddleOCR2Pytorch

PaddleOCR2Pytorch是一个开源项目，致力于将PaddleOCR模型转换为PyTorch框架可用的版本。项目支持多种OCR算法，涵盖文本检测、方向分类和文本识别，同时提供丰富的预训练模型。它不仅使PyTorch用户能够便捷使用PaddleOCR的优质模型，还为跨深度学习框架的模型转换提供了实用参考。

mindocr

MindOCR是一个基于MindSpore的开源OCR开发工具箱，集成主流文本检测和识别算法。该工具箱提供易用的训练和推理接口，加速文本检测识别模型的开发和部署。MindOCR支持DBNet、CRNN等多种算法，采用模块化设计，并提供高性能预训练模型。研究人员和开发者可以利用MindOCR快速构建OCR应用，实现高效的图像文本理解。

mokuro

mokuro是一个开源项目，为日语学习者提供了便捷的漫画阅读工具。该工具通过文本检测和OCR技术，将日本漫画中的文字转换为可选文本。mokuro离线处理漫画页面，生成包含OCR结果的.mokuro文件，用户可通过网页阅读器浏览处理后的漫画。支持弹出字典功能，方便学习者查询生词。此外，mokuro具备多卷处理能力，并兼容旧版HTML格式，适合各类漫画爱好者和日语学习者使用。

PanelCleaner

PanelCleaner 是一款开源的漫画文本清理工具，采用机器学习技术精确识别文本区域并生成高质量遮罩。该工具能自动清理简单对话气泡，支持批量处理和自定义清理参数，并提供OCR文本提取功能。通过直观的图形界面，PanelCleaner 可大幅提高漫画翻译效率，减少重复性工作，同时避免误删非文本内容。

awesome-ocr

该项目整合了OCR领域的多种前沿工具和技术，涵盖图像校正、文本检测、表格识别和手写识别等方面。它提供了从预处理到后处理的完整OCR解决方案，包含大量开源实现和相关研究论文链接。这个资源库对从事文档分析和文本提取的开发者及研究人员具有重要参考价值。

surya_det3

surya_det3是surya项目中的一个文本检测模型，基于vikp/line_detector_3开发。该模型主要用于识别和定位文档中的文本行，可处理不同字体、布局和语言。作为开源项目的一部分，surya_det3为文档分析和信息提取提供了基础支持。

roberta-large-openai-detector

RoBERTa大型模型微调的GPT-2文本检测器是OpenAI开发的开源工具，专门用于识别GPT-2模型生成的文本。该模型对1.5B参数GPT-2生成的内容有约95%的检测准确率。它支持合成文本生成研究，但也可能被滥用于逃避检测。使用时应注意模型局限性，并与其他方法结合以提高检测效果。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com