#Tesseract OCR

tesseract - 开源OCR引擎 多语言文字识别解决方案
Tesseract OCR光学字符识别开源软件多语言支持图像处理Github开源项目
Tesseract是一款开源的光学字符识别(OCR)引擎,支持超过100种语言识别和多种图像格式处理。项目包含OCR引擎libtesseract和命令行工具tesseract。最新版本Tesseract 4引入基于神经网络的OCR引擎,专注于行识别,同时保留了传统的字符模式识别功能。Tesseract支持Unicode,可输出多种格式如纯文本、PDF等,并可通过训练扩展语言识别能力。
tesseract-ocr-for-php - 用于PHP的Tesseract OCR封装库
Tesseract OCRPHP图像识别开源库多语言支持Github开源项目
tesseract-ocr-for-php是一个PHP封装库,提供简洁的接口调用Tesseract OCR引擎。该库支持多语言文字识别、自定义配置和多种输出格式(如HOCR、PDF)。适用于文档数字化、图像文字提取等OCR应用场景。通过Composer可快速集成到PHP项目中,简化OCR开发流程。
tessdata_fast - Tesseract OCR引擎的快速整数训练模型
Tesseract OCR训练模型快速整数版本LSTM引擎OCR语言Github开源项目
tessdata_fast项目提供Tesseract 4和5 LSTM OCR引擎的快速整数训练模型。这些模型在速度和准确性间取得平衡,包括单一语言和多语言脚本模型,支持多种语言和文字系统。虽不支持微调和增量训练,但已在多数Linux发行版中广泛应用,为OCR处理提供高效解决方案。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号