#OCR引擎

tesseract.js - 多语言的从图像中识别文字的JavaScript库
Tesseract.jsJavaScript库图像识别OCR引擎WebAssemblyGithub开源项目
Tesseract.js 是一个功能强大的 JavaScript 库,支持从图像中提取多种语言的文字,适用于浏览器和 Node.js 环境。它利用 WebAssembly 技术封装了 Tesseract OCR 引擎,支持通过 CDN、Webpack 或本地安装进行集成。该库具备低内存占用、快速处理、多种图像格式支持和并行处理功能。最新版本优化了文件大小和运行时性能,兼容多平台,适用于文档扫描和实时视频识别等应用。
BetterOCR - 多个OCR引擎与LLM结合实现高精度文本检测
BetterOCROCR引擎LLM文本检测多语言支持Github开源项目
BetterOCR通过结合EasyOCR、Tesseract和Pororo等OCR引擎,并使用LLM技术,解决多语言文本检测难题。支持自定义上下文以提高文本识别的精度,即使是罕见或非传统词汇也能保证高准确性。支持异步操作和改进的界面,并持续快速开发中。欢迎贡献与参与,共同提升OCR技术。
Translumo - 高精度实时屏幕翻译工具 集成多OCR引擎和多语言支持
Translumo屏幕翻译OCR引擎实时翻译多语言支持Github开源项目
Translumo作为一款先进的屏幕翻译工具,能实时检测并翻译指定区域的文本内容。其核心优势在于集成了多个OCR引擎,并通过机器学习模型评分机制确保最佳识别效果。该工具具备简洁界面、低延迟特性,并针对系统性能进行了多项优化。Translumo支持多种语言的识别和翻译,专为Windows 10/11系统设计,满足了实时翻译场景的多样化需求。