#Tesseract.js

tesseract.js - 多语言的从图像中识别文字的JavaScript库

Github开源项目图像识别WebAssemblyTesseract.jsJavaScript库OCR引擎

Tesseract.js 是一个功能强大的 JavaScript 库，支持从图像中提取多种语言的文字，适用于浏览器和 Node.js 环境。它利用 WebAssembly 技术封装了 Tesseract OCR 引擎，支持通过 CDN、Webpack 或本地安装进行集成。该库具备低内存占用、快速处理、多种图像格式支持和并行处理功能。最新版本优化了文件大小和运行时性能，兼容多平台，适用于文档扫描和实时视频识别等应用。

tessdata - Tesseract.js OCR语言数据集综合指南

Github开源项目OCR语言模型Tesseract.js训练数据NPM包

tessdata项目是Tesseract.js的多语言OCR数据集仓库。它提供了LSTM和传统OCR引擎的训练文件，包括默认和替代版本。项目详细说明了各数据集特点、NPM包发布状态，并介绍了通过CDN或本地方式集成到Tesseract.js的方法。这一资源为开发者提供了全面的OCR语言数据集使用指南。

tesseract.js-core - Tesseract OCR引擎的JavaScript WebAssembly实现

Github开源项目OCR图像识别WebAssemblyTesseract.js

tesseract.js-core是tesseract.js的核心组件，将Tesseract OCR引擎从C语言编译为JavaScript WebAssembly。该项目提供跨平台的文字识别功能，适用于浏览器和Node.js环境。它包含构建脚本、JavaScript封装和第三方依赖，并对Tesseract进行了优化，增加了页面角度检测和图像旋转等功能。开发者可使用Docker构建，或运行最小示例测试其功能。

相关文章

Article Cover

Tesseract.js: 强大的JavaScript OCR引擎

Article Cover

tessdata项目:Tesseract OCR引擎的语言训练数据

Article Cover

tesseract.js-core: 为JavaScript带来强大的OCR能力

Article Cover

Tesseract.js学习资源汇总 - 纯JavaScript实现100多种语言的OCR引擎

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号