tools-ocr

Tree Hole OCR 高效本地文本识别工具

Tree Hole OCR 本地OCR识别跨平台兼容文本识别 PDF识别 Github 开源项目

Tree Hole OCR是一款基于Paddle OCR模型的本地文本识别工具。无需联网即可快速识别文字，支持PDF、图像和截图识别等多种功能。采用Java和JavaFX开发，具有良好的跨平台兼容性，适用于Mac OS X 12.6及以上系统。该工具依赖于DJL、PyTorch等深度学习框架，集成了OpenCV图像处理库。除基本文本识别外，还支持PDF识别和快捷键截图识别。项目开源，可在GitHub或Gitee上获取源码。

访问官网

Github

介绍相关项目

TTime - 高效的输入、截图翻译工具，集成多种翻译和OCR服务

GithubTTime划词翻译剪贴板监听翻译开源项目截图OCR翻译

TTime是一款功能丰富的翻译工具，支持输入翻译、截图翻译、划词翻译和悬浮球翻译等方式，集成多种翻译源和OCR服务，提供简洁的用户界面，适用于Windows和macOS系统，满足各种翻译需求。

ocrs - 基于Rust的开源OCR引擎和命令行工具

GithubOCRONNXRust图像文字提取开源项目机器学习

ocrs是一个基于Rust的开源光学字符识别(OCR)库和命令行工具，利用机器学习技术从各类图像中提取文本。它旨在提供一个现代化的OCR引擎，能够处理多种图像类型，并大幅减少预处理工作。ocrs具有跨平台兼容性，支持WebAssembly，使用开放许可数据集训练。目前项目处于早期阶段，支持拉丁字母识别，并计划未来扩展更多语言支持。

eSearch - 跨平台截图工具集成OCR搜索和录屏功能

GithubOCR识别eSearch开源项目截屏软件跨平台

eSearch是一款跨平台的开源截图工具，集成了OCR文字识别、搜索、翻译、贴图、以图搜图和录屏等功能。它支持Windows、Linux和macOS系统，并提供离线OCR识别和灵活的截图编辑选项。eSearch可快速识别和检索屏幕信息，适用于办公和学习场景，显著提高用户处理屏幕信息的效率。

tesseract.js - 多语言的从图像中识别文字的JavaScript库

GithubJavaScript库OCR引擎Tesseract.jsWebAssembly图像识别开源项目

Tesseract.js 是一个功能强大的 JavaScript 库，支持从图像中提取多种语言的文字，适用于浏览器和 Node.js 环境。它利用 WebAssembly 技术封装了 Tesseract OCR 引擎，支持通过 CDN、Webpack 或本地安装进行集成。该库具备低内存占用、快速处理、多种图像格式支持和并行处理功能。最新版本优化了文件大小和运行时性能，兼容多平台，适用于文档扫描和实时视频识别等应用。

doctr - 由深度学习提供支持的无缝、高性能和可访问的库，用于 OCR 相关任务

GithubOCRPyTorchTensorFlowdocTR开源项目文本识别

docTR提供高效、准确的OCR解决方案，支持PDF和图像文件，基于TensorFlow 2和PyTorch。能快速检测识别文档文字，并提供多种处理旋转文档选项。用户可使用预训练模型快速上手或自定义架构。解析结果可视化且支持导出为JSON格式，方便后续处理和分析。

Picture Translate - 多语言在线图像文字翻译工具

AI工具OCR技术图片翻译多语言支持实时翻译跨平台兼容

Picture Translate是一款在线图像文字翻译工具，采用光学字符识别技术识别和翻译图像中的文本。支持多种语言，提供实时翻译，界面简洁易用。适用于旅游、教育、商业、医疗等领域，帮助克服语言障碍。该工具免费使用，注重用户数据隐私和安全，是跨语言交流的有效工具。

mokuro - 日本漫画OCR工具，为学习者提供可选文本阅读体验

GithubOCR技术mokuro开源项目文本检测日语漫画阅读器

mokuro是一个开源项目，为日语学习者提供了便捷的漫画阅读工具。该工具通过文本检测和OCR技术，将日本漫画中的文字转换为可选文本。mokuro离线处理漫画页面，生成包含OCR结果的.mokuro文件，用户可通过网页阅读器浏览处理后的漫画。支持弹出字典功能，方便学习者查询生词。此外，mokuro具备多卷处理能力，并兼容旧版HTML格式，适合各类漫画爱好者和日语学习者使用。

normcap - 跨平台OCR截图工具智能提取文本信息

GithubNormCapOCR开源开源项目截图工具跨平台

NormCap是一款基于OCR技术的屏幕截图工具，适用于Linux、macOS和Windows系统。这款开源软件不仅可以捕获图像，还能智能识别并提取图像中的文本信息。NormCap支持多语言识别，界面简洁易用。无论是日常办公还是学术研究，NormCap都能协助快速获取所需的文字内容，提高工作效率。

tesserocr - Python封装的OCR引擎简化技术集成

GithubOCRPythonTesseract APItesserocr图像识别开源项目

tesserocr是基于Tesseract OCR引擎的Python封装库，通过Cython集成Tesseract C++ API。它提供简洁的Pythonic接口，支持多线程并发，可与Pillow库配合。tesserocr简化了OCR集成，便于开发者在Python项目中实现高效文字识别。该库支持多种图像格式，提供丰富的API功能，包括文本识别、布局分析和方向检测等。tesserocr支持多种语言识别、图像预处理、文本布局分析等高级功能。它还提供了简单的命令行接口，方便快速测试和使用。该库适用于各种OCR应用场景，如文档数字化、图像文本提取和自动化数据录入等。

GOT-OCR2_0 - GOT-OCR2_0为OCR技术开创统一端到端模型新纪元

GOTGithubHuggingfaceOCR图像识别开源项目模型自然语言处理视觉语言模型

GOT-OCR2_0项目提出通用OCR理论，通过统一端到端模型实现OCR 2.0。该模型具备多语言识别、版面分析和细粒度OCR能力，可处理普通文本、格式化文本及多页文档。项目提供开源训练代码和在线演示，为OCR技术发展开辟新方向。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号