树洞OCR
简介
- 本地OCR识别:树洞OCR文字识别工具无需联网,利用本地OCR技术,基于Paddle OCR模型和PyTorch、DJL等深度学习框架,提供快速准确的文字识别。
- 跨平台兼容:使用Java 1.8和JavaFX开发,支持在不同操作系统上运行,包括Mac OS X 12.6及以上版本。
- 功能强大:除基本文字识别外,还包括PDF识别、图片文字识别、快捷键截图识别等功能。
依赖库
- JDK 1.8
- JavaFX
- DJL
- PyTorch
- ONNX
- Paddle OCR
- OpenCV
开源地址
文档
https://tree-hole-ocr-docs.vercel.app/
系统要求
- 由于依赖DJL 0.25.0,需要Mac OS X 12.6
安装
- 请勿在安装路径中包含中文字符;
- 本程序使用JavaFX开发,提供的安装包已包含Java。
- 从release下载最新版本并解压安装。
使用程序
截图
- 方法一:点击程序主界面的截图按钮;
- 方法二:按下截图快捷键F4。
选择区域
进入截图界面后,按住左键拖动选择要截取的区域; 完成选择后,可以微调所选区域:
- 使用方向键调整选区的右边和上边;
- 使用Shift + 方向键调整选区的左边和下边;
- 使用Ctrl + A选择整个屏幕。
确认选择
选择完成后,按回车键
或空格键
,或双击鼠标左键确认选择;确认后,程序将自动对选中区域进行OCR文字识别。
-
图片
-
结果:
本地构建
下载并解压模型
wget https://github.com/litongjava/tools-ocr/releases/download/model-ppocr-v4/ch_PP-OCRv4_rec_infer-onnx.zip
wget https://github.com/litongjava/tools-ocr/releases/download/model-ppocr-v4/ch_PP-OCRv4_det_infer-onnx.zip
解压模型
mkdir models/ch_PP-OCRv4_rec_infer
mkdir models/ch_PP-OCRv4_det_infer
unzip /Users/mac/Downloads/ch_PP-OCRv4_rec_infer-onnx.zip -d models/ch_PP-OCRv4_rec_infer
unzip /Users/mac/Downloads/ch_PP-OCRv4_det_infer-onnx.zip -d models/ch_PP-OCRv4_det_infer
构建程序
您可以下载代码并在本地构建。构建命令如下: Windows
mkdir target\jfx\app
cp -r models target\jfx\app
mvn jfx:native -DskipTests -f pom.xml
macOS
rm -rf target/jfx/app
mkdir -p target/jfx/app
cp -r models target/jfx/app
mvn jfx:native -DskipTests -f pom.xml
查看系统运行日志
cd treehole.app/Contents/java/logs
注意事项
MAC权限设置
由于监听了截图快捷键,MAC需要相应的权限设置,如下图所示:
- 设置 --> 安全性与隐私 --> 辅助功能
- 设置 --> 安全性与隐私 --> 屏幕录制
常用目录
- 日志目录 /Applications/treehole.app/Contents/Java/logs
- 临时图片保存目录 /Applications/treehole.app/Contents/Java
待办事项
- PDF识别
- 图片文字识别
- 识别结果文本对齐(多列待实现)
- 全屏模式截图
- 添加识别动画
- 多屏支持
- 文本翻译
- 公式识别
- 表格识别
- 软件设置