英文 | 俄文
高级屏幕翻译器。Translumo能够实时检测并翻译选定区域内出现的文本(例如字幕)。
主要特点
- 高精度文本识别
- 简单的界面 主要理念是制作一个不需要为每种情况手动调整,且适合日常使用的工具。
- 低延迟 实施了多项优化,以减少对系统性能的影响,并最大限度地减少文本出现到实际翻译之间的延迟。
- 集成现代OCR引擎: Tesseract 5.2、WindowsOCR、EasyOCR
- 可用翻译器: 谷歌翻译、Yandex翻译、Naver Papago、DeepL
- 可用识别语言: 英语、俄语、日语、中文(简体)、韩语
- 可用翻译语言: 英语、俄语、日语、中文(简体)、韩语、法语、西班牙语、德语、葡萄牙语、意大利语、越南语、泰语、土耳其语、阿拉伯语
Translumo允许同时结合使用多个OCR引擎。它使用机器学习训练模型对每个OCR识别结果进行评分,并选择最佳结果。
系统要求
- Windows 10 版本19041 (20H1) / Windows 11
- DirectX11
- 8 GB RAM (适用于EasyOCR模式)
- 5 GB可用存储空间 (适用于EasyOCR模式)
- 支持CUDA SDK 11.8的Nvidia GPU(GTX 750、8xxM、9xx系列或更高) (适用于EasyOCR模式)
使用方法
- 打开设置
- 选择语言->源语言和语言->翻译语言
- 选择文本识别->引擎(请查看使用技巧以获取推荐模式)
- 选择捕获区域
- 开始翻译
使用技巧
通常,我建议始终保持Windows OCR开启。这是对主要文本检测最有效的OCR,对性能影响较小。推荐的OCR引擎组合
- Tesseract-Windows OCR-EasyOCR - 具有最高精度的高级模式
- Tesseract-Windows OCR - 对系统性能的影响明显较小。对于文本具有简单纯色背景和相当常见字体的情况,这种组合就足够了
- Windows OCR-EasyOCR - 对于一些非常特殊复杂的情况,禁用Tesseract并避免不必要的文本噪音是有意义的
选择最小捕获区域
这可以减少背景中随机字母进入区域的机会。同时,较大的框架处理时间会更长。
使用代理列表避免被翻译服务封锁
有些翻译器有时会因大量请求而封锁客户端。您可以在语言->代理选项卡上配置个人/共享IPv4代理(1-2个应该足够)。应用程序将交替使用代理进行请求,以减少来自单一IP地址的请求数量。
在游戏中使用无边框/窗口模式(非全屏)
这对于正确显示翻译窗口覆盖层是必要的。
如果游戏没有这种模式,您可以使用外部工具使其无边框(例如Borderless Gaming)
将应用程序安装在SSD上
这可以减少启用EasyOCR引擎时的冷启动时间(将大型EasyOCR模型加载到RAM中)。
常见问题
我遇到"无法捕获屏幕"错误或开始翻译后什么都没发生
确保包含文本的目标窗口处于活动状态。也可以尝试重启Translumo或重新打开目标窗口。
成功使用翻译后遇到"文本翻译失败"错误
很可能是翻译服务暂时封锁了来自您IP的请求。您可以更换翻译器或配置代理列表。
无法启用Windows OCR
确保以管理员身份运行应用程序。Translumo每次都会尝试通过PowerShell检查已安装的Windows语言包。
我设置了无边框/窗口模式,但翻译窗口仍显示在游戏下方
当游戏运行并聚焦时,使用热键(默认为ALT+T)隐藏然后再次显示翻译窗口
EasyOCR的包下载失败
尝试在VPN下重新安装
热键不工作
其他应用程序可能会拦截特定热键的处理
遇到"文本检测失败(TesseractOCREngine)"错误
确保应用程序路径只包含拉丁字母。
构建
需要Visual Studio 2022和.NET 7 SDK
- 克隆仓库(master分支始终等同于最新发布版本):
git clone https://github.com/Danily07/Translumo.git