Project Icon

Translumo

高精度实时屏幕翻译工具 集成多OCR引擎和多语言支持

Translumo作为一款先进的屏幕翻译工具,能实时检测并翻译指定区域的文本内容。其核心优势在于集成了多个OCR引擎,并通过机器学习模型评分机制确保最佳识别效果。该工具具备简洁界面、低延迟特性,并针对系统性能进行了多项优化。Translumo支持多种语言的识别和翻译,专为Windows 10/11系统设计,满足了实时翻译场景的多样化需求。

许可证 Github 所有发布版本

英文 | 俄文

高级屏幕翻译器。Translumo能够实时检测并翻译选定区域内出现的文本(例如字幕)。

主要特点

  • 高精度文本识别
  • Translumo允许同时结合使用多个OCR引擎。它使用机器学习训练模型对每个OCR识别结果进行评分,并选择最佳结果。

  • 简单的界面
  • 主要理念是制作一个不需要为每种情况手动调整,且适合日常使用的工具。
  • 低延迟
  • 实施了多项优化,以减少对系统性能的影响,并最大限度地减少文本出现到实际翻译之间的延迟。
  • 集成现代OCR引擎: Tesseract 5.2、WindowsOCR、EasyOCR
  • 可用翻译器: 谷歌翻译、Yandex翻译、Naver Papago、DeepL
  • 可用识别语言: 英语、俄语、日语、中文(简体)、韩语
  • 可用翻译语言: 英语、俄语、日语、中文(简体)、韩语、法语、西班牙语、德语、葡萄牙语、意大利语、越南语、泰语、土耳其语、阿拉伯语

系统要求

  • Windows 10 版本19041 (20H1) / Windows 11
  • DirectX11
  • 8 GB RAM (适用于EasyOCR模式)
  • 5 GB可用存储空间 (适用于EasyOCR模式)
  • 支持CUDA SDK 11.8的Nvidia GPU(GTX 750、8xxM、9xx系列或更高) (适用于EasyOCR模式)

使用方法

  1. 打开设置
  2. 选择语言->源语言和语言->翻译语言
  3. 选择文本识别->引擎(请查看使用技巧以获取推荐模式)
  4. 选择捕获区域
  5. 开始翻译

使用技巧

通常,我建议始终保持Windows OCR开启。这是对主要文本检测最有效的OCR,对性能影响较小。

推荐的OCR引擎组合

  • Tesseract-Windows OCR-EasyOCR - 具有最高精度的高级模式
  • Tesseract-Windows OCR - 对系统性能的影响明显较小。对于文本具有简单纯色背景和相当常见字体的情况,这种组合就足够了
  • Windows OCR-EasyOCR - 对于一些非常特殊复杂的情况,禁用Tesseract并避免不必要的文本噪音是有意义的

选择最小捕获区域

这可以减少背景中随机字母进入区域的机会。同时,较大的框架处理时间会更长。

使用代理列表避免被翻译服务封锁

有些翻译器有时会因大量请求而封锁客户端。您可以在语言->代理选项卡上配置个人/共享IPv4代理(1-2个应该足够)。应用程序将交替使用代理进行请求,以减少来自单一IP地址的请求数量。

在游戏中使用无边框/窗口模式(非全屏)

这对于正确显示翻译窗口覆盖层是必要的。

如果游戏没有这种模式,您可以使用外部工具使其无边框(例如Borderless Gaming

将应用程序安装在SSD上

这可以减少启用EasyOCR引擎时的冷启动时间(将大型EasyOCR模型加载到RAM中)。

常见问题

我遇到"无法捕获屏幕"错误或开始翻译后什么都没发生

确保包含文本的目标窗口处于活动状态。也可以尝试重启Translumo或重新打开目标窗口。

成功使用翻译后遇到"文本翻译失败"错误

很可能是翻译服务暂时封锁了来自您IP的请求。您可以更换翻译器或配置代理列表。

无法启用Windows OCR

确保以管理员身份运行应用程序。Translumo每次都会尝试通过PowerShell检查已安装的Windows语言包。

我设置了无边框/窗口模式,但翻译窗口仍显示在游戏下方

当游戏运行并聚焦时,使用热键(默认为ALT+T)隐藏然后再次显示翻译窗口

EasyOCR的包下载失败

尝试在VPN下重新安装

热键不工作

其他应用程序可能会拦截特定热键的处理

遇到"文本检测失败(TesseractOCREngine)"错误

确保应用程序路径只包含拉丁字母。

构建

需要Visual Studio 2022和.NET 7 SDK

  • 克隆仓库(master分支始终等同于最新发布版本):
  • git clone https://github.com/Danily07/Translumo.git
    
  • 恢复包并构建解决方案。构建过程中会执行binaries_extract.bat,它会自动下载模型和python二进制文件到目标输出目录。

致谢

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号