wangfreexx-tianruoocr-cl-paddle

开源本地OCR识别和翻译软件

OCR软件文字识别 paddle-ocr Chinese-lite 翻译功能 Github 开源项目

wangfreexx-tianruoocr-cl-paddle是一款开源的本地OCR识别软件，基于Chinese-lite和paddle-ocr技术。支持中文高效识别、条形码扫描和多种翻译接口，包括离线翻译功能。软件提供段落合并和自定义设置，适用于64位Windows系统，无需网络即可进行OCR识别。该项目为用户提供了一个全面的本地文字识别和翻译解决方案。

访问官网

Github

介绍相关项目

PaddleRS - 多任务遥感影像智能解译套件支持全流程深度学习应用

GithubPaddleRS人工智能开源项目深度学习遥感影像飞桨

PaddleRS是基于飞桨开发的遥感影像智能解译套件,支持图像分割、目标检测等多种遥感任务。它拥有丰富模型库,针对大幅面影像优化,提供遥感数据预处理等功能,可快速完成从数据处理到模型部署的遥感深度学习应用开发全流程。PaddleRS具备工业级训练和部署性能,有效提升开发效率。

Paddle-Lite - 轻量级且高性能的深度学习推理框架

GithubPaddle Lite多平台支持开源项目模型优化深度学习高性能推理

Paddle Lite 是为移动端、嵌入式和边缘设备设计的高性能深度学习推理框架。支持多种硬件平台和操作系统，提供丰富的优化工具和多语言 API，便于快速部署和执行推理任务。通过量化和子图融合等策略，Paddle Lite 实现了轻量化和高性能，并已广泛应用于百度和其他企业。用户可以通过简单步骤完成模型优化和部署，并快速上手示例。

tesseract.js - 多语言的从图像中识别文字的JavaScript库

GithubJavaScript库OCR引擎Tesseract.jsWebAssembly图像识别开源项目

Tesseract.js 是一个功能强大的 JavaScript 库，支持从图像中提取多种语言的文字，适用于浏览器和 Node.js 环境。它利用 WebAssembly 技术封装了 Tesseract OCR 引擎，支持通过 CDN、Webpack 或本地安装进行集成。该库具备低内存占用、快速处理、多种图像格式支持和并行处理功能。最新版本优化了文件大小和运行时性能，兼容多平台，适用于文档扫描和实时视频识别等应用。

WanXangTrans - 基于多AI协作的精准文档翻译服务

AI工具WanXangTrans人工智能翻译多语言支持文件格式文档翻译

WanXangTrans提供基于多AI模型协作的在线文档翻译服务，支持文本、文档和图片的免费翻译，并保留原文档排版和格式。平台具备双语阅读功能，方便对比原文和译文。支持EPUB、Word、PDF等多种文件格式，可同时处理多个翻译任务，提高工作效率。采用GPT-3.5、GPT-4和Claude 3等先进AI模型，确保翻译的准确性和流畅度。

Papermerge DMS - 为扫描文档设计的开源OCR文档管理系统

AI工具OCR技术Papermerge开源软件数字档案文档管理系统

Papermerge DMS是一款开源文档管理系统，专为扫描文档和数字档案设计。系统集成OCR技术，支持PDF、TIFF、JPEG等格式文件处理。它提供多用户支持、全文搜索、文档版本控制等功能，界面现代直观。作为数字化解决方案，Papermerge DMS有助于减少纸质文档，提升业务效率。系统还提供REST API，便于根据需求进行扩展。

DocTranslator - 多语言在线文档翻译服务平台

AI工具AI翻译DocTranslator在线文档翻译多语言支持文件格式兼容

DocTranslator提供100多种语言的在线文档翻译服务，支持PDF、Word、Excel等多种格式，可处理高达1GB和5000页的文件。平台结合神经网络技术和人工翻译，确保翻译准确流畅。简洁直观的界面使翻译过程高效便捷，满足个人和企业的多样化翻译需求。

PaddleDetection - 目标检测套件支持多任务开发部署

GithubPaddleDetectionPaddlePaddle开源项目深度学习目标检测计算机视觉

PaddleDetection是基于PaddlePaddle的目标检测开发套件，支持通用、小目标、旋转框等多种检测任务。它提供PP-YOLOE、PP-PicoDet等高性能模型和丰富的模型组件，注重产业应用，帮助开发者实现从数据准备到模型部署的全流程开发。

MomoTranslator - 开源漫画翻译辅助工具自动识别文本并翻译

ChatGPTGithubMomoTranslatorOpenCV开源项目气泡检测漫画翻译

MomoTranslator是一个基于OpenCV的开源漫画翻译辅助工具。该软件能自动识别画格和气泡，对文本进行排序，并集成谷歌和ChatGPT的翻译功能。MomoTranslator不依赖PyTorch，具有简洁的图形界面，适合漫画翻译爱好者和专业人士使用。这款工具旨在提升漫画翻译的效率，简化翻译流程。

OCR_DataSet - 综合OCR数据集资源库及工具集

Github图像标注开源项目数据集文字识别深度学习计算机视觉

OCR_DataSet项目整合了13个知名的多语言OCR数据集，涵盖ICDAR2015、MLT2019和COCO-Text_v2等。项目特色包括数据格式统一化、便捷的百度网盘下载、详尽的数据集信息表和简化的读取脚本。此外，项目还提供了数据生成工具链接，为OCR领域的研究和开发工作提供了全面的资源支持。

trocr-small-handwritten - Transformer架构的手写文本识别OCR模型

GithubHuggingfaceTrOCRTransformer模型光学字符识别图像转文本开源项目手写识别模型

TrOCR-small-handwritten是一个基于Transformer架构的手写文本识别模型。它结合图像编码器和文本解码器，可将手写图像准确转换为文本。该模型在IAM数据集上微调，适用于单行文本OCR任务。模型提供简洁API，便于集成到各类应用中，实现高效的手写文本数字化。其小型结构设计使其在保持识别精度的同时，具有更快的处理速度和更低的资源消耗。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号