wangfreexx-tianruoocr-cl-paddle

开源本地OCR识别和翻译软件

OCR软件文字识别 paddle-ocr Chinese-lite 翻译功能 Github 开源项目

wangfreexx-tianruoocr-cl-paddle是一款开源的本地OCR识别软件，基于Chinese-lite和paddle-ocr技术。支持中文高效识别、条形码扫描和多种翻译接口，包括离线翻译功能。软件提供段落合并和自定义设置，适用于64位Windows系统，无需网络即可进行OCR识别。该项目为用户提供了一个全面的本地文字识别和翻译解决方案。

访问官网

Github

介绍相关项目

PDF Translator and Editor - 全能智能文档翻译与编辑工具

AI工具AI翻译PDF转换多语言支持文件翻译格式保持

这款文档翻译和编辑工具支持PDF、Word、Excel、PowerPoint和图片等多种格式的文件翻译，可将文档翻译成136种语言，并保持原有格式和布局。工具提供PDF转换和编辑功能，包括PDF与图片互转、文本编辑和PDF拆分等。采用谷歌和微软的神经机器翻译模型，支持自动语言检测和多语言文档翻译。已获得来自200多个国家和地区的25万用户使用，无文件大小和页数限制，可通过分享扩展在任何应用中使用翻译功能。

trocr-base-handwritten - 基于Transformer架构的高精度手写文本识别模型

GithubHuggingfaceTrOCRTransformer模型光学字符识别图像转文本开源项目手写文本识别模型

TrOCR是一种基于Transformer架构的光学字符识别模型，专为手写文本识别而设计。该模型结合了图像Transformer编码器和文本Transformer解码器，可准确识别单行手写文本图像。经IAM手写数据集微调后，TrOCR适用于多种手写OCR场景，为文本识别研究和应用提供了有力支持。

PaddleHub - 多领域应用的跨平台AI模型服务平台

AI模型ERNIE-ViLGGithubHugging FacePaddleHubStable Diffusion开源项目

PaddleHub提供超过400种高质量AI模型，覆盖计算机视觉、自然语言处理和语音识别等领域。用户仅需3行代码即可进行模型预测，同时支持模型即服务，通过简单命令即可部署。最新版本v2.3.0引入了ERNIE-ViLG、Disco Diffusion和Stable Diffusion等模型，并支持在HuggingFace平台上发布。PaddleHub兼容Linux、Windows和MacOS，适合多平台开发。

lingua-go - 准确识别文本语言的灵活工具，适用于多种自然语言处理场景

AIGithubLingua开源项目文本分类自然语言处理语言识别

Lingua-go 是一款能够准确识别文本语言的开源工具，适用范围广泛，包括长文本、单个词语和短语等。相比其他库，它在处理短文本时表现更佳，无需依赖外部API，支持75种语言，完全离线使用，适合预处理、文本分类和拼写检查等自然语言处理任务。

FluentRead - 智能网页翻译工具实现跨语言流畅阅读

AI翻译引擎Github多语言翻译开源项目流畅阅读浏览器翻译插件

FluentRead是一款功能丰富的浏览器翻译插件，支持多语言网页翻译。它提供仅译文和双语两种模式，整合了多种翻译引擎和AI模型。该插件具备快捷键、鼠标操作和滑动翻译等便捷功能，同时配备翻译缓存和回译功能，有效提升了跨语言阅读效率。FluentRead兼容主流浏览器，为用户提供智能、流畅的多语言网页阅读体验。

lookscanned.io - PDF在线转扫描效果工具

GithubLook ScannedPDF处理在线工具开源项目文档扫描浏览器应用

Look Scanned是一款纯前端PDF处理工具，能够在浏览器中为PDF文档添加扫描效果，无需使用实体扫描设备。该工具支持实时预览、离线使用，并兼容主流浏览器和设备。用户可调整参数以优化扫描效果，使文档呈现更真实的扫描质感。Look Scanned为需要快速生成扫描版PDF的用户提供了便捷高效的解决方案，同时保证了数据隐私安全。

SmartCropper - 智能图片裁剪库，适用于身份证、名片和文档

GithubSmartCropperTensorFlowopencv开源项目智能图片裁剪机器学习

SmartCropper 是一个智能图片裁剪库，适用于身份证、名片和文档等照片。它使用基于 OpenCV 的智能算法识别边框，提供拖动锚点手动调节选区和放大镜定位功能，并通过透视变换裁剪和矫正选区来还原正面图片。该库支持丰富的 UI 设置，包括辅助线、蒙版、锚点和放大镜等，通过使用 TensorFlow 的 HED 网络优化智能选区算法，提高识别率，尤其适用于大图片的高效裁剪。

LaTeX_OCR_PRO - 基于深度学习的多语言数学公式识别系统

AttentionGithubLaTeX_OCR_PROSeq2Seq开源项目数学公式识别机器学习

LaTeX_OCR_PRO是一个开源的数学公式识别项目，结合Seq2Seq、Attention和Beam Search技术，实现了对标准、中文及手写数学公式的高精度识别。项目提供完整的环境配置、数据处理、模型训练和评估流程，在多项性能指标上达到业界领先水平。此外，LaTeX_OCR_PRO还支持训练过程和注意力机制的可视化，为相关研究和应用开发提供了有力支持。

arxiv-translator - arXiv论文自动中文翻译与浏览平台

GithubarXiv人工智能大语言模型开源项目自然语言处理论文翻译

arxiv-translator是一个开源项目，旨在为用户提供arXiv论文的中文翻译网页。该项目利用nougat OCR技术提取PDF文本并自动翻译，提供包含arXiv ID、标题和链接的论文列表。涵盖机器学习、人工智能等领域的最新研究，方便研究人员和学生快速了解学术前沿。

naps2 - 跨平台文档扫描应用支持多种格式输出

GithubNAPS2OCRPDF开源项目文档扫描跨平台

NAPS2是一款开源文档扫描应用，支持Windows、Mac和Linux系统。它可从多种类型扫描仪获取文档，支持PDF、TIFF、JPEG和PNG格式输出。软件集成了Tesseract OCR引擎，提供光学字符识别功能。NAPS2支持多语言界面，并为开发者提供SDK，是一个功能完整的跨平台扫描解决方案。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号