Project Icon

EasyOCR

支持80多种语言文字识别工具

EasyOCR是一款支持80多种语言和主要书写系统(如拉丁文、中文、阿拉伯文等)的光学字符识别(OCR)工具。它提供简单的安装和使用指南,帮助快速实现文本检测与识别,适用于多种场景。最新版本增加了Apple Silicon支持并修复了兼容性问题。未来版本将支持手写文本识别,进一步增强其功能。

wangfreexx-tianruoocr-cl-paddle - 开源本地OCR识别和翻译软件
Chinese-liteGithubOCR软件paddle-ocr开源项目文字识别翻译功能
wangfreexx-tianruoocr-cl-paddle是一款开源的本地OCR识别软件,基于Chinese-lite和paddle-ocr技术。支持中文高效识别、条形码扫描和多种翻译接口,包括离线翻译功能。软件提供段落合并和自定义设置,适用于64位Windows系统,无需网络即可进行OCR识别。该项目为用户提供了一个全面的本地文字识别和翻译解决方案。
PaddleOCR2Pytorch - 开源工具实现PaddleOCR模型向PyTorch框架的转换
GithubOCR系统PaddleOCR多语言识别开源项目文本检测文本识别
PaddleOCR2Pytorch是一个开源项目,致力于将PaddleOCR模型转换为PyTorch框架可用的版本。项目支持多种OCR算法,涵盖文本检测、方向分类和文本识别,同时提供丰富的预训练模型。它不仅使PyTorch用户能够便捷使用PaddleOCR的优质模型,还为跨深度学习框架的模型转换提供了实用参考。
tools-ocr - Tree Hole OCR 高效本地文本识别工具
GithubPDF识别Tree Hole OCR开源项目文本识别本地OCR识别跨平台兼容
Tree Hole OCR是一款基于Paddle OCR模型的本地文本识别工具。无需联网即可快速识别文字,支持PDF、图像和截图识别等多种功能。采用Java和JavaFX开发,具有良好的跨平台兼容性,适用于Mac OS X 12.6及以上系统。该工具依赖于DJL、PyTorch等深度学习框架,集成了OpenCV图像处理库。除基本文本识别外,还支持PDF识别和快捷键截图识别。项目开源,可在GitHub或Gitee上获取源码。
ocrs - 基于Rust的开源OCR引擎和命令行工具
GithubOCRONNXRust图像文字提取开源项目机器学习
ocrs是一个基于Rust的开源光学字符识别(OCR)库和命令行工具,利用机器学习技术从各类图像中提取文本。它旨在提供一个现代化的OCR引擎,能够处理多种图像类型,并大幅减少预处理工作。ocrs具有跨平台兼容性,支持WebAssembly,使用开放许可数据集训练。目前项目处于早期阶段,支持拉丁字母识别,并计划未来扩展更多语言支持。
GrabText - 多功能OCR识别与手写数学公式转换平台
AI工具OCR技术手写识别文字识别文本导出自动校正
GrabText提供免费在线OCR和图像文本识别服务,专注于手写文本和数学公式的精准转换。支持多种输出格式,包括txt、LaTeX、doc和pdf。用户只需上传图片,系统即可自动进行文本识别、拼写和语法校正。借助ChatGPT功能,GrabText进一步优化了文本处理的准确度和智能化水平。这一强大的图像转文本工具适用于学生、研究人员和各行业专业人士,为文字处理提供便捷高效的解决方案。无论是在线OCR、手写识别还是数学公式转换,GrabText都能满足您的需求。
Pix2Text - 开源Python工具,支持高精度数学公式检测和80多种语言的文本识别
GithubOCRPix2Text开源开源项目数学公式检测表格识别
Pix2Text是一款免费开源的Python工具,主要功能与Mathpix类似,能够将复杂布局的图像、表格、文本和数学公式转换为Markdown格式。它支持超过80种语言的文本识别,包括简体中文、繁体中文、英语和越南语。最新的V1.1.1版本引入了新的数学公式检测模型,大幅提升了识别准确性。用户也可以通过在线服务和演示来体验其强大功能。
eSearch - 跨平台截图工具 集成OCR搜索和录屏功能
GithubOCR识别eSearch开源项目截屏软件跨平台
eSearch是一款跨平台的开源截图工具,集成了OCR文字识别、搜索、翻译、贴图、以图搜图和录屏等功能。它支持Windows、Linux和macOS系统,并提供离线OCR识别和灵活的截图编辑选项。eSearch可快速识别和检索屏幕信息,适用于办公和学习场景,显著提高用户处理屏幕信息的效率。
doctr - 由深度学习提供支持的无缝、高性能和可访问的库,用于 OCR 相关任务
GithubOCRPyTorchTensorFlowdocTR开源项目文本识别
docTR提供高效、准确的OCR解决方案,支持PDF和图像文件,基于TensorFlow 2和PyTorch。能快速检测识别文档文字,并提供多种处理旋转文档选项。用户可使用预训练模型快速上手或自定义架构。解析结果可视化且支持导出为JSON格式,方便后续处理和分析。
mmocr - 一个基于 PyTorch 和 mmdetection 的用于文本检测、文本识别以及相应的下游任务,包括关键信息提取的开源工具箱
GithubMMOCROpenMMLabPyTorch开源项目文本检测文本识别
MMOCR是一个基于PyTorch和mmdetection的开源工具箱,提供全面的文本检测、文本识别及信息提取解决方案。它支持多种先进模型和模块化设计,允许用户自定义优化器、数据预处理和模型组件。最新版本v1.0.0新增支持SCUT-CTW1500、SynthText和MJSynth数据集,更新了FAQ和文档,并添加了新教程笔记本。适用于PyTorch 1.6+,欢迎研究人员和开发者贡献改进。
kraken - 优化历史文献和多语言文本识别的开源OCR系统
GithubOCR系统kraken历史文字识别开源项目文本识别非拉丁文识别
kraken是一个开源OCR系统,专注于历史文献和非拉丁文本识别。该系统提供可训练的布局分析、阅读顺序识别和字符识别功能,支持多种文字方向和脚本。kraken能够输出多种格式,并提供公共模型库和灵活的识别网络架构。该项目与eScriptorium密切合作,为用户提供全面的文本数字化解决方案。kraken目前支持Linux和Mac OS X平台。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号