#文字识别

魔撰写作 - 多功能AI写作助手
AI助手热门AI工具AI写作AI辅助写作文案生成器语音转文字文字识别mozhuan
魔撰写作是国内的AI写作平台,为写作者提供智能写作、文案提取、文风改写、多语言翻译等服务。利用AI技术,支持用户高效创作原创内容,润色文采,优化语句。适用于商务文案、学术文章和文艺创作,简化写作流程,提高效率。
OCRmyPDF - 扫描PDF文件的OCR转换与优化工具
Github开源项目多语言支持开源软件文字识别PDF文档OCRmyPDF
OCRmyPDF是一款开源的命令行工具,专门用于为扫描PDF文件添加OCR文本层。它支持多语言识别、页面旋转和倾斜校正,并能生成符合长期存储标准的PDF/A文件。此工具可优化PDF图像,常常生成比原文件更小的输出。OCRmyPDF利用多核处理技术,能高效处理大型文档,已在数百万PDF文件上得到验证。它为用户提供了将不可搜索的扫描文档转换为可搜索、可复制的PDF文件的简便方法。
OCR_DataSet - 综合OCR数据集资源库及工具集
Github开源项目深度学习计算机视觉数据集文字识别图像标注
OCR_DataSet项目整合了13个知名的多语言OCR数据集,涵盖ICDAR2015、MLT2019和COCO-Text_v2等。项目特色包括数据格式统一化、便捷的百度网盘下载、详尽的数据集信息表和简化的读取脚本。此外,项目还提供了数据生成工具链接,为OCR领域的研究和开发工作提供了全面的资源支持。
Umi-OCR - 高效离线OCR工具 支持多语言识别和灵活调用
Github开源项目文字识别截图OCRUmi-OCROCR软件批量识别
Umi-OCR是一款开源的文字识别工具,适用于Windows和Linux系统。它提供离线OCR引擎,支持截图识别、批量识别、PDF识别等功能。软件还具备二维码识别和生成、公式识别等特性。Umi-OCR支持多语言界面,可通过命令行和HTTP接口调用,是一款功能全面的OCR解决方案。
wangfreexx-tianruoocr-cl-paddle - 开源本地OCR识别和翻译软件
Github开源项目文字识别OCR软件paddle-ocrChinese-lite翻译功能
wangfreexx-tianruoocr-cl-paddle是一款开源的本地OCR识别软件,基于Chinese-lite和paddle-ocr技术。支持中文高效识别、条形码扫描和多种翻译接口,包括离线翻译功能。软件提供段落合并和自定义设置,适用于64位Windows系统,无需网络即可进行OCR识别。该项目为用户提供了一个全面的本地文字识别和翻译解决方案。
tessdoc - 多语言支持的开源文字识别引擎
Github开源项目OCR机器学习开源软件文字识别Tesseract
Tesseract是一款功能强大的开源OCR引擎,支持100多种语言和35种以上的文字。它提供命令行和API接口,可从图像中精确提取文本。Tesseract采用LSTM神经网络技术,具有高度可定制性,并配备完善的训练测试工具。该引擎可跨平台使用,包括移动设备,为开发者提供了灵活的文字识别解决方案。
GrabText - 多功能OCR识别与手写数学公式转换平台
AI工具文字识别手写识别OCR技术自动校正文本导出
GrabText提供免费在线OCR和图像文本识别服务,专注于手写文本和数学公式的精准转换。支持多种输出格式,包括txt、LaTeX、doc和pdf。用户只需上传图片,系统即可自动进行文本识别、拼写和语法校正。借助ChatGPT功能,GrabText进一步优化了文本处理的准确度和智能化水平。这一强大的图像转文本工具适用于学生、研究人员和各行业专业人士,为文字处理提供便捷高效的解决方案。无论是在线OCR、手写识别还是数学公式转换,GrabText都能满足您的需求。
mindocr - 基于MindSpore的开源OCR工具包 实现高效文本检测与识别
Github开源项目文字识别MindSpore文本检测MindOCROCR工具箱
MindOCR是一个基于MindSpore的开源OCR开发工具箱,集成主流文本检测和识别算法。该工具箱提供易用的训练和推理接口,加速文本检测识别模型的开发和部署。MindOCR支持DBNet、CRNN等多种算法,采用模块化设计,并提供高性能预训练模型。研究人员和开发者可以利用MindOCR快速构建OCR应用,实现高效的图像文本理解。
keras-ocr - 基于Keras的开源文本检测和OCR解决方案
Github开源项目深度学习图像处理计算机视觉文字识别keras-ocr
keras-ocr是一个开源的文本检测和OCR工具包,集成了CRAFT检测模型和CRNN识别模型。该项目提供高级API用于训练和部署OCR流程,支持Python 3.6+和TensorFlow 2.0.0+环境。keras-ocr自带预训练模型,在COCO-Text验证集上表现接近主流云服务。它为开发者提供了一个灵活、高效且易于使用的OCR开发平台。
JamTools - 多功能跨平台工具集 助力高效工作
Github开源项目多语言翻译文字识别录屏跨平台工具JamTools截屏
JamTools是一款开源的跨平台工具集软件,兼容Windows、macOS和Ubuntu系统。它整合了截屏、录屏、OCR识别、多语言翻译、多媒体处理、自动化操作录制、局域网传输等功能模块,旨在提高日常工作效率。该软件完全开源,为用户提供丰富实用的功能体验。
DAVAR-Lab-OCR - 多模态文档理解开源工具箱
Github开源项目文字识别算法实现开源代码库文档理解DAVAR-OCR
DAVAR-Lab-OCR是海康威视研究院DAVAR实验室开发的开源OCR仓库,实现了多项最新学术成果。该工具箱涵盖文本检测、识别和端到端识别等基础OCR任务,同时包含信息提取、表格识别和版面分析等文档理解功能。基于mmdetection和mmcv框架构建,具有良好的兼容性和扩展性,为OCR领域的研究和应用提供了综合解决方案。