Project Icon

simple-ocr-opencv

基于OpenCV和NumPy的轻量级Python OCR工具

simple-ocr-opencv是一个基于OpenCV和NumPy的Python OCR工具。它采用矩形模型进行图像分割,使用k-NN算法实现字符分类。项目结构清晰,包含示例代码,支持自定义训练,并提供预标注训练图像和交互式标注功能。开发者可通过example.py快速上手。这个开源项目遵循GNU AGPLv3许可证,适合需要实现基础OCR功能的开发者使用。

deepdoctection - 文档AI:基于深度学习的提取与布局分析工具包
GithubOCRdeepdoctection开源项目文档AI模型深度学习
deepdoctection是一个Python库,通过深度学习模型实现文档提取和布局分析,支持对象检测、OCR和文本挖掘。此集成框架结合Tensorflow或PyTorch等库,适用于PDF或扫描图片文档处理,支持文档布局分析、表格识别和文本分类等任务,致力于解决实际应用问题,是文档处理领域开发者的理想选择。
surya - 开源多语言文档识别与分析工具
GithubOCRSurya多语言识别布局分析开源项目文档处理
Surya是一个开源文档OCR工具包,支持90多种语言的文本识别,性能可与云服务媲美。它提供行级文本检测、布局分析和阅读顺序检测等功能,适用于多种文档类型。Surya不仅识别文本,还能分析文档结构,为文档解析提供全面解决方案。该工具适合研究和个人使用,商业使用需注意相关许可条件。
wangfreexx-tianruoocr-cl-paddle - 开源本地OCR识别和翻译软件
Chinese-liteGithubOCR软件paddle-ocr开源项目文字识别翻译功能
wangfreexx-tianruoocr-cl-paddle是一款开源的本地OCR识别软件,基于Chinese-lite和paddle-ocr技术。支持中文高效识别、条形码扫描和多种翻译接口,包括离线翻译功能。软件提供段落合并和自定义设置,适用于64位Windows系统,无需网络即可进行OCR识别。该项目为用户提供了一个全面的本地文字识别和翻译解决方案。
SmartOpenCV - Android平台的增强型计算机视觉库
GithubOpenCVSmartOpenCV图像处理开源项目端侧智能计算机视觉
SmartOpenCV是一个用于Android平台的增强型OpenCV库,解决了官方SDK在图像预览中的问题。无需修改SDK源码,只需替换xml标签,即可自动适应摄像头参数、横竖屏切换及预览帧大小。该库支持USB摄像头,提供友好的API接口,方便开发者灵活控制预览显示。SmartOpenCV与官方SDK解耦,确保项目能够轻松升级至最新版本。
normcap - 跨平台OCR截图工具 智能提取文本信息
GithubNormCapOCR开源开源项目截图工具跨平台
NormCap是一款基于OCR技术的屏幕截图工具,适用于Linux、macOS和Windows系统。这款开源软件不仅可以捕获图像,还能智能识别并提取图像中的文本信息。NormCap支持多语言识别,界面简洁易用。无论是日常办公还是学术研究,NormCap都能协助快速获取所需的文字内容,提高工作效率。
Text-Grab - 多功能OCR工具实现屏幕文本快速提取与编辑
GithubOCRWindows应用开源项目快速查找文本提取文本编辑
Text Grab是一款Windows平台的OCR工具,可从屏幕、图像和视频中提取文本。它提供全屏抓取、框选抓取、文本编辑和快速查找等功能,支持本地OCR识别,无需后台运行。该工具还具备文本处理、正则提取和批量图像OCR等功能,适用于提高文字工作效率。
SmartCropper - 智能图片裁剪库,适用于身份证、名片和文档
GithubSmartCropperTensorFlowopencv开源项目智能图片裁剪机器学习
SmartCropper 是一个智能图片裁剪库,适用于身份证、名片和文档等照片。它使用基于 OpenCV 的智能算法识别边框,提供拖动锚点手动调节选区和放大镜定位功能,并通过透视变换裁剪和矫正选区来还原正面图片。该库支持丰富的 UI 设置,包括辅助线、蒙版、锚点和放大镜等,通过使用 TensorFlow 的 HED 网络优化智能选区算法,提高识别率,尤其适用于大图片的高效裁剪。
Picture to Text - 智能OCR技术实现在线图片文字快速提取
AI工具OCR技术图像转文字多语言支持文本提取文档数字化
Picture to Text是一款在线图片文字提取工具,采用OCR技术支持多种图片格式和语言。可快速将图片文字转换为可编辑文本,支持批量处理提高效率。工具操作简单,免费无需注册,适合学生、职场人士和研究人员使用。
OCR_DataSet - 综合OCR数据集资源库及工具集
Github图像标注开源项目数据集文字识别深度学习计算机视觉
OCR_DataSet项目整合了13个知名的多语言OCR数据集,涵盖ICDAR2015、MLT2019和COCO-Text_v2等。项目特色包括数据格式统一化、便捷的百度网盘下载、详尽的数据集信息表和简化的读取脚本。此外,项目还提供了数据生成工具链接,为OCR领域的研究和开发工作提供了全面的资源支持。
labelImg - Python图像标注工具,兼容PASCAL VOC和YOLO格式
GithubLabel StudioLabelImgPython图像注释开源项目数据标注工具
一款用Python编写的开源图像标注工具,适用于深度学习数据集的创建。支持PASCAL VOC、YOLO和CreateML等多种标注格式,可在Linux、macOS、Windows等平台上运行,并提供详细的安装和使用指南。用户可以通过直观的界面创建矩形框标注,支持预定义类、热键操作和Docker部署,是机器学习和计算机视觉项目的数据标注利器。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号