Project Icon

Text-Grab

多功能OCR工具实现屏幕文本快速提取与编辑

Text Grab是一款Windows平台的OCR工具,可从屏幕、图像和视频中提取文本。它提供全屏抓取、框选抓取、文本编辑和快速查找等功能,支持本地OCR识别,无需后台运行。该工具还具备文本处理、正则提取和批量图像OCR等功能,适用于提高文字工作效率。

ksnip - 跨平台截图工具:丰富标注功能助力高效截图
Githubksnip图像注释开源软件开源项目截图工具跨平台
ksnip是一款跨平台截图工具,支持Linux、Windows和macOS系统。它提供多种截图方式,包括自定义区域、全屏和活动窗口等。ksnip具备丰富的标注功能,如画笔、文本和贴纸等,还支持模糊和像素化处理。此外,ksnip可上传图片至imgur和FTP,支持命令行操作,并提供全局热键和OCR插件功能。作为一款开源工具,ksnip为用户提供了灵活且功能强大的截图解决方案。
ScreenApp - 一站式AI音视频录制转录和智能分析平台
AIAI工具ScreenApp录音总结转录
ScreenApp集成了AI驱动的屏幕、音频和视频录制功能,可自动生成文字稿、摘要和笔记。通过智能分析、总结和翻译等AI功能,用户可以快速提取关键信息。该工具适用于会议记录、教育培训和客户支持等多种场景,有效提升工作效率。ScreenApp还支持与录制内容进行对话式互动,为用户提供全方位的音视频处理解决方案。
jusText - 智能网页正文提取工具 保留核心内容
GithubPython库jusText开源项目文本提取网页清理
jusText是一个开源的网页内容提取工具,专注于保留网页中的核心文本信息。该工具可自动移除导航栏、页眉页脚等非核心内容,仅保留完整句子组成的主体文本。jusText广泛应用于语言资源构建和网络语料库创建。它支持Python、C++、Go和Java等多种编程语言,并为用户提供简洁的命令行接口和Python API,便于快速集成到现有项目中。
wcap - 轻量级Windows屏幕录制工具
GithubWindows工具wcap屏幕录制开源项目视频编码音频捕获
wcap是一款开源的Windows屏幕录制工具,支持多显示器、活动窗口和固定区域录制。该工具采用Windows.Graphics.Capture API和硬件加速编码,提供H264/AVC和H265/HEVC视频编码,以及AAC和FLAC音频编码选项。wcap特点是系统资源占用低,操作简便,并允许用户自定义快捷键和录制参数。适用于Windows 10版本1903及以上系统。
Clipboard - 功能强大的开源剪贴板管理器 提升工作效率
Clipboard ProjectGithub剪贴板管理器开源开源项目生产力工具跨平台
Clipboard 是一款开源的剪贴板管理工具,支持无限数量的剪贴板和历史记录。它可以复制粘贴文本、文件、目录等多种内容,具有优秀的性能和友好的界面。该工具提供多语言支持、可编程 API 和详细文档,旨在帮助用户更高效地管理剪贴板内容。Clipboard 的轻量快速特性,使其成为提升工作效率的理想选择。
rem - Mac屏幕内容实时捕捉与搜索工具
AI记忆Githubrem屏幕录制开源软件开源项目本地搜索
rem是一款为Mac设计的开源屏幕内容记录工具。它通过定期截屏和文本识别,实时保存屏幕信息,并提供回溯和搜索功能。用户可查看历史画面、复制过去的文本,以及搜索曾浏览的内容。rem支持多显示器,计划引入自然语言搜索等功能,旨在优化计算机交互体验。作为本地运行的开源项目,rem确保用户数据的隐私和安全。
simple-ocr-opencv - 基于OpenCV和NumPy的轻量级Python OCR工具
GithubOCROpenCVPython图像识别开源项目机器学习
simple-ocr-opencv是一个基于OpenCV和NumPy的Python OCR工具。它采用矩形模型进行图像分割,使用k-NN算法实现字符分类。项目结构清晰,包含示例代码,支持自定义训练,并提供预标注训练图像和交互式标注功能。开发者可通过example.py快速上手。这个开源项目遵循GNU AGPLv3许可证,适合需要实现基础OCR功能的开发者使用。
keras-ocr - 基于Keras的开源文本检测和OCR解决方案
Githubkeras-ocr图像处理开源项目文字识别深度学习计算机视觉
keras-ocr是一个开源的文本检测和OCR工具包,集成了CRAFT检测模型和CRNN识别模型。该项目提供高级API用于训练和部署OCR流程,支持Python 3.6+和TensorFlow 2.0.0+环境。keras-ocr自带预训练模型,在COCO-Text验证集上表现接近主流云服务。它为开发者提供了一个灵活、高效且易于使用的OCR开发平台。
PDF-Extract-Kit - 全面高效的PDF文档内容提取工具包
GithubPDF提取公式识别布局检测开源项目文档内容表格识别
PDF-Extract-Kit是一款集成多种先进技术的PDF内容提取工具包。它结合了LayoutLMv3布局分析、YOLOv8公式检测、UniMERNet公式识别、StructEqTable表格识别和PaddleOCR文字识别等功能,能够准确高效地提取各类PDF文档中的结构化内容。该工具适用于学术论文、教科书、研究报告和财务报表等多种文档类型,即使面对扫描质量欠佳或带有水印的PDF文件,也能保持稳定的提取效果。
mmocr - 一个基于 PyTorch 和 mmdetection 的用于文本检测、文本识别以及相应的下游任务,包括关键信息提取的开源工具箱
GithubMMOCROpenMMLabPyTorch开源项目文本检测文本识别
MMOCR是一个基于PyTorch和mmdetection的开源工具箱,提供全面的文本检测、文本识别及信息提取解决方案。它支持多种先进模型和模块化设计,允许用户自定义优化器、数据预处理和模型组件。最新版本v1.0.0新增支持SCUT-CTW1500、SynthText和MJSynth数据集,更新了FAQ和文档,并添加了新教程笔记本。适用于PyTorch 1.6+,欢迎研究人员和开发者贡献改进。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号