#OCR识别

video-subtitle-extractor - 多语言视频字幕批量提取工具,支持GPU加速和多种提取模式
Github开源项目Video-subtitle-extractor字幕提取OCR识别批量提取GPU加速
Video-subtitle-extractor是一款高效的视频字幕提取工具,可以将视频中的硬字幕提取为外挂字幕文件(srt格式)。支持批量处理、多语言字幕提取和水印去除,适用于Windows、macOS和Linux系统。用户可选择快速、自动或精准模式,使用GPU加速提高提取速度和准确度。本地OCR识别无需连接在线服务,适合对字幕提取有高要求的用户。
eSearch - 跨平台截图工具 集成OCR搜索和录屏功能
Github开源项目跨平台OCR识别eSearch截屏软件
eSearch是一款跨平台的开源截图工具,集成了OCR文字识别、搜索、翻译、贴图、以图搜图和录屏等功能。它支持Windows、Linux和macOS系统,并提供离线OCR识别和灵活的截图编辑选项。eSearch可快速识别和检索屏幕信息,适用于办公和学习场景,显著提高用户处理屏幕信息的效率。
pdfdeal - PDF文本提取与优化工具 支持多种OCR引擎
Github开源项目OCR识别PDF处理pdfdeal知识库构建Doc2X
pdfdeal是一个开源的PDF处理工具,专注于提取和优化文本内容。该工具支持多种OCR引擎,包括Doc2X,可实现PDF文本提取、图像文字识别和格式优化。pdfdeal支持多种文件格式,并提供与graphrag等检索增强生成(RAG)工具的集成指南,有助于提高知识库构建效率。