#OCR

AutoNode 学习资料汇总 - 一款自学习的认知型 GUI 自动化引擎

2024年09月10日
Cover of AutoNode 学习资料汇总 - 一款自学习的认知型 GUI 自动化引擎

Bob学习资料汇总 - macOS平台强大的翻译和OCR软件

2024年09月10日
Cover of Bob学习资料汇总 - macOS平台强大的翻译和OCR软件

Sparrow学习资料汇总 - 高效数据处理与提取的开源解决方案

2024年09月10日
Cover of Sparrow学习资料汇总 - 高效数据处理与提取的开源解决方案

LARS - 本地运行LLM的开源应用学习指南 - 支持文档引用的AI助手

2024年09月10日
Cover of LARS - 本地运行LLM的开源应用学习指南 - 支持文档引用的AI助手

layout-parser入门学习资料 - 文档图像分析深度学习统一工具包

2024年09月10日
Cover of layout-parser入门学习资料 - 文档图像分析深度学习统一工具包

PaddleOCR学习资源汇总 - 强大的多语种OCR工具库

2024年09月10日
Cover of PaddleOCR学习资源汇总 - 强大的多语种OCR工具库

xrem: 跨平台开源本地记录和搜索工具

2024年09月05日
Cover of xrem: 跨平台开源本地记录和搜索工具

TFT-OCR-BOT:一款基于OCR技术的《云顶之弈》自动化游戏助手

2024年09月05日
Cover of TFT-OCR-BOT:一款基于OCR技术的《云顶之弈》自动化游戏助手

Simple-OCR-OpenCV: 基于OpenCV和Python的简单OCR引擎

2024年09月05日
Cover of Simple-OCR-OpenCV: 基于OpenCV和Python的简单OCR引擎

MORT: 实时游戏翻译器项目

2024年09月05日
Cover of MORT: 实时游戏翻译器项目
相关项目
Project Cover

layout-parser

LayoutParser提供多种深度学习模型和统一API,简化文档图像分析任务。支持布局检测、OCR、数据可视化等功能,并允许共享模型和分析流程。安装简便,可根据需求选择依赖项,是文档图像处理的理想工具。

Project Cover

PaddleOCR

PaddleOCR旨在为开发者提供一套丰富、领先且实用的OCR工具库,帮助开发者快速训练并部署OCR模型。它不仅支持中英文识别,还支持多语言和多硬件平台,包括最新的PP-OCRv4模型,有效提高了中英文场景下的识别精确度。适用于移动端和服务器端,适配多种开发需求。

Project Cover

LARS

LARS是一个开源应用,允许在本地设备运行大型语言模型(LLM),支持上传个人文件,以及通过检索增强生成(RAG)技术增强对话准确度和减少生成误差。特点包括精确文献引用、多种文件格式支持、全历史聊天记录和GPU加速。用户可以自定义LLM设置,优化使用体验。

Project Cover

sparrow

Sparrow是一个开源解决方案,专注于高效从各类文档和图像中提取与处理数据。它通过模块化架构提供独立的服务和优化的流程,支持表格、发票、收据等非结构化数据源。Sparrow的API支持本地语言模型数据提取,可与自定义工作流程集成。

Project Cover

Bob

Bob为macOS用户提供全方位的翻译与OCR解决方案,支持文本、截图、输入及OCR翻译等多样化功能。整合了主流翻译引擎,如Google翻译和腾讯翻译君,确保准确快速地完成翻译任务。其高效的OCR技术,适用于多种应用场景,简化了文本识别过程。Bob的简洁界面和强大功能,使其成为提升Mac用户工作效率的优选工具。

Project Cover

Easydict

Easydict是专为macOS开发的词典翻译工具,提供词汇查找、全文翻译和OCR识别功能。整合了多种翻译平台,包括有道、苹果系统词典和Google。涵盖48种语言,并配备自动语种识别与智能查询,实现便捷高效的翻译体验。

Project Cover

llm_aided_ocr

该系统利用自然语言处理、机器学习和智能文本处理技术,将OCR输出的文本转换为高精度、格式化良好的易读文档。它解决了字符识别错误、段落结构不正确、虚构内容和格式不一致等常见OCR问题。支持从PDF到图像的转换,使用Tesseract进行OCR,并提供通过本地或API接口进行高级错误校正、智能文本分块处理和Markdown格式化等功能。此外,还采用FAISS和嵌入相似性检查进行内容过滤,确保输出文本的质量和一致性。

Project Cover

AutoNode

AutoNode 是一种自操作计算机系统,专注于实现网页交互和数据提取的自动化。它使用光学字符识别(OCR)和 YOLO 模型进行对象检测,结合自定义站点图来程序化地导航和操作网页。只需安装 Python 和 Docker,配置站点图并使用 API,即可轻松完成高效的网页自动化任务。AutoNode 还支持远程托管 YOLO 和 OCR 模块,适合本地资源有限的环境。

Project Cover

EasyOCR

EasyOCR是一款支持80多种语言和主要书写系统(如拉丁文、中文、阿拉伯文等)的光学字符识别(OCR)工具。它提供简单的安装和使用指南,帮助快速实现文本检测与识别,适用于多种场景。最新版本增加了Apple Silicon支持并修复了兼容性问题。未来版本将支持手写文本识别,进一步增强其功能。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号