texify

高效OCR模型，图像数学公式到Markdown和LaTeX的转换工具

Texify是一个开源OCR模型，可将含数学公式的图像或PDF转换为Markdown和LaTeX格式。支持块级和内联公式，兼容CPU、GPU和MPS。基于多样化数据集训练，相较其他开源工具准确度更高。提供GUI、命令行和Python API，适用于多种场景。

访问官网

文档

Text-Grab - 多功能OCR工具实现屏幕文本快速提取与编辑

GithubOCRWindows应用开源项目快速查找文本提取文本编辑

Text Grab是一款Windows平台的OCR工具，可从屏幕、图像和视频中提取文本。它提供全屏抓取、框选抓取、文本编辑和快速查找等功能，支持本地OCR识别，无需后台运行。该工具还具备文本处理、正则提取和批量图像OCR等功能，适用于提高文字工作效率。

PDF-Extract-Kit - 全面高效的PDF文档内容提取工具包

GithubPDF提取公式识别布局检测开源项目文档内容表格识别

PDF-Extract-Kit是一款集成多种先进技术的PDF内容提取工具包。它结合了LayoutLMv3布局分析、YOLOv8公式检测、UniMERNet公式识别、StructEqTable表格识别和PaddleOCR文字识别等功能,能够准确高效地提取各类PDF文档中的结构化内容。该工具适用于学术论文、教科书、研究报告和财务报表等多种文档类型,即使面对扫描质量欠佳或带有水印的PDF文件,也能保持稳定的提取效果。

marktext - 功能强大的跨平台Markdown编辑器

GithubMarkTextMarkdown编辑器实时预览开源软件开源项目跨平台

MarkText是一款跨平台的开源Markdown编辑器,支持实时预览和多种Markdown规范。它提供多种主题和编辑模式,可输出HTML和PDF文件。MarkText界面简洁,专注写作体验,适合各类Markdown用户使用。该软件支持Linux、macOS和Windows系统,是一个功能全面的Markdown编辑工具。

TRex - 高效屏幕文本识别与提取工具

GithubOCRTRexmacOS开源项目文本提取菜单栏应用

TRex是一款功能强大的OCR工具，可从屏幕上的任何内容中提取文字。支持PDF、截图和视频等多种格式，无需网络连接即可使用。该工具提供菜单栏快捷访问、全局快捷键和自定义词库等功能，并支持自动化操作和URL scheme集成。TRex适用于各种工作和学习场景，能够快速、准确地获取文本信息。

TextIn - 一站式智能文档处理平台，支持多种应用场景

AI工具TextIn合同机器人图像智能处理大模型加速器智能文字识别

TextIn是一个智能文档处理平台，提供OCR文字识别、图像处理、文件转换和大模型加速等功能。支持云端API、端侧SDK和私有化部署，适合企业、开发者及个人用户使用，并可以与OA/ERP等系统无缝对接，提升办公效率，广泛应用于各类文档场景。

attention-ocr - 基于注意力机制的视觉OCR模型，实现与导出工具

Attention-OCRGithubOCRTensorflow人工智能图像识别开源项目

该项目提供了基于注意力机制的OCR模型，结合了CNN与LSTM，用于图像识别，并能够导出为SavedModel或frozen graph格式。用户可以通过生成TFRecords数据集、训练、测试及可视化等步骤完整运行该OCR系统。项目还支持通过Tensorflow Serving提供REST API服务，并可以在Google Cloud ML Engine上进行模型训练。目前该项目依赖Tensorflow 1.x，未来计划升级到Tensorflow 2。

deepdoctection - 文档AI：基于深度学习的提取与布局分析工具包

GithubOCRdeepdoctection开源项目文档AI模型深度学习

deepdoctection是一个Python库，通过深度学习模型实现文档提取和布局分析，支持对象检测、OCR和文本挖掘。此集成框架结合Tensorflow或PyTorch等库，适用于PDF或扫描图片文档处理，支持文档布局分析、表格识别和文本分类等任务，致力于解决实际应用问题，是文档处理领域开发者的理想选择。

EasyOCR - 支持80多种语言文字识别工具

CRNNDBnetEasyOCRGithubOCRPytorch开源项目

EasyOCR是一款支持80多种语言和主要书写系统（如拉丁文、中文、阿拉伯文等）的光学字符识别（OCR）工具。它提供简单的安装和使用指南，帮助快速实现文本检测与识别，适用于多种场景。最新版本增加了Apple Silicon支持并修复了兼容性问题。未来版本将支持手写文本识别，进一步增强其功能。

TEXTOIR - 开放式意图识别的综合工具包

GithubTEXTOIR开放集分类开源项目意图识别聚类自然语言处理

TEXTOIR是一个专注于开放式意图检测和发现的综合工具包。它集成了最新算法,提供可扩展接口和统一数据设置,便于研究人员进行公平可复现的实验。该项目支持多个基准数据集,持续更新模型和方法,并配有可视化平台。TEXTOIR致力于推动文本开放意图识别领域的研究进展。

RapidOCR - 开源多语言OCR工具支持跨平台快速部署

GithubONNXRapidOCR多平台多语言开源OCR开源项目

RapidOCR是一个开源的多平台、多语言OCR工具，具有高速识别和广泛兼容性。该工具支持快速离线部署，采用ONNXRuntime推理引擎，识别速度显著优于PaddlePaddle引擎。RapidOCR内置中英文识别功能，同时支持其他语言的自定义转换。基于深度学习技术，RapidOCR注重轻量化设计和高效性能，适用于快速OCR部署和定制化需求场景。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com