Project Icon

manga-ocr

日本漫画光学字符识别工具,支持多种文本处理场景

Manga OCR 是一款基于Transformer的自定义端到端模型的光学字符识别工具,专为日本漫画设计。它可以识别垂直和平行文本、带有振假名的文本、覆盖在图像上的文本、各种字体以及低质量图像。Manga OCR 支持一次性识别多行文本,适用于漫画中的文本气泡。同时,该项目还提供与GUI阅读器和HTML覆盖生成工具的集成,便于用户创建完整的阅读和挖掘工作流程。

zotero-ocr - Zotero OCR插件实现PDF文献自动文本识别
GithubOCRPDFTesseractZotero开源项目插件
Zotero OCR是一个开源的Zotero插件,为PDF文献提供OCR文字识别功能。该插件可为选定PDF添加识别文本,生成新的文本化PDF,或创建纯文本笔记和HTML文件。基于Tesseract OCR引擎,支持多语言识别,并提供自定义配置选项。插件安装简便,有助于提升文献管理效率。
MangaOnlineViewer - 在线漫画阅读神器 整章加载流畅体验
GithubManga OnlineViewerTampermonkey开源项目浏览器扩展漫画阅读器用户脚本
MangaOnlineViewer是一款功能丰富的在线漫画阅读工具。它支持一次性加载整个章节,大幅提升阅读速度和体验。该工具提供多种阅读模式、自动滚动、书签和缩放等实用功能,并兼容众多漫画网站。用户可通过热键操作和自定义主题等个性化设置,获得流畅舒适的阅读体验。这款工具适合各类漫画爱好者使用,为在线漫画阅读带来全新体验。
zerox - 基于视觉模型的创新文档数字化工具
AIGPTGithubMarkdownZerox OCR开源项目文档处理
Zerox OCR是一款基于视觉模型的文档处理工具,通过将PDF转换为图像并使用GPT模型生成Markdown文本,有效处理复杂布局、表格和图表。与传统OCR服务相比,Zerox在准确度和表格处理方面表现出色,同时保持价格竞争力。该工具支持多种输入方式,提供灵活配置,为文档数字化提供了简单高效的解决方案。
tesserocr - Python封装的OCR引擎简化技术集成
GithubOCRPythonTesseract APItesserocr图像识别开源项目
tesserocr是基于Tesseract OCR引擎的Python封装库,通过Cython集成Tesseract C++ API。它提供简洁的Pythonic接口,支持多线程并发,可与Pillow库配合。tesserocr简化了OCR集成,便于开发者在Python项目中实现高效文字识别。该库支持多种图像格式,提供丰富的API功能,包括文本识别、布局分析和方向检测等。tesserocr支持多种语言识别、图像预处理、文本布局分析等高级功能。它还提供了简单的命令行接口,方便快速测试和使用。该库适用于各种OCR应用场景,如文档数字化、图像文本提取和自动化数据录入等。
surya - 开源多语言文档识别与分析工具
GithubOCRSurya多语言识别布局分析开源项目文档处理
Surya是一个开源文档OCR工具包,支持90多种语言的文本识别,性能可与云服务媲美。它提供行级文本检测、布局分析和阅读顺序检测等功能,适用于多种文档类型。Surya不仅识别文本,还能分析文档结构,为文档解析提供全面解决方案。该工具适合研究和个人使用,商业使用需注意相关许可条件。
pytorch-animeGAN - 基于PyTorch的轻量级GAN实现 快速将照片转换为动漫风格
AnimeGANGithub人工智能图像风格转换开源项目深度学习计算机视觉
pytorch-animeGAN是AnimeGAN的PyTorch实现,能够快速将真实照片转换为动漫风格。项目提供Hayao、Shinkai和Arcane等多种预训练模型,支持使用预训练模型进行推理或在自定义数据集上训练。除了图像转换,还支持视频转换和批量处理,并集成色彩迁移模块以保留原始图像颜色。该开源项目为开发者和研究人员提供了便捷的动漫风格转换工具。
OCR_DataSet - 综合OCR数据集资源库及工具集
Github图像标注开源项目数据集文字识别深度学习计算机视觉
OCR_DataSet项目整合了13个知名的多语言OCR数据集,涵盖ICDAR2015、MLT2019和COCO-Text_v2等。项目特色包括数据格式统一化、便捷的百度网盘下载、详尽的数据集信息表和简化的读取脚本。此外,项目还提供了数据生成工具链接,为OCR领域的研究和开发工作提供了全面的资源支持。
texify - 高效OCR模型,图像数学公式到Markdown和LaTeX的转换工具
GithubLaTeXOCRTexify图像转换开源项目机器学习
Texify是一个开源OCR模型,可将含数学公式的图像或PDF转换为Markdown和LaTeX格式。支持块级和内联公式,兼容CPU、GPU和MPS。基于多样化数据集训练,相较其他开源工具准确度更高。提供GUI、命令行和Python API,适用于多种场景。
STranslate - 多功能翻译和OCR工具,基于WPF开发
GithubOCRSTranslateWPF开源项目翻译工具
STranslate是一款多功能的翻译和OCR工具,基于WPF开发,满足各种翻译和文字识别需求。用户可以下载最新版本并参阅使用文档获取帮助。项目提供讨论社区,向所有贡献者和灵感来源致谢,并欢迎通过微信或支付宝进行捐赠支持。
animeBuilder - AI驱动的在线动漫风格转换与艺术图像生成平台
AI工具AI绘图AnimeBuilder动漫风格图像转换在线工具
animeBuilder为用户提供免费、高效的在线AI工具,实现图片动漫风格转换和文本艺术图像生成。无需注册,即可享受专业级创作体验。该平台助力设计师提升效率,激发产品创意灵感。注重用户隐私保护,不存储个人信息。animeBuilder持续优化服务,致力于为创作者提供更优质的在线工具。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号