Project Icon

magi

漫画内容自动转录与角色识别系统

Magi是一个开源项目,致力于自动生成漫画转录和角色识别。该系统可以定位文本框、识别说话人物,并生成漫画对话转录。Magiv2版本支持整章漫画处理和角色名称识别。Magi为研究人员和漫画爱好者提供了获取漫画文本内容的工具,提高了漫画的可访问性和分析便利性。

ACG2vec - 基于动漫和漫画的高级深度学习项目
ACG2vecGithub图片搜索开源项目插画评分文本搜索深度学习
本项目持续致力于二次元主题的深度学习研究,包括了文本搜索、以图搜图、插画评分预测和图片超分辨率等功能。模型集成了acgvoc2vec、dclip、pix2score、illust2vec和real-cugan_tf等,适用于标签推荐、推荐系统和动漫插图质量评估等应用场景。项目源码托管在GitHub,并通过网页服务提供便捷的标签预测和搜索功能。使用Huggingface平台上的模型,用户可以在线体验这些前沿技术,提升二次元内容处理的效率。
Magai - 集成多种先进AI模型和工具的综合平台
AI工具AI平台AI模型ChatGPTMagai图像生成
Magai整合了ChatGPT、Claude、Gemini等多个AI模型,以及Dall-E、Stable Diffusion等图像生成工具,为用户提供统一的AI服务访问。平台配备聊天文件夹、提示库、网页阅读等功能,帮助用户高效组织和利用AI内容。支持团队协作,适用于各类企业和个人。单一订阅即可使用多种AI产品,简化了AI工具的使用和管理流程。
MomoTranslator - 开源漫画翻译辅助工具 自动识别文本并翻译
ChatGPTGithubMomoTranslatorOpenCV开源项目气泡检测漫画翻译
MomoTranslator是一个基于OpenCV的开源漫画翻译辅助工具。该软件能自动识别画格和气泡,对文本进行排序,并集成谷歌和ChatGPT的翻译功能。MomoTranslator不依赖PyTorch,具有简洁的图形界面,适合漫画翻译爱好者和专业人士使用。这款工具旨在提升漫画翻译的效率,简化翻译流程。
BallonsTranslator - 深度学习支持的漫画翻译和图像/文本编辑工具,提供一键翻译功能
BallonsTranslatorGithub图像编辑开源项目文本编辑深度学习漫画翻译
BallonsTranslator是一款深度学习辅助的漫画翻译工具,提供一键翻译和简单的图像、文本编辑功能,包括译文回填、掩膜编辑、修复画笔和富文本编辑。支持日漫和美漫,并优化了英译中和日译英的排版,适用于条漫。只需简单配置,即可启动程序,便捷高效地翻译和编辑漫画。
Open-MAGVIT2 - 自回归视觉生成新突破 大幅提升图像分词性能
GithubOpen-MAGVIT2图像分词器大规模词表开源项目自回归模型视觉生成
Open-MAGVIT2是一个创新的自回归视觉生成项目,采用无查找技术和262144大小的码本,克服了VQGAN的局限性。该项目用PyTorch重新实现MAGVIT2分词器,在图像分词方面取得显著进展,8倍下采样时rFID达到0.39。项目致力于推动自回归视觉生成领域发展,目前处于积极开发阶段,未来计划拓展至视频生成领域。
PanelCleaner - 基于机器学习的漫画文本清理工具
GithubOCRPanel Cleaner图像处理开源项目文本检测机器学习
PanelCleaner 是一款开源的漫画文本清理工具,采用机器学习技术精确识别文本区域并生成高质量遮罩。该工具能自动清理简单对话气泡,支持批量处理和自定义清理参数,并提供OCR文本提取功能。通过直观的图形界面,PanelCleaner 可大幅提高漫画翻译效率,减少重复性工作,同时避免误删非文本内容。
ai-comic-factory - AI驱动的漫画创作平台 简化创意表达过程
AI Comic FactoryAPI配置Github图像生成开源项目语言模型
AI Comic Factory是一个开源的AI漫画创作平台,通过输入文字提示即可生成漫画作品。该项目结合了大型语言模型和图像生成技术,为创作者提供便捷的创作工具。平台支持多种配置选项,包括不同的语言模型和渲染引擎,可满足各类创作需求。AI Comic Factory简化了漫画创作流程,使得将创意转化为视觉故事变得更加容易。项目使用开源技术,包括Hugging Face的text-generation-inference和stabilityai的stable-diffusion-xl模型。用户可根据需求选择不同的语言模型引擎,如INFERENCE_API、INFERENCE_ENDPOINT、OPENAI、GROQ或ANTHROPIC。渲染引擎选项包括INFERENCE_API、INFERENCE_ENDPOINT、REPLICATE、VIDEOCHAIN和OPENAI。AI Comic Factory支持多种配置,可适应不同的应用场景和技术需求。
AI Comic Generator Factory - AI在线漫画创作平台
AI工具AI漫画生成器人工智能创意工具漫画创作视觉叙事
AI Comic Generator Factory是一个创新的在线漫画创作平台,利用人工智能技术帮助用户创作独特漫画。平台提供多种风格选择,包括美式和日本漫画,无需绘画技能即可通过描述生成内容。灵活的布局选项、字幕功能和重绘特性让用户能不断完善作品。这个工具为漫画爱好者提供了便捷的创意实现方式。
MagickImg - 综合AI图像处理和优化工具集
AI图像增强AI工具Magickimg图像处理深度学习订阅服务
MagickImg是一款强大的AI图像编辑器,运用深度学习技术提供全面的图像处理解决方案。平台功能丰富,包括图像增强、分辨率提升、黑白照片上色、卡通化转换和自动背景移除等。操作简便直观,用户可快速获得高质量图像成果。注重数据安全,严格保护用户隐私。提供免费试用额度,让用户体验后选择最适合的订阅计划。MagickImg——您的一站式AI图像处理平台,助力提升工作效率与创作质量。
mokuro - 日本漫画OCR工具,为学习者提供可选文本阅读体验
GithubOCR技术mokuro开源项目文本检测日语漫画阅读器
mokuro是一个开源项目,为日语学习者提供了便捷的漫画阅读工具。该工具通过文本检测和OCR技术,将日本漫画中的文字转换为可选文本。mokuro离线处理漫画页面,生成包含OCR结果的.mokuro文件,用户可通过网页阅读器浏览处理后的漫画。支持弹出字典功能,方便学习者查询生词。此外,mokuro具备多卷处理能力,并兼容旧版HTML格式,适合各类漫画爱好者和日语学习者使用。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号