Project Icon

ai-comic-factory

AI驱动的漫画创作平台 简化创意表达过程

AI Comic Factory是一个开源的AI漫画创作平台,通过输入文字提示即可生成漫画作品。该项目结合了大型语言模型和图像生成技术,为创作者提供便捷的创作工具。平台支持多种配置选项,包括不同的语言模型和渲染引擎,可满足各类创作需求。AI Comic Factory简化了漫画创作流程,使得将创意转化为视觉故事变得更加容易。项目使用开源技术,包括Hugging Face的text-generation-inference和stabilityai的stable-diffusion-xl模型。用户可根据需求选择不同的语言模型引擎,如INFERENCE_API、INFERENCE_ENDPOINT、OPENAI、GROQ或ANTHROPIC。渲染引擎选项包括INFERENCE_API、INFERENCE_ENDPOINT、REPLICATE、VIDEOCHAIN和OPENAI。AI Comic Factory支持多种配置,可适应不同的应用场景和技术需求。


title: AI漫画工厂 emoji: 👩‍🎨 colorFrom: red colorTo: yellow sdk: docker pinned: true app_port: 3000 disable_embedding: false short_description: 用一个提示创建你自己的AI漫画 hf_oauth: true hf_oauth_expiration_minutes: 43200 hf_oauth_scopes: [inference-api]

AI漫画工厂

最新版本:AI漫画工厂1.2

AI漫画工厂即将拥有官方网站:aicomicfactory.app

有关我其他项目的更多信息,请查看linktr.ee/FLNGR

在家运行项目

首先,我想强调所有内容都是开源的(参见这里这里这里这里)。

然而,该项目并非可以立即复制和运行的单一Space:它需要各种组件来运行前端、后端、LLM、SDXL等。

如果你尝试复制项目,打开.env文件,你会看到它需要一些变量。

提供商配置:

  • LLM_ENGINE:可以是INFERENCE_APIINFERENCE_ENDPOINTOPENAIGROQANTHROPIC之一
  • RENDERING_ENGINE:目前可以是"INFERENCE_API"、"INFERENCE_ENDPOINT"、"REPLICATE"、"VIDEOCHAIN"、"OPENAI"之一,除非你编写自定义解决方案

认证配置:

  • AUTH_HF_API_TOKEN:如果你决定使用Hugging Face作为LLM引擎(推理API模型或自定义推理端点)
  • AUTH_OPENAI_API_KEY:使用OpenAI作为LLM引擎
  • AUTH_GROQ_API_KEY:使用Groq作为LLM引擎
  • AUTH_ANTHROPIC_API_KEY:使用Anthropic(Claude)作为LLM引擎
  • AUTH_VIDEOCHAIN_API_TOKEN:访问VideoChain API服务器的密钥令牌
  • AUTH_REPLICATE_API_TOKEN:如果你想使用Replicate.com

渲染配置:

  • RENDERING_HF_INFERENCE_ENDPOINT_URL:如果你决定使用自定义推理端点,则必需
  • RENDERING_REPLICATE_API_MODEL_VERSION:VideoChain API服务器的URL
  • RENDERING_HF_INFERENCE_ENDPOINT_URL:可选,默认为空
  • RENDERING_HF_INFERENCE_API_BASE_MODEL:可选,默认为"stabilityai/stable-diffusion-xl-base-1.0"
  • RENDERING_HF_INFERENCE_API_REFINER_MODEL:可选,默认为"stabilityai/stable-diffusion-xl-refiner-1.0"
  • RENDERING_REPLICATE_API_MODEL:可选,默认为"stabilityai/sdxl"
  • RENDERING_REPLICATE_API_MODEL_VERSION:可选,如果你想更改版本

语言模型配置(取决于你决定使用的LLM引擎):

  • LLM_HF_INFERENCE_ENDPOINT_URL:"<使用你自己的>"
  • LLM_HF_INFERENCE_API_MODEL:"HuggingFaceH4/zephyr-7b-beta"
  • LLM_OPENAI_API_BASE_URL:"https://api.openai.com/v1"
  • LLM_OPENAI_API_MODEL:"gpt-4-turbo"
  • LLM_GROQ_API_MODEL:"mixtral-8x7b-32768"
  • LLM_ANTHROPIC_API_MODEL:"claude-3-opus-20240229"

此外,还有一些社区共享变量,你可以忽略它们。 这些变量不是在你自己的网站或计算机上运行AI漫画工厂所必需的 (它们旨在与Hugging Face社区建立连接, 因此只适用于官方Hugging Face应用程序):

  • NEXT_PUBLIC_ENABLE_COMMUNITY_SHARING:你不需要这个
  • COMMUNITY_API_URL:你不需要这个
  • COMMUNITY_API_TOKEN:你不需要这个
  • COMMUNITY_API_ID:你不需要这个

请阅读.env默认配置文件以获取更多信息。 要在本地自定义变量,你应该创建一个.env.local文件 (不要提交这个文件,因为它会包含你的秘密)。

-> 如果你打算使用本地、云托管和/或专有模型运行它,你需要编写代码👨‍💻

LLM API(大型语言模型)

目前,AI漫画工厂通过推理端点使用zephyr-7b-beta

你有多个选项:

选项1:使用推理API模型

这是最近新增的选项,你可以使用Hugging Face Hub上的一个模型。默认情况下,我们建议使用zephyr-7b-beta,因为它会提供比7b模型更好的结果。

要激活它,请创建一个.env.local配置文件:

LLM_ENGINE="INFERENCE_API"

HF_API_TOKEN="你的Hugging Face令牌"

# 默认使用"HuggingFaceH4/zephyr-7b-beta",但你可以更改这个
# 注意:你应该使用能够生成JSON响应的模型,
# 因此强烈建议至少使用34b模型
HF_INFERENCE_API_MODEL="HuggingFaceH4/zephyr-7b-beta"

选项2:使用推理端点URL

如果你想在运行在Hugging Face推理端点服务上的私有LLM上运行AI漫画工厂,请创建一个.env.local配置文件:

LLM_ENGINE="INFERENCE_ENDPOINT"

HF_API_TOKEN="你的Hugging Face令牌"

HF_INFERENCE_ENDPOINT_URL="你的推理端点URL路径"

要在本地运行这种LLM,你可以使用TGI(请阅读这篇文章以了解更多关于许可的信息)。

选项3:使用OpenAI API密钥

这是最近新增的选项,你可以使用OpenAI API密钥来使用OpenAI API。

要激活它,创建一个.env.local配置文件:

LLM_ENGINE="OPENAI"

# 默认的openai api基础url是:https://api.openai.com/v1
LLM_OPENAI_API_BASE_URL="如果你有特殊权限,可以使用自定义的OpenAI API基础URL"

LLM_OPENAI_API_MODEL="gpt-4-turbo"

AUTH_OPENAI_API_KEY="你自己的OpenAI API密钥"

选项4:(新的,实验性)使用Groq

LLM_ENGINE="GROQ"

LLM_GROQ_API_MODEL="mixtral-8x7b-32768"

AUTH_GROQ_API_KEY="你自己的GROQ API密钥"

选项5:(新的,实验性)使用Anthropic(Claude)

LLM_ENGINE="ANTHROPIC"

LLM_ANTHROPIC_API_MODEL="claude-3-opus-20240229"

AUTH_ANTHROPIC_API_KEY="你自己的ANTHROPIC API密钥"

选项6:分叉并修改代码以使用不同的LLM系统

另一个选项是完全禁用LLM,并用另一个LLM协议和/或提供商(例如Claude、Replicate)替代,或者用人工生成的故事替代(通过返回模拟或静态数据)。

注意

我可能会在未来修改AI漫画工厂,使其更易使用(例如,添加对Claude或Replicate的支持)

渲染API

这个API用于生成面板图像。这是我为Hugging Face上的各种项目创建的API。

我还没有为它写文档,但基本上它只是其他现有API的"包装器™":

  • @hystshysts/SD-XL Space
  • 以及其他用于制作视频、添加音频等的API..但你不需要它们来使用AI漫画工厂

选项1:自己部署VideoChain

你需要克隆源代码

不幸的是,我还没有时间为VideoChain写文档。 (当我写完后,我会更新这个文档,指向VideoChain的README)

选项2:使用Replicate

要使用Replicate,创建一个.env.local配置文件:

RENDERING_ENGINE="REPLICATE"

RENDERING_REPLICATE_API_MODEL="stabilityai/sdxl"

RENDERING_REPLICATE_API_MODEL_VERSION="da77bc59ee60423279fd632efb4795ab731d9e3ca9705ef3341091fb989b7eaf"

AUTH_REPLICATE_API_TOKEN="你的Replicate令牌"

选项3:使用其他SDXL API

如果你分叉项目,你将能够修改代码以使用你选择的Stable Diffusion技术(本地的、开源的、专有的、你的自定义HF Space等)。

它甚至可以是其他东西,比如Dall-E。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号