Project Icon

scepter

优化生成模型训练和推理的开源工具

SCEPTER是一个开源库,专注于生成模型的训练、微调和推理,适用于图像生成、转换和编辑任务。整合了社区常见实现与阿里巴巴同意实验室的专有方法,涵盖实用的生成框架、易用的实现方法和交互界面SCEPTER Studio,可支持自定义图像编辑任务和多种生成模型。它是AIGC研究人员与开发者的理想工具。

🪄SCEPTER

🪄SCEPTER是一个专注于生成训练、微调和推理的开源代码库,涵盖了诸如图像生成、迁移、编辑等一套下游任务。SCEPTER集成了流行的社区驱动实现以及阿里巴巴集团同裔实验室的专有方法,为AIGC领域的研究人员和从业者提供了一个全面的工具包。这个多功能库旨在促进行业创新,加速快速发展的生成模型领域的发展。

SCEPTER提供了3个核心组件:

🎉 新闻

  • [2024.07]:支持基于DiT架构的开源生成模型的推理和训练,例如SD3PixArt
  • [2024.05]:推出SCEPTER v1,支持定制化图像编辑任务!只需提供10对图像,SCEPTER将为您调整一个编辑调谐器,用于图像到图像的任务,如泥土风格去除文字分割等。
  • [2024.04]:在SCEPTER Studio上新增StyleBooth演示,用于基于文本的风格编辑
  • [2024.03]:我们优化了训练UI和检查点管理。在SCEPTER Studio上新增LAR-Gen模型,支持缩放出虚拟试穿图像修补
  • [2024.02]:我们发布了新的SD v2.1和SD XL的SCEdit可控图像合成模型。应用多种策略加速SCEPTER Studio的推理时间。
  • [2024.01]:我们发布了SCEPTER Studio,一个基于Gradio的数据管理、模型训练和推理的集成工具包。
  • [2024.01]:SCEdit支持可控图像合成的训练和推理。
  • [2023.12]:我们提出了SCEdit,一个高效且可控的生成框架。
  • [2023.12]:我们发布了🪄SCEPTER库。

🖼 最近作品画廊

编辑调谐器

只需提供10对图像,SCEPTER将为您调整一个编辑调谐器,用于图像到图像的任务,如泥土风格去除文字分割等。 试试我们的官方少样本数据集:去除文字Image2HedImage2DepthDepth2Image

泥土风格
提示:"将这张图片转换成泥土风格"
去除文字
提示:"去除文本信息"
Image2Hed
提示:"转换为边缘图"
Image2Depth
提示:"计算深度图"
Depth2Image
提示:"将深度图转换为彩色图像"
注意:左侧图像为输入,右侧图像为输出。

🛠️ 安装

  • 使用conda命令创建新环境:
conda env create -f environment.yaml
conda activate scepter
  • 使用pip命令安装:

我们建议安装特定版本的PyTorch和加速工具箱xFormers。你可以通过pip安装这些推荐版本:

pip install -r requirements/recommended.txt
pip install scepter

🧩 生成框架

教程

文档关键特性
训练DDP / FSDP / FairScale / Xformers
推理动态加载/卸载
数据集管理本地 / Http / OSS / Modelscope

📝 流行的方法

当前支持的方法

任务方法链接
文本生成图像SD v1.5Hugging Face Repo
文本生成图像SD v2.1Hugging Face Repo
文本生成图像SD-XLHugging Face Repo
高效调优LoRAArxiv   link
高效调优Res-Tuning(NeurIPS23)Arxiv   link Page link
可控图像合成🌟SCEdit(CVPR24)Arxiv   link Page link
图像编辑🌟LAR-GenArxiv   link Page link
图像编辑🌟StyleBoothArxiv   link Page link

🖥️ SCEPTER Studio

启动

要充分体验 SCEPTER Studio,可以启动以下命令行:

pip install scepter
python -m scepter.tools.webui

或者在克隆仓库代码后运行

git clone https://github.com/modelscope/scepter.git
PYTHONPATH=. python scepter/tools/webui.py --cfg scepter/methods/studio/scepter_ui.yaml

SCEPTER Studio 的启动不需要手动下载和组织模型;它将自动加载相应的模型并将其存储在本地目录中。 根据网络和硬件情况,初次启动通常需要15-60分钟,主要涉及下载和处理SDv1.5、SDv2.1和SDXL模型。 因此,后续的启动会变得更快(大约一分钟),因为不再需要下载。

使用演示

Modelscope Studio & Huggingface Space

我们在Modelscope上部署了一个仅包含推理选项的工作工作室,请参考 ms_scepter_studiohf_scepter_studio

🔍 了解更多

BibTeX

如果我们的工作对您的研究有帮助,请考虑引用:

@misc{scepter,
    title = {SCEPTER, https://github.com/modelscope/scepter},
    author = {SCEPTER},
    year = {2023}
}

许可

此项目使用 Apache License (Version 2.0) 许可。

致谢

感谢 Stability-AISWIFT libraryFooocus 的出色工作。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号