Mitsua Diffusion CC0项目介绍
Mitsua Diffusion CC0是一个潜在文本到图像的扩散模型,这是一个非常有趣和独特的人工智能项目。该模型的U-Net部分完全是从零开始训练的,只使用了公共领域/CC0或得到版权许可的图像。这意味着该模型在训练过程中严格遵守了道德和法律标准,为人工智能的发展树立了良好的榜样。
模型架构
该模型借用了Stable Diffusion v2.1 base的文本编码器和VAE部分。这种组合使得Mitsua Diffusion CC0能够利用成熟模型的某些优势,同时保持其独特的训练方法。
项目目的
这个模型将作为AI VTuber Elan Mitsua的活动基础模型。Elan Mitsua是一个正在以符合道德的方式成长的AI,尽管目前模型的视觉质量和多样性还比较有限,但这正是Mitsua酱一个很好的起点!
训练数据来源
模型的训练数据来源广泛且合法,包括:
- 公共领域/CC0的传统艺术作品
- CC0照片
- CC0 NFT
- CC0 VRM模型
- 获得使用许可的版权图像
总共约有1100万张图像用于训练,这些数据都是通过合乎道德的方式获得的,并且符合相关网站的使用条款。
许可证
Mitsua Diffusion CC0采用了Creative Open-Rail++-M许可证。需要注意的是,虽然模型名称中包含"CC0",但这指的是大部分训练数据是CC0的,模型本身的许可证并不是CC0。
社区参与
项目团队鼓励社区参与Mitsua的训练过程。有兴趣的人可以在Twitter上关注Mitsua的训练进展,也可以提交申请加入他们的Discord服务器。
未来展望
尽管目前模型的视觉质量还有待提高,但Mitsua Diffusion CC0代表了一种新的、符合道德的AI发展方向。随着进一步的训练和社区的支持,这个项目有望在保持道德标准的同时,不断提升其性能和应用范围。
</SOURCE_TEXT>