#DiT-MoE

DiT-MoE: 扩展扩散变换器到160亿参数

3 个月前

DiT-MoE 扩散模型混合专家深度学习图像生成 Github 开源项目

3 个月前

相关项目

DiT-MoE

DiT-MoE项目采用混合专家模型，将扩散Transformer扩展至16亿参数规模。作为扩散Transformer的稀疏版本，DiT-MoE在保持与密集网络相当性能的同时，实现了高效的推理。项目提供PyTorch实现、预训练权重和训练/采样代码，并包含专家路由分析和Hugging Face检查点。通过混合专家方法，DiT-MoE在模型扩展和推理优化方面展现出显著优势。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com