扩散变换器精选资源 标题初始日期发表场所任务资源MotionDiffuse: 基于扩散模型的文本驱动人体运动生成2022年8月31日TPAMI'2024 字字珠玑:扩散模型的ViT骨干网络2022年9月25日CVPR'2023利用神经网络检查点的生成模型学习如何学习2022年9月26日arXiv 基于Transformer的可扩展扩散模型2022年12月19日ICCV'2023 探索视觉Transformer作为扩散学习器2022年12月28日arXivDLT: 基于联合离散-连续扩散布局Transformer的条件布局生成2023年3月7日ICCV'2023 掩蔽扩散Transformer是强大的图像合成器2023年3月25日ICCV'2023用于自适应文本到语音的扩散Transformer2023年5月3日Interspeech'2023VDT: 基于掩蔽建模的通用视频扩散Transformer2023年5月22日ICLR'2024 ViT-TTS: 基于可扩展扩散Transformer的视觉文本到语音2023年5月22日EMNLP'2023U-DiT TTS: 用于文本到语音的U型扩散视觉Transformer2023年5月22日arXiv 使用掩码Transformer快速训练扩散模型2023年6月15日TMLRDiT-3D:探索用于3D形状生成的普通扩散Transformer2023年7月4日NeurIPS'2023 使用Transformer的大词汇量3D扩散模型2023年9月14日ICLR'2024 Cartoondiff:使用扩散Transformer模型进行无需训练的卡通图像生成2023年9月15日arXiv PixArt-α:快速训练扩散Transformer用于逼真的文本到图像合成2023年9月30日ICLR'2024 Dolfin:无自动编码器的扩散布局Transformer2023年10月25日arXivMapache:用于高级语音编辑和合成的掩码并行Transformer2023年12月3日ICASSP'2024DiffiT:用于图像生成的扩散视觉Transformer2023年12月4日arXivGenTron:深入研究用于图像和视频生成的扩散Transformer2023年12月7日CVPR'2024 使用扩散模型生成逼真视频2023年12月11日arXivDiT-Head:使用扩散Transformer的高分辨率说话头合成2023年12月11日arXiv使用极端掩码快速训练扩散Transformer用于3D点云生成2023年12月12日arXivNViST: 使用Transformer从单幅图像实现野外新视角合成2023年12月13日arXivTransDDPM: 基于Transformer的去噪扩散概率模型用于图像恢复2023年12月28日PRCV'2023Latte: 用于视频生成的潜在扩散Transformer2024年1月5日arXiv PIXART-δ: 使用潜在一致性模型实现快速可控的图像生成2024年1月10日arXiv SiT: 利用可扩展插值Transformer探索流式和扩散生成模型2024年1月16日arXiv 使用沙漏扩散Transformer实现可扩展的高分辨率像素级图像合成2024年1月21日arXiv 用于人物图像合成的跨视角掩码扩散Transformer2024年2月2日arXivDiffsFormer: 用于股票因子增强的扩散Transformer2024年2月5日arXivSora2024年2月15日OpenAI SDiT: 脉冲扩散Transformer模型2024年2月18日arXivFiT: 用于扩散模型的灵活视觉Transformer2024年2月19日arXivSnap Video: 用于文本到视频合成的扩展时空Transformer2024年2月22日arXivOpenDiT2024年2月26日GitHub FineDiffusion:通过10,000个类别扩展扩散模型实现细粒度图像生成2024年2月28日arXiv 开放Sora计划2024年3月1日GitHub Stable Diffusion 3:研究论文2024年3月5日Stability AI 贡献 我们始终欢迎您的贡献! 请随时在data.json文件中添加或更新内容。 本README文件和网站将由GitHub Actions自动更新。 🚀 🚀 🚀