#ICLR'23

CogVideo - 开源视频生成模型，支持高效单GPU推理

CogVideoX视频生成ICLR'23开源项目文本到视频Github

CogVideoX和CogVideo通过大规模预训练模型和3D因果VAE技术，实现高质量的文本到视频生成。CogVideoX-2B可在单个3090 GPU上进行推理，生成效果几乎无损。提供详尽的快速入门指南、模型结构介绍和使用案例。探索CogVideoX和CogVideo在Huggingface、WeChat、Discord等平台上的应用，获取更多技术细节和更新。

GeneFace - 广义和高保真3D会说话的人脸合成

GeneFace高保真音频驱动3D人脸合成ICLR'23Github开源项目

该项目展示了一种通用且高保真的音频驱动3D说话面部生成方法。GeneFace 实现了更好的唇同步和面部表现，即使在非典型音频中也是如此。项目附带预训练模型和数据集，方便快速上手，并支持使用个人视频训练独特的GeneFace模型。新发布的GeneFace++ 提升了唇同步、视频质量和系统效率，具备实时推断和更快的深度3D重建功能。

相关文章

Article Cover

CogVideo: 开创性的大规模文本到视频生成模型

Article Cover

GeneFace: 新一代高保真度音频驱动3D人脸生成技术

Article Cover

CogVideo入门指南-文本到视频生成的开源模型

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号