热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#OmniTokenizer
OmniTokenizer - 联合图像视频标记器实现高效视觉生成
Github
开源项目
语言模型
视觉生成
VQVAE
OmniTokenizer
图像视频联合标记器
OmniTokenizer是一个图像和视频联合标记器,采用单一模型和权重,提供最先进的重建性能。它具有高分辨率和长视频适应性,可与语言模型和扩散模型结合实现视觉生成。项目提供预训练模型、训练脚本和评估工具,支持VQVAE和VAE版本,为视觉生成研究提供基础设施。
1
1
相关文章
OmniTokenizer: 革命性的联合图像和视频标记器
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号