热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#大规模词表
Open-MAGVIT2 - 自回归视觉生成新突破 大幅提升图像分词性能
Open-MAGVIT2
视觉生成
图像分词器
自回归模型
大规模词表
Github
开源项目
Open-MAGVIT2是一个创新的自回归视觉生成项目,采用无查找技术和262144大小的码本,克服了VQGAN的局限性。该项目用PyTorch重新实现MAGVIT2分词器,在图像分词方面取得显著进展,8倍下采样时rFID达到0.39。项目致力于推动自回归视觉生成领域发展,目前处于积极开发阶段,未来计划拓展至视频生成领域。
1
1
相关文章
Open-MAGVIT2: 突破自回归视觉生成的新纪元
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号