#图像视频联合标记器

OmniTokenizer: 革命性的联合图像和视频标记器

2 个月前

2 个月前

相关项目

OmniTokenizer

OmniTokenizer是一个图像和视频联合标记器，采用单一模型和权重，提供最先进的重建性能。它具有高分辨率和长视频适应性，可与语言模型和扩散模型结合实现视觉生成。项目提供预训练模型、训练脚本和评估工具，支持VQVAE和VAE版本，为视觉生成研究提供基础设施。

投诉举报邮箱: service@vectorlightyear.com