1d-tokenizer
1d-tokenizer项目开发了创新的1D图像分词框架,将256×256图像压缩至32个离散标记。该技术突破2D分词限制,提供更灵活紧凑的图像表示。相比扩散模型,生成速度提升数百倍,同时维持高质量输出。研究还深入探讨1D图像分词特性,为图像处理领域开辟新方向。