block

GaussianDreamerPro：从文本到可操纵的3D高斯体，大幅提升质量

项目主页 | arxiv论文

易陶然1，方杰民2†，周赞威3，王俊杰2，吴冠军1，谢凌曦2，张晓鹏2，刘文预1✉，王兴刚1†，田奇2

1华中科技大学 2华为公司 3上海交通大学人工智能研究院

†项目负责人 ✉通讯作者

block

近期，3D高斯体溅射（3D-GS）在重建和渲染真实世界场景方面取得了巨大成功。为了将高质量渲染转移到生成任务中，一系列研究工作尝试从文本生成3D高斯体资产。然而，生成的资产尚未达到重建任务中的同等质量。我们观察到，由于生成过程可能导致不确定性，高斯体倾向于无控制地增长。为了大幅提升生成质量，我们提出了一个名为GaussianDreamerPro的新框架。其主要思想是将高斯体绑定到合理的几何体上，并在整个生成过程中不断演化。在我们框架的不同阶段，几何形状和外观都能得到逐步丰富。最终输出的资产是由绑定到网格的3D高斯体构建而成，与之前的方法相比，显示出显著增强的细节和质量。值得注意的是，生成的资产还可以无缝集成到下游操作流程中，如动画、合成和模拟等，极大地提升了其在广泛应用中的潜力。

🦾 更新

2024年6月26日：项目初始化，代码即将发布。

📑 引用

@article{GaussianDreamerPro,
    title={GaussianDreamerPro: Text to Manipulable 3D Gaussians with Highly Enhanced Quality},
    author={Yi, Taoran and Fang, Jiemin and Zhou, Zanwei and Wang, Junjie and Wu, Guanjun and Xie, Lingxi and Zhang, Xiaopeng and Liu, Wenyu and Wang, Xinggang and Tian, Qi},
    journal={arXiv:2406.18462},
    year={2024}
}

@inproceedings{yi2024gaussiandreamer,
  title={Gaussiandreamer: Fast generation from text to 3d gaussians by bridging 2d and 3d diffusion models},
  author={Yi, Taoran and Fang, Jiemin and Wang, Junjie and Wu, Guanjun and Xie, Lingxi and Zhang, Xiaopeng and Liu, Wenyu and Tian, Qi and Wang, Xinggang},
  booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
  pages={6796--6807},
  year={2024}
}