Project Icon

LaRa

大基线辐射场技术实现突破性进展

LaRa项目开发了创新的大基线辐射场技术,提高了3D重建效率和质量。通过支持半精度训练,该技术实现了收敛速度提升100%以上,性能增益约1.5dB。LaRa能从多视图、文本和单视图输入重建辐射场,在计算效率和重建质量方面取得了显著进展,为3D重建和渲染领域开辟了新途径。

LaRa: 高效大基线辐射场

项目页面 | 论文 | 数据集 | 检查点 |

预览图

⭐ 新特性

  • 2024/04/05: 重要更新 - 现在我们的方法支持半精度训练,实现了超过100%的更快收敛速度,并且在更少的迭代次数下获得约1.5dB的增益!

    模型PSNR ↑SSIM ↑绝对误差(几何)↓轮次时间(天)检查点
    论文27.650.9510.0654503.5------
    bf1629.150.9560.0574301.5下载

    请从提供的链接下载预训练检查点并将其放置在ckpts文件夹中。

安装

git clone https://github.com/autonomousvision/LaRa.git --recursive
conda env create --file environment.yml
conda activate lara

数据集

我们使用处理过的gobjaverse数据集进行训练。提供了下载脚本tools/download_dataset.py以自动下载数据集。

python tools/download_dataset.py all

注意:GObjaverse数据集需要约1.4 TB的存储空间。你也可以下载数据集的子集。详情请参考提供的脚本。下载完成后请手动删除_temp文件夹。

如果你想自己处理数据,我们为gobjaverse和co3d数据集提供了预处理脚本,请查看tools/prepare_dataset_*。 你也可以下载我们预处理好的数据并将它们放入dataset文件夹:

训练

python train_lightning.py

注意: 你可以在configs/base.yaml中配置GPU ID和其他参数。

评估

我们的方法支持从多视图文本单视图输入重建辐射场。我们在ckpt提供了一个预训练检查点。

多视图到3D

要复现表格结果,你可以简单地使用:

python eval_all.py

注意:

  • 请仔细检查脚本中的路径是否适用于你的具体情况。
  • 如果你想在评估过程中输出网格或视频,请指定video_frames和save_mesh 标签

文本到3D

python evaluation.py configs/infer.yaml 
       infer.ckpt_path=ckpts/epoch=29.ckpt
       infer.save_folder=outputs/prompts/
       infer.dataset.generator_type=xxx
       infer.dataset.prompts=["一辆由寿司制成的汽车","一条美丽的彩虹鱼"]

注意: 由于权限问题,此部分目前不可用。我将在下周寻找替代的文本到多视图生成器。

单视图到3D

python evaluation.py configs/infer.yaml 
       infer.ckpt_path=ckpts/epoch=29.ckpt
       infer.save_folder=outputs/single-view/
       infer.dataset.generator_type="zero123plus-v1"
       infer.dataset.image_pathes=\["assets/examples/13_realfusion_cherry_1.png"\]

注意: 它支持生成器类型zero123plus-v1.1zero123plus-v1

致谢

我们的渲染器基于2DGS构建。Co3D数据集的数据预处理代码部分借鉴自Splatter-Image。此外,从文本和单视图图像生成多视图图像的脚本来自GRM。我们感谢所有作者的优秀仓库。

引用

如果你发现我们的代码或论文有帮助,请考虑引用:

@inproceedings{LaRa,
         author = {Anpei Chen and Haofei Xu and Stefano Esposito and Siyu Tang and Andreas Geiger},
         title = {LaRa: Efficient Large-Baseline Radiance Fields},
         booktitle = {European Conference on Computer Vision (ECCV)},
         year = {2024}
        } 
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号