Project Icon

kaolin

提供3D深度学习工具的PyTorch库

Kaolin库提供多种3D表示形式的PyTorch API,包含模块化可微渲染、快速转换、数据加载、3D检查点、可微摄像机和光照API等GPU优化操作。版本0.16.0新增Simplicits方法用于弹性模拟和四元数数学功能,优化工作流程。用户可通过教程快速使用新API进行模型可视化。

Kaolin 项目介绍

Kaolin 是由 NVIDIA 推出的一个基于 PyTorch 的库,旨在加速 3D 深度学习的研究。它为处理多种三维表示提供了一整套 API,并包含了一系列 GPU 优化的操作。该库包括模块化的可微分渲染、高速的表示转换、数据加载、3D 检查点、可微分的相机 API 以及使用球谐函数和球形高斯函数的可微分光照系统。此外,Kaolin 还提供了一种称为结构化点云(Structured Point Clouds)的强大四叉树加速结构、专为 Jupyter 笔记本设计的交互式 3D 可视化工具、便捷的批量网格容器等等。Kaolin 是 NVIDIA 更大 3D 深度学习计划的一部分。

安装与入门

自 0.12.0 版本起,Kaolin 支持通过 wheel 文件进行安装。用户需要根据其使用的 PyTorch 和 CUDA 版本替换相应的安装命令:

pip install kaolin==0.17.0 -f https://nvidia-kaolin.s3.us-east-2.amazonaws.com/torch-{TORCH_VERSION}_cu{CUDA_VERSION}.html

例如,若要在 PyTorch 2.0.1 和 CUDA 11.8 上安装 Kaolin 0.17.0,可以使用以下命令:

pip install kaolin==0.17.0 -f https://nvidia-kaolin.s3.us-east-2.amazonaws.com/torch-2.0.1_cu118.html

最新版本功能(0.17.0)

在 Kaolin 0.17.0 版本中,新增了 sample_points_in_volume 函数,用于高斯散点的“密集化”。此功能可用于改进物理模拟。此外,Kaolin 使用 NVIDIA Warp 进一步改进了物理训练和模拟,并在 GLTF 加载器中添加了透射支持。

以下是两个图示,分别是在未启用和已启用密集化功能情况下的效果对比:

未启用密集化启用密集化
未启用密集化启用密集化

官方还更新了一系列教程,帮助用户更好地利用新功能进行物理模拟和 3D 渲染。

开源项目中的应用

Kaolin 已在多个外部项目中得到应用,例如 NVIDIA Kaolin Wisp、gradSim、Text2Mesh 等等。这些项目利用了 Kaolin 的摄像头 API、结构化点云、可微分的 DIB-R 光栅化器、灵活的三维渲染功能及其他众多特性,展示了 Kaolin 在实际应用中的强大能力。

许可证

Kaolin 的大部分代码库采用 Apache v2.0 许可证。在 kaolin/non_commercial 目录下的内容则采用 NSCL 许可证,仅限于非商业用途的研究和评估。使用 Kaolin 默认组件可以直接导入 Apache 许可的代码,而非商业组件则需要显式导入。

致谢

欢迎社区的开发者们参与到 Kaolin 的构建中来,并在研究中引用 Kaolin。项目团队包括 Clement Fuji Tsang、Maria Shugrina、Charles Loop 等多位技术专家,他们为 Kaolin 的发展贡献了重要的力量。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号