GNT

使用Transformer重建和渲染NeRF模型

Generalizable NeRF Transformer (GNT) 是一个用于高效重建和渲染神经辐射场的纯Transformer架构。它通过视图Transformer和射线路径Transformer两个阶段完成场景表示和渲染。GNT在跨场景训练中展示了其在多个数据集上优异的性能和普遍适用性。

访问官网

Github

论文

介绍相关项目

awesome-neural-rendering - 全面汇集神经渲染领域最新研究进展

3D重建GithubNeural Rendering开源项目深度学习视图合成计算机图形学

该项目汇集了神经渲染领域的前沿资源，包括逆向渲染、神经重渲染、可微分渲染和隐式神经表示等多个子领域。这份精选列表涵盖了最新研究论文、技术报告和开源项目，为研究人员和开发者提供了全面的参考资料，有助于深入了解神经渲染技术的最新进展。

nanotron - 高效的大规模模型预训练库

GithubNanotronTransformer并行计算开源项目模型预训练深度学习

Nanotron是一个开源的Transformer模型预训练库。它提供灵活API，支持自定义数据集预训练。该库特点包括高性能、可扩展性强，支持3D并行、专家并行、AFAB和1F1B调度策略、ZeRO-1优化器等先进技术。Nanotron适用于大规模模型训练，旨在提高预训练效率。

kan-gpt - 语言建模的生成式预训练转换的 PyTorch 实现

GithubKAN-GPTKolmogorov-Arnold网络PyTorch开源项目生成预训练变换器语言模型

KAN-GPT在PyTorch平台上实现了结合Kolmogorov-Arnold网络的生成式预训练变换器，用于高效的语言模型建设。该项目支持灵活的训练选项和多种数据集，体现了其在自然语言处理领域的广泛应用和成熟技术。KAN-GPT帮助开发者在文本生成和语言建模方面取得突破，进一步提升AI语言技术。

Fantasia3D - 文本生成高质量3D模型的方法

3D内容生成Fantasia3DGithubICCV2023几何建模外观建模开源项目

Fantasia3D专注于通过分离几何和外观，实现高质量的文本生成3D模型。采用Stable Diffusion技术和Latent-NeRF等方法，提升了几何建模和外观渲染的效果，捕捉高分辨率细节并模拟逼真材质。项目团队定期更新FAQ和指南，提供性能优化建议和解决方案。支持用户定制网格细调，兼容多种3D生成方法，实现多样化和逼真的3D模型。

meshgpt-pytorch - 基于注意力机制的先进3D网格生成框架

3D建模GithubMeshGPT开源项目深度学习神经网络计算机图形学

MeshGPT-Pytorch是一个开源项目，专注于利用注意力机制实现3D网格生成。它基于PyTorch开发，支持可变长度面处理，并提供自动编码器和转换器模型。该项目计划引入文本条件控制功能，实现从文本到3D模型的转换。通过文本条件生成和分层转换器等高级特性，MeshGPT-Pytorch为3D内容创作和研究领域提供了先进的技术支持。

fnet-base - FNet模型采用傅里叶变换实现高效自然语言处理

FNetGLUE benchmarkGithubHuggingface傅里叶变换开源项目模型模型预训练自然语言处理

FNet是一种创新型自然语言处理模型，通过傅里叶变换替代传统注意力机制，提高了计算效率。该模型在C4数据集上预训练，采用掩码语言建模和下一句预测任务。在GLUE基准测试中，FNet达到BERT模型93%的性能，微调速度快32%。这种架构为大规模文本处理应用提供了高效选择。

Restormer - 高效Restormer Transformer实现高分辨率图像修复

GithubRestormerTransformer图像去噪图像去雨开源项目高分辨率图像恢复

研究提出了一种名为Restormer的高效Transformer模型，通过多头注意力和前馈网络设计，实现了长距离像素交互，适用于大图像处理。该模型在图像去雨、单图像运动去模糊、散焦去模糊（单图像和双像素数据）和高斯及真实图像去噪等任务中表现优异。Restormer的训练代码和预训练模型已发布，并被选为CVPR 2022的口头报告。用户可通过Colab或命令行测试预训练模型。

awesome-nerf-editing - 介绍最新的辐射场编辑技术与资源

3D编辑CVPR 2024ECCV 2024Gaussian SplattingGithubNeural Radiance Fields开源项目

本项目汇集了辐射场编辑领域的开创性研究成果、调查报告和最新进展。涵盖ECCV、SIGGRAPH、CVPR等顶级会议，提供不断更新的资源和文献。专业研究人员和爱好者均可在此找到关于NeRF和3D Gaussian Splatting技术的详尽信息。欢迎关注项目动态，并通过提交Issues或Pull Requests参与讨论和维护。

nanoGPT - 简洁高效的中型GPT模型训练框架

GPT训练GithubPyTorchnanoGPT开源项目深度学习语言模型

nanoGPT是一个针对中型GPT模型的训练框架，重写自minGPT项目并注重性能优化。其核心由约300行代码组成，包括训练循环和模型定义，能够轻松复现GPT-2（124M）。该框架支持从零开始训练新模型或微调预训练检查点，并提供了详细的入门指南，涵盖了从Shakespeare作品上的字符级模型训练到在OpenWebText数据集上复现GPT-2结果的完整流程。

K-Planes - 多维场景的显式辐射场模型，支持静态、动态和可变外观数据集

GithubK-Planes三维重建开源项目深度学习计算机视觉辐射场

K-Planes是一个创新的显式辐射场模型，可扩展到任意维度场景，适用于静态、动态和可变外观的数据集。该项目在空间、时间和外观上进行了明确建模，推动了神经辐射场研究的发展。K-Planes提供完整的代码实现、预训练模型，并与NerfAcc和NerfStudio集成，便于研究人员进行开发和应用。在多个基准数据集上，K-Planes展现了良好的性能，为3D场景重建和渲染领域提供了新的思路。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com