GeoGaussian

几何感知高斯分布的场景渲染新方法

3D Gaussians 场景渲染几何约束新视角合成点云 Github 开源项目

GeoGaussian是一种创新的场景渲染方法,利用几何感知的高斯分布优化来保持场景结构。它通过初始化表面对齐的薄高斯分布和约束优化,有效保持了场景的几何和纹理特征。该方法在新视角合成和几何重建方面表现优异,尤其适合结构化区域。项目开源了代码、数据集和使用说明,为计算机视觉研究提供了有价值的资源。

文档

torchgeo - 优化地理空间数据处理的机器学习与遥感工具

GithubPyTorchTorchGeo地理空间数据开源项目机器学习遥感

TorchGeo 是一个基于 PyTorch 的地理空间数据处理库，提供丰富的数据集、采样器、变换和预训练模型，旨在帮助机器学习和遥感专家更高效地处理和探索地理空间数据。该库支持多光谱传感器的预训练模型，并与 PyTorch 数据加载器完全兼容，易于集成到现有的训练工作流中。其全面的文档包括 API 使用指南、教程和示范，非常适合开发者和研究人员使用。

mvsplat - 从稀疏多视角图像高效重建3D场景

3D Gaussian SplattingGithubMVSplat多视图图像开源项目神经渲染计算机视觉

MVSplat是一种基于3D高斯分布渲染的多视角图像重建技术。该项目利用深度学习和计算机视觉方法，从稀疏的多视角图像高效重建3D场景并实现新视角渲染。MVSplat在RealEstate10K和ACID数据集上表现优异，并具有良好的跨数据集泛化能力。项目提供了安装指南、预训练模型和评估代码，便于研究人员进行复现和改进。

OpenShape_code - 革新3D形状表示方法实现开放世界理解

3D形状表示GithubOpenShape多模态检索开放世界理解开源项目零样本分类

该项目开发了新型3D形状表示方法，通过大规模训练实现开放世界理解。这一技术在零样本3D形状分类、检索和语义理解任务中表现优异，支持多模态交互并能进行点云描述和图像生成。提供的在线演示、预训练模型和训练代码为3D视觉研究与应用拓展了新方向。

Awesome-3D-AIGC - 3D生成AI前沿资源与研究综述

3D AIGC3D建模Github开源项目深度学习生成式AI计算机视觉

该项目汇集3D人工智能生成内容(AIGC)领域的最新论文和开源资源,涵盖文本到3D生成、图像到3D生成、3D编辑、人体头像生成等多个研究方向。项目提供开源实现、数据集和教程视频等实用资源,帮助研究者和开发者跟踪3D AIGC技术的最新进展,为相关创新和应用提供参考。

SceneTex - 基于扩散先验的室内场景高质量纹理合成方法

3D渲染GithubSceneTex室内场景开源项目扩散模型纹理合成

SceneTex是一种基于扩散先验的室内场景纹理合成方法。该方法将纹理合成视为RGB空间中的优化问题，采用多分辨率纹理场隐式编码网格外观，并使用交叉注意力解码器确保跨视图风格一致性。SceneTex能为3D-FRONT场景生成高质量、风格一致的纹理，在视觉质量和提示保真度方面优于现有方法。

Perp-Neg-stablediffusion - Perp-Neg算法突破二维扩散模型限制实现三维生成

3D模型AI绘图GithubPerp-NegStable Diffusion图像生成开源项目

Perp-Neg-stablediffusion项目开发了新型负面提示算法，将二维扩散模型扩展至三维领域，缓解了Janus问题。该技术改进了Stable Diffusion的图像生成能力，并实现了三维物体生成。项目开源代码允许研究者探索Perp-Neg在图像合成和三维建模等领域的应用。

4DGen - 基于视频的动态3D内容生成，实现空间-时间一致性

4DGen4D内容生成Github开源项目空间时间一致性视频到4D生成高斯散射

4DGen是一个开源项目，专注于基于视频的4D内容生成。该项目支持视频、图像和文本到4D的转换，通过融合多种技术实现空间-时间一致性。4DGen提供了创建动态3D内容的工具，并开放了代码和数据集，为相关研究和开发提供资源。

RayDiffusion - 射线扩散模型在相机姿态估计中的应用

GithubRayDiffusion开源项目扩散模型深度学习相机姿态估计计算机视觉

RayDiffusion项目提出了一种将相机表示为射线并应用扩散模型的姿态估计方法。该方法支持已知边界框和从掩码自动提取边界框两种模式，同时提供射线回归选项。项目包含代码实现、预训练模型和使用说明，适用于计算机视觉领域的研究和开发。

distrifuser - 高效分布式并行推理助力高分辨率图像生成

DistriFusionGPU加速Githubdiffusion模型并行推理开源项目高分辨率

DistriFusion是一种用于高分辨率扩散模型的分布式并行推理算法。该方法无需额外训练，通过多GPU协同工作加速推理过程，同时保持图像质量。其创新的补丁交互技术解决了传统方法的碎片化问题，在高分辨率图像生成任务中显著提升了性能。该项目已在CVPR 2024被评为亮点工作，并开源了相关代码。

Free3D - 基于单视图的一致性多视角图像合成技术

3D生成Free3DGithub单视图重建开源项目新视角合成计算机视觉

Free3D是牛津大学VGG实验室开发的新型计算机视觉技术，可从单一图像生成一致性的多视角合成图,无需显式3D表示。该技术采用射线条件归一化和伪3D注意力机制,在Objaverse等多个数据集上展现优异性能。Free3D为计算机视觉和图形学领域提供了新的研究方向,有望应用于3D重建、虚拟现实等多个领域。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com