Project Icon

ARKitScenes

革新3D室内场景理解的大规模数据集

ARKitScenes是一个创新的3D室内场景理解数据集,利用移动RGB-D技术捕获数据。作为首个采用广泛可用深度传感器的RGB-D数据集,它涵盖了1,661个独特场景的5,047次捕获。数据集提供原始和处理后的数据、高分辨率深度图及手动标注的3D定向边界框。此外,项目还包含3D物体检测和RGB-D引导上采样的辅助脚本,为推进室内场景理解技术和应对真实世界挑战提供了宝贵资源。

Holodeck - 语言驱动的3D AI环境生成系统
3D环境生成AI2-THORGithubHolodeck实体AI开源项目自然语言指导
Holodeck是一个基于AI2-THOR平台的开源项目,旨在通过自然语言指令生成逼真的3D AI环境。该系统结合GPT-4语言模型和高效布局算法,能将文字描述转化为详细的3D场景。Holodeck为embodied AI研究提供了便捷工具,支持快速创建多样化的复杂环境用于测试和训练。项目提供完整代码和文档,为AI研究社区贡献了有价值的资源。
controlnet-seg-room - 室内设计图像生成与自定义元素控制
AI绘图DiffusersGithubHuggingface室内设计开源项目控制网模型
controlnet-seg-room项目使用控制网络和细分图训练生成室内设计图像,用户可通过条件信息实现对房间对象的精细控制。项目结合来自BLIP和UperNet模型的元数据,以TPUv4和JAX框架优化,后转为PyTorch以配合Diffusers库,支持图像转换和修复,便于定制设计风格与房型,支持创意设计实现。
Open3D-PointNet2-Semantic3D - 使用Open3D和PointNet++进行高效3D数据处理与语义分割
GithubOpen3DPointNet++Semantic3D开源项目机器学习语义分割
该项目演示了如何使用Open3D与PointNet++进行3D点云的加载、预处理及语义分割,提供了高效的点云操作方法和训练预测流程,为Semantic3D数据集提供了简洁优化的基准实现,适用于深度学习应用的快速开发。
mickey - 通过2D图像匹配恢复3D场景的相对位姿
CVPR 2024GithubMicKeyNiantic开源项目特征检测相对位姿
该项目介绍了MicKey,这是一种在CVPR 2024上发布的特征检测管道。MicKey通过描述符匹配实现度量对应,并可以恢复精确的相对位姿。其在端到端训练中仅需图像对及其相对位姿真值,主要针对AR即时定位进行了优化。在Map-free基准测试中,MicKey的性能得到了验证,大大简化了3D地图构建流程。
MonocularTotalCapture - 单目3D人体姿态全方位捕捉系统
3D建模Adam模型Github人体姿态估计开源项目深度学习计算机视觉
MonocularTotalCapture是一个开源项目,旨在实现野外环境下的单目3D人体姿态全方位捕捉。该系统同时捕捉人脸、身体和手部姿态,采用Adam可变形人体模型和OpenPose技术。基于CVPR19研究成果,项目提供完整的安装使用指南,为计算机视觉研究和3D重建提供了有力工具,仅限非商业研究使用。
Interior AI - AI室内设计工具 一键重塑居家空间
3D渲染AI室内设计AI工具Interior AI室内风格虚拟装修
Interior AI是一款基于人工智能的室内设计工具。用户上传室内照片并选择喜欢的风格后,系统能快速生成多种设计方案。支持50多种风格,适用于住宅、酒店等多种场景。除基础设计功能外,还提供草图渲染、SketchUp文件转换、虚拟布置等实用工具。其生成的逼真效果图可为设计师和房地产从业者节省时间成本。
ScreenAI - 深度理解界面和信息图的视觉语言模型
GithubScreenAIUI理解信息图表理解多模态开源项目视觉语言模型
ScreenAI是一个开源的多模态视觉语言模型,专注于用户界面(UI)和信息图的理解。该模型集成了视觉变换器(ViT)、注意力机制和前馈网络,能够处理图像和文本输入。通过深度学习技术,ScreenAI实现了对复杂视觉信息的处理和文本整合分析,为UI设计、信息可视化和人机交互研究提供了新的工具和方法。
lidar-slam-detection - 面向自动驾驶和机器人的开源感知系统架构
GithubLSDSLAM开源项目机器人感知激光雷达自动驾驶
LSD是一个面向自动驾驶和机器人的开源感知系统架构。它支持多种传感器集成,提供便捷的标定工具,实现软件时间同步及数据记录回放。系统集成了基于体素3D-CNN的点云目标检测、跟踪和预测功能,以及基于GICP、FLOAM和FastLIO的前端里程计算法和基于G2O的后端优化。LSD还包含基于Web的交互式地图编辑工具,并可与ROS系统对接。作为一个功能完备的感知方案,LSD为自动驾驶和机器人应用提供了坚实的技术基础。
Room AI - 智能室内设计灵感生成平台
AI室内设计AI工具ControlNetRoomAIStable Diffusion深度学习
Room AI是一款智能室内设计工具,面向室内设计师、房主及装修爱好者。基于房间结构和布局,该工具能快速生成多种设计方案。支持多种房型和风格,提供专业配色建议,允许用户自定义设计。Room AI采用ControlNet和Stable Diffusion技术,生成高质量室内设计图像,为用户提供创新设计灵感。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号