Project Icon

DriveDreamer4D

4D驾驶场景模拟的新突破

DriveDreamer4D利用世界模型先验,提升4D驾驶场景表示。通过闭环仿真,能将实况驾驶数据转换为新的轨迹视频,并确保视频内容的时空一致性。实验验证了其在新轨迹视频生成方面的优越性,尤其在时空连贯性上表现突出,为自主驾驶系统的研究和开发提供了有力支持。

DreamFace - 将照片转化为动态有声影像的AI工具
AI创意工作室AI头像AI工具AI视频AI配音DreamFace定制视频热门视频生成
DreamFace作为一个先进的AI创意平台,让用户能够简单快捷地制作有声动画和个性化视频,适用于社交媒体、演示和教育等多种场合,增添互动的趣味与创造力。
mahalanobis_3d_multi_object_tracking - 在NuScenes Tracking Challenge中荣获冠军,提升了自主驾驶3D多目标追踪的准确率
AB3DMOTAutonomous DrivingGithubNuScenes Tracking ChallengeProbabilistic TrackingStanford University开源项目
该项目提出了一种在线3D多目标追踪方法,在NeurIPS 2019 AI Driving Olympics Workshop上荣获NuScenes Tracking Challenge冠军。与AB3DMOT方法相比,显著提高了较小目标如行人的追踪精度。项目提供了详尽的技术报告与源码,以及详细的运行步骤,便于他人复现结果。使用MEGVII的检测结果,该方法在多目标追踪准确率(AMOTA)上表现出色,特别是对行人和小型目标的追踪效果尤为明显。
Learning-Deep-Learning - 自动驾驶与深度学习前沿技术论文笔记集锦
Github开源项目机器学习深度学习自动驾驶计算机视觉论文阅读
这个项目汇集了深度学习和机器学习领域的论文阅读笔记,重点关注自动驾驶技术。涵盖BEV感知、语义占用预测、可行驶空间检测和3D目标检测等热门研究方向。同时收录了多篇综述文章,全面呈现自动驾驶领域的最新进展和技术动向。
warp-drive - GPU驱动的高效多智能体强化学习框架
GPU加速GithubWarpDrive多智能体并行计算开源项目深度强化学习
WarpDrive是一款开源的强化学习框架,专为GPU环境优化。它支持单GPU或多GPU上的端到端多智能体强化学习,通过充分利用GPU并行计算能力,显著提升训练速度。WarpDrive通过减少CPU和GPU间的数据传输,并在多智能体和多环境副本间并行运行模拟,大幅提高了计算效率。这使得同时运行海量并发模拟成为可能,实现了比传统CPU方案高出百倍的训练吞吐量。
CVPR2023-DMVFN - 动态多尺度体素流网络在视频预测领域的应用
CVPR2023GithubSOTA模型动态多尺度体素流网络开源项目数据集视频预测
本项目介绍了一种在视频预测领域的新模型——动态多尺度体素流网络。该模型由CVPR2023收录并成为亮点,通过对Cityscapes、KITTI及DAVIS等多个数据集的训练和测试,展示了其在视频预测中的表现。项目页面包括详细的安装、数据准备、训练和测试步骤,并提供丰富的可视化结果和资源链接,支持预训练模型的下载以便实际应用。
One-2-3-45 - 2D扩散模型在3D AIGC中的创新应用
3D建模GithubHuggingFaceNeurIPS 2023One-2-3-45开源项目深度学习
One-2-3-45项目创新性地提出了一种2D扩散模型在3D AIGC中的正向操作方法,无需耗时的优化过程。项目提供详细的安装说明和多种演示方式,包括在线互动演示和完整的配置指南。通过整合Hugging Face的Gradio API,用户可以方便地进行图像预处理和3D网格重建。该项目已被NeurIPS 2023接受,并提供了详细的训练代码和数据集,促进单图像到3D模型的快速生成。
threestudio - 将2D文本到图像生成模型提升为3D内容创作的统一框架
3D内容生成Githubthreestudio单图像少样本图像开源项目文本提示
threestudio是一个创新的3D内容创作框架,通过升级2D文本到图像生成模型,实现从文本提示、单张图像或少量图像生成3D内容。该框架集成了多种先进的3D生成方法,包括ProlificDreamer、DreamFusion和Magic3D等。使用简单的文本描述或图像输入,可以生成高质量的3D模型、纹理和动画。threestudio提供在线演示和本地部署选项,同时支持自定义扩展,方便研究人员和开发者实现和测试新的3D生成算法。
GaussianDreamerPro - 从文本生成高质量可操作3D高斯模型的创新技术
3D Gaussians3D资产生成GaussianDreamerProGithub图像渲染开源项目文本生成3D
GaussianDreamerPro是一个新型框架,用于从文本生成高质量、可操作的3D高斯模型。该框架将高斯点绑定到几何体上,逐步优化几何结构和外观细节。这种方法不仅提高了生成资产的质量,还使其能够轻松集成到动画、合成和模拟等下游应用中,拓展了3D内容创作的可能性。
Artificient Mobility Intelligence - 移动数据智能平台 优化驾驶安全与可持续出行
AI工具事故处理自动化可持续交通移动数据智能道路风险管理驾驶行为分析
Artificient Mobility Intelligence专注移动数据智能,运用先进计算机视觉技术将闲置数据转化为实用洞察。该平台提供综合安全和可持续性解决方案,涵盖道路风险管理、数据分析、事故成本控制和碳排放降低。通过整合动态和图像数据,平台为用户提供精准驾驶风险评估,助推企业构建数据驱动的移动生态系统。
LL3DA - 3D环境下的多模态语言和视觉互动助手
3D环境3D语言模型GithubLL3DA开源项目点云视觉交互
LL3DA是一种大型语言3D助手,能够在复杂的3D环境中响应视觉和文本交互。现有的多模态模型在3D场景理解中的挑战使得LL3DA采用点云直接作为输入,从而减少计算负担并提升性能。实验结果表明,LL3DA在3D密集描述和3D问答任务上优于其他3D视觉语言模型。其开源代码和预训练模型权重允许用户训练定制模型,并进一步拓展到更大规模的3D视觉语言基准上。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号