Project Icon

BEV-Planner

端到端自动驾驶中车辆状态依赖分析与评估方法创新

BEV-Planner项目研究端到端自动驾驶中的关键问题。研究发现在nuScenes数据集上,模型过度依赖车辆状态而忽视感知信息。项目提出新的评估指标和基准方法,全面评估规划质量。研究结果质疑当前自动驾驶研究方向,建议重新审视现有方法。项目为自动驾驶领域提供新思路,包括道路遵循性评估和简单但有效的基线模型。

LLMs-Planning - 大型语言模型规划与推理能力评估与分析工具
GithubLLM人工智能基准测试开源项目规划评估
LLMs-Planning项目包含PlanBench和大型语言模型规划能力分析两个子项目。PlanBench提供可扩展的基准测试,用于评估大型语言模型在规划和推理变化方面的表现。项目还对大型语言模型的规划能力进行了批判性调查,为自然语言处理和人工智能规划领域的研究者提供了重要参考。
SparseBEV - 多摄像头视频中的高性能稀疏3D目标检测技术
GithubICCV 2023PyTorchSparseBEVnuScenes开源项目立体检测
SparseBEV利用多摄像头视频实现高性能稀疏3D目标检测,得到ICCV 2023的认可,并提供PyTorch实现、训练和评估指南。新发布的SparseOcc展示了全稀疏架构支持多种预训练权重和配置文件。用户可使用提供的代码进行可视化和模型优化,实现高效3D检测。兼容不同版本的PyTorch和CUDA,表现卓越。
PersFormer_3DLane - PersFormer基于透视变换实现精确的3D车道线检测
3D车道线检测GithubOpenLane基准PersFormerPyTorch实现开源项目透视变换
PersFormer是一种创新的3D车道线检测模型,采用基于Transformer的模块生成BEV特征并参考相机参数。模型能同时进行2D和3D车道检测,提升特征一致性与多任务学习效果。PersFormer在OpenLane和Apollo 3D Lane Synthetic数据集上的表现优异,超越了多种现有方法,并提供简便的安装与评估说明以及详细的训练和测试指南,成为3D车道检测领域的重要进展。
traffic_prediction - 交通预测模型与数据集综合评估
GithubPeMS数据集交通预测图神经网络开源项目时间序列深度学习
这个项目对交通预测领域的多种模型和数据集进行了系统的比较分析。它汇总了近期发表的相关论文,详细介绍了METR-LA、PeMS-BAY等常用公开数据集。项目提供了各模型在主要数据集上的性能对比图表,并探讨了实验设置的差异。同时,它还整理了可公开获取的数据集及其来源信息,为交通预测研究提供了有价值的参考资料。
transfuser - 创新传感器融合技术助力自动驾驶进步
CARLAGithubTransFuser传感器融合开源项目深度学习自动驾驶
TransFuser项目采用Transformer架构实现多模态传感器数据融合,显著提高自动驾驶系统性能。该方法在CARLA自动驾驶基准测试中表现出色,为端到端自动驾驶提供了新思路。项目开源代码、数据集和预训练模型,便于研究者进行复现和深入研究。
MagicDrive - 多样化3D几何控制的街景生成框架
3D几何控制GithubMagicDrive开源项目扩散模型街景生成计算机视觉
MagicDrive是一个创新街景生成框架,提供多样化的3D几何控制,包括相机姿态、道路地图和3D边界框。通过结合文本描述、定制编码策略和跨视图注意力模块,实现了多相机视角的一致性。该框架能生成高保真街景图像和视频,精确捕捉3D几何特征和场景细节,有助于提升BEV分割和3D物体检测等任务的性能。
carla - 一个用于自动驾驶研究的开源模拟器
CARLAGithub仿真平台开源模拟器开源项目自主驾驶自动驾驶系统
CARLA是一款专为自动驾驶研究设计的开源模拟器,支持开发、训练和验证自动驾驶系统。提供丰富的开放数字资产,包括城市布局、建筑物和车辆,并支持灵活配置传感器套件和环境条件。CARLA支持在多平台上模拟和测试自动驾驶解决方案。
apollo - 开源自动驾驶平台 加速自动驾驶技术创新
ApolloGithub开源平台开源项目硬件集成自动驾驶软件架构
Apollo是一个高性能灵活的自动驾驶开源平台,提供完整的软件框架和开发周期。它包含感知、预测、规划、控制等多个模块,支持多种自动驾驶场景。最新9.0版优化开发体验,提供统一工具平台和易扩展接口,为开发者创造便捷高效的开发环境。Apollo致力于推动自动驾驶技术的创新和应用。
UniTR - 多模态变换器网络推动3D感知进展
3D感知BEV分割GithubUniTR多模态转换器开源项目目标检测
UniTR是一种新型统一多模态变换器网络,用于3D感知任务。它通过共享权重处理相机和激光雷达等多传感器数据,实现高效多模态融合。在nuScenes数据集上,UniTR在3D目标检测和BEV地图分割任务中均达到最新水平,且降低推理延迟。该研究为提升自动驾驶系统的感知能力提供了新思路。
SMARTS - 自动驾驶多智能体强化学习模拟平台
GithubSMARTS人工智能仿真平台多智能体强化学习开源项目自动驾驶
SMARTS是一个专注于真实和多样化交互的自动驾驶多智能体强化学习模拟平台,由华为诺亚方舟实验室开发。该平台提供丰富的文档、示例和模型,支持研究人员进行自动驾驶领域的复杂实验。SMARTS具有高度可扩展性,能够模拟各种复杂交通场景,为自动驾驶技术研究提供了重要的仿真环境。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号