#自动驾驶

M6 - 超大规模中文预训练模型
热门AI开发模型训练AI工具M6多模态预训练模型图像生成商品推荐自动驾驶
阿里云大数据和AI案例体验馆展示了大数据和人工智能领域的顶尖实践案例。用户可以一站式体验从数据处理到模型训练的完整流程,探索如何通过DataWorks、MaxCompute和PAI机器学习实践行业解决方案。此外,使用Hologres和Flink等先进技术,我们助力企业充分利用云计算资源,实现智能转型。
GPT-Driver - 将GPT-3.5模型用于自动驾驶运动规划的简便方法
GPT-Driver自动驾驶运动规划大型语言模型arXivGithub开源项目
GPT-Driver项目将自动驾驶的运动规划问题转化为语言建模问题,利用大型语言模型的推理和泛化能力生成驾驶轨迹。通过提示-推理-微调策略,模型能够精确描述轨迹坐标并解释决策过程。实验结果显示,在大规模nuScenes数据集上,该方法表现出色,具备有效性、泛化能力和可解释性。
ChatSim - 通过LLM-Agent协作实现自动驾驶的可编辑场景仿真
ChatSimLLM-Agent Collaboration3D Gaussian SplattingMcNeRF自动驾驶Github开源项目
ChatSim项目通过LLM与Agent协作,实现可编辑的自主驾驶场景模拟。集成的3D高斯溅射技术使背景渲染速度提升,每30秒渲染50帧,前景渲染效率也因多进程并行处理大幅度提高。该项目适用于Ubuntu系统,依赖Blender、Pytorch和CUDA工具,并支持OpenAI和NVIDIA AI模型API。详细的安装步骤和数据处理指南帮助用户轻松上手,优化自主驾驶模拟效果。
Autonomous-Driving-in-Carla-using-Deep-Reinforcement-Learning - CARLA仿真中的深度强化学习自动驾驶模型
CARLA深度强化学习PPO自动驾驶变分自编码器Github开源项目
该项目在CARLA仿真环境中,使用深度强化学习方法进行自动驾驶训练。通过结合PPO算法和变分自编码器(VAE),加速学习并提高驾驶决策能力。项目采用Python和PyTorch构建,重点在于自动驾驶和障碍物回避的持续学习。对于推动自动驾驶技术和决策效率研究具有显著意义。
MapTR - 在线向量化高精度地图快速构建框架
MapTR人工智能高精地图自动驾驶模型Github开源项目
MapTR是一款高效准确的在线向量化高精度地图构建框架,可应用于自动驾驶系统的复杂场景中。该框架采用统一的置换等效建模方法,结合分层查询嵌入和双向匹配策略,提高了学习过程的稳定性,具备实时推理能力,并在nuScenes和Argoverse2数据集中表现出色。MapTR支持多种地图元素,具备良好的扩展性和灵活性。最新版本MapTRv2提升了性能和收敛速度,并引入了额外的语义中心线,进一步优化下游规划需求。
InterFuser - 多传感器融合技术助力安全增强自动驾驶
InterFuser自动驾驶传感器融合安全增强CARLAGithub开源项目
该项目融合多模态多视角传感器信息,实现综合场景理解,生成可解释的中间特征,确保动作在安全范围内。该方法在CARLA AD排行榜上取得了最新成果,项目还提供了详细的数据生成、训练和评估步骤,以及实用工具脚本和预训练权重。
donkeycar - 模块化且简洁的Python自驾库
Donkeycar自动驾驶PythonRaspberry Pi深度学习Github开源项目
Donkeycar是一个模块化且简洁的Python自驾库,专为爱好者和学生设计,便于快速实验和社区贡献。它广泛应用于高中和大学的学习与研究,提供丰富的图形界面和模拟器功能,让用户在构建机器人前即可进行实验。适用于基于Raspberry Pi的自驾车构建,支持多种摄像头、GPS和深度学习模型,是参与线上和线下自驾车比赛的理想选择。
ECCV2024-Papers-with-Code - ECCV 2024开源项目与论文合集
ECCV 2024计算机视觉深度学习自动驾驶AIGCGithub开源项目
探索ECCV 2024的最新论文和开源项目,其中涵盖3D点云、自动驾驶、GAN和Vision Transformer等领域。ECCV 2024展示了前沿的计算机视觉和深度学习研究成果,提供论文和代码链接,帮助研究人员和开发者紧跟技术前沿。加入CVer学术交流群,与顶尖学者交流并获取最新的学习资料。
slam_in_autonomous_driving - 自动驾驶SLAM技术教程及开源代码实现
SLAM自动驾驶激光建图惯性导航组合导航Github开源项目
此项目提供自动驾驶SLAM技术的开源教程书籍和代码。内容涵盖惯性导航、组合导航、激光建图和定位等核心算法,包括误差状态卡尔曼滤波、预积分、ICP和NDT等经典SLAM算法的实现。书中提供简洁的数学推导和代码示例,并配有丰富数据集和动态演示,有助于深入理解自动驾驶中的SLAM技术。
openpilot - 开源驾驶辅助操作系统 支持275种以上车型
openpilot自动驾驶驾驶辅助系统开源软件commaGithub开源项目
openpilot是一个开源的机器人操作系统,主要应用于升级超过275种车型的驾驶辅助系统。该系统提供自适应巡航控制和车道保持等功能,可通过comma 3/3X设备和专用线束安装。openpilot注重安全性,遵循ISO26262标准,并鼓励开发者参与项目贡献。
YOLOv8-multi-task - 轻量级神经网络实现实时多任务目标检测与分割
YOLOv8多任务学习自动驾驶目标检测语义分割Github开源项目
YOLOv8-multi-task项目提出了一种轻量级神经网络模型,可同时执行目标检测、可行驶区域分割和车道线检测等多任务。该模型使用自适应拼接模块和通用分割头设计,在提高性能的同时保持高效率。实验表明,该模型在推理速度和可视化效果方面优于现有方法,适用于需要实时处理的多任务场景。
Vista - 通用自动驾驶世界模型实现高保真多场景预测
Vista自动驾驶世界模型预测控制Github开源项目
Vista是一款通用自动驾驶世界模型,可在多种场景中生成高保真度的预测,并扩展至连续和长期视野。模型支持多模态操作控制,包括转向、速度、指令、轨迹和目标点设定,无需真实操作数据即可评估不同行为。Vista在预测精度和操控灵活性上有显著提升,为自动驾驶技术研究提供了有力支持。
apollo - 开源自动驾驶平台 加速自动驾驶技术创新
Apollo自动驾驶开源平台硬件集成软件架构Github开源项目
Apollo是一个高性能灵活的自动驾驶开源平台,提供完整的软件框架和开发周期。它包含感知、预测、规划、控制等多个模块,支持多种自动驾驶场景。最新9.0版优化开发体验,提供统一工具平台和易扩展接口,为开发者创造便捷高效的开发环境。Apollo致力于推动自动驾驶技术的创新和应用。
awesome-lane-detection - 车道线检测研究综述,论文、代码与数据集汇总
车道检测深度学习计算机视觉自动驾驶论文综述Github开源项目
本项目整理了车道线检测领域的研究论文、代码实现、数据集和教程资源。内容包括2017年至今的深度学习方法、3D检测、弱监督等主流技术。收录了公开数据集和开源代码,为研究提供参考。项目持续更新最新进展,是该领域的重要资源汇总。
SMARTS - 自动驾驶多智能体强化学习模拟平台
SMARTS多智能体强化学习自动驾驶仿真平台人工智能Github开源项目
SMARTS是一个专注于真实和多样化交互的自动驾驶多智能体强化学习模拟平台,由华为诺亚方舟实验室开发。该平台提供丰富的文档、示例和模型,支持研究人员进行自动驾驶领域的复杂实验。SMARTS具有高度可扩展性,能够模拟各种复杂交通场景,为自动驾驶技术研究提供了重要的仿真环境。
carla_garage - 突破端到端自动驾驶模型的隐藏偏差 高性能仿真平台
CARLA自动驾驶端到端模型计算机视觉深度学习Github开源项目
基于CARLA仿真器的端到端自动驾驶研究开源项目。提供可配置代码、文档和高性能预训练模型,揭示了端到端驾驶模型的隐藏偏差。在多个基准测试中表现优异,支持数据生成、模型训练和评估,有助于研究人员探索自动驾驶前沿问题。
navsim - 创新自动驾驶仿真与评估系统
NAVSIM自动驾驶仿真基准测试端到端驾驶Github开源项目
NAVSIM是一个创新的自动驾驶仿真与评估系统。它通过简化的场景鸟瞰图抽象来收集端到端驾驶指标,采用开环计算方法平衡效率和闭环评估一致性。该系统支持多种代理模型,提供标准化数据集,为自动驾驶研究提供高效可靠的评估工具。NAVSIM的非反应式设计和数据驱动方法有助于推进自动驾驶技术的发展。
ad-rss-lib - 开源C++库实现自动驾驶责任敏感安全模型
RSS自动驾驶C++库安全模型开源Github开源项目
ad-rss-lib是一个开源C++库,实现了自动驾驶责任敏感安全(RSS)模型。该库可处理多车道、交叉路口和非结构化道路场景,为自动驾驶系统提供安全约束。支持自动驾驶地图集成和Python开发,已在CARLA模拟器和百度Apollo平台中应用,为自动驾驶安全研究提供了有力工具。
BEV-Planner - 端到端自动驾驶中车辆状态依赖分析与评估方法创新
自动驾驶端到端模型ego状态开环评估路径规划Github开源项目
BEV-Planner项目研究端到端自动驾驶中的关键问题。研究发现在nuScenes数据集上,模型过度依赖车辆状态而忽视感知信息。项目提出新的评估指标和基准方法,全面评估规划质量。研究结果质疑当前自动驾驶研究方向,建议重新审视现有方法。项目为自动驾驶领域提供新思路,包括道路遵循性评估和简单但有效的基线模型。
3d-bat - 全面高效的3D全景数据标注工具箱
3D BAT标注工具计算机视觉自动驾驶多模态数据Github开源项目
3D-BAT是一个开源的3D边界框标注工具箱,专门用于全景多模态数据流的处理。该工具支持AI辅助标注、批量编辑和插值模式等功能,实现了3D到2D的标签转换和自动跟踪。作为基于Web的应用,3D-BAT支持在线访问和跨平台使用,并提供了高度的可定制性。这个工具箱为自动驾驶和计算机视觉等领域的研究提供了一个实用的数据标注解决方案。
DriveMLM - 融合大语言模型的自动驾驶行为规划框架
DriveMLM自动驾驶大语言模型行为规划多模态Github开源项目
DriveMLM是一个创新的自动驾驶框架,融合了大语言模型技术。该框架通过标准化决策状态、采用多模态大语言模型进行行为规划,并设计数据引擎收集训练数据,实现了在真实模拟环境中的闭环自动驾驶。在CARLA Town05 Long测试中,DriveMLM获得76.1分的驾驶得分,比Apollo基准高出4.7分。这一成果为大语言模型在自动驾驶领域的应用提供了新的研究方向。
Apex.AI - 开发安全认证的移动系统软件解决方案
安全系统AI工具Apex.AI软件开发自动驾驶移动应用
Apex.AI开发安全认证、开发者友好且可扩展的移动系统软件。公司专注于安全性、效率和易用性,提供Apex.Grace和Apex.Ida两款产品,分别用于简化移动应用开发和优化车辆通信。Apex.AI技术帮助创新者更快速、低成本地开发软件,推动汽车制造商适应软件主导的未来。
Duckietown - 创新实践平台让机器人和AI学习变得触手可及
AI工具Duckietown机器人学习AI教育自动驾驶实践教学
Duckietown是源自MIT的全球教育项目,旨在使机器人和AI学习更易接近。该平台提供完整的自动驾驶生态系统,包括Duckiebots硬件和Duckietowns环境。它为教育者、学习者和研究人员提供资源和平台,并支持专业培训。Duckietown致力于普及机器人和AI技术学习,使其不局限于精英院校,而是面向所有感兴趣的人。
BEVFormer - 多摄像头鸟瞰图学习框架助力自动驾驶感知
BEVFormer多相机感知自动驾驶目标检测鸟瞰图表示Github开源项目
BEVFormer是一个用于自动驾驶感知的开源框架,通过时空Transformer从多摄像头图像中学习统一的鸟瞰图表示。该方法利用预定义的网格查询,结合空间交叉注意力和时间自注意力机制,有效聚合多视角的空间和时序信息。在nuScenes测试集上,BEVFormer达到56.9%的NDS指标,显著超越现有方法,与激光雷达系统性能相当。这一创新为基于纯视觉的3D目标检测提供了新的基准。
Far3D - 突破远距离3D目标检测的新框架,提升环视感知能力
Far3D3D目标检测计算机视觉深度学习自动驾驶Github开源项目
这是一个创新的稀疏查询框架,专注于解决远距离3D目标检测问题。该项目通过2D目标先验生成自适应3D查询,并利用透视感知聚合模块处理多视角和多尺度特征。还开发了范围调制的3D去噪技术,有效解决了查询错误传播和收敛问题。在Argoverse 2和nuScenes数据集上,展现出优异的性能,推动了环视3D目标检测技术的发展。
SensorsCalibration - 开源多传感器标定工具箱助力自动驾驶系统优化
传感器标定自动驾驶OpenCalib开源项目多传感器融合Github
SensorsCalibration是一个开源的多传感器标定工具箱,专注于自动驾驶领域。这个工具箱提供了IMU、LiDAR、摄像头和雷达等传感器的内参和外参标定方法。它支持基于目标和无目标的标定,同时具备手动和自动标定模式。此外,SensorsCalibration还包含工厂标定和传感器到车辆坐标系的在线标定功能。通过提高传感器融合的精度,这个工具箱为自动驾驶系统的开发和优化提供了重要支持。
TopoNet - 自动驾驶场景拓扑推理的图神经网络方法
TopoNet场景拓扑推理自动驾驶图神经网络OpenLane-V2Github开源项目
TopoNet是一个端到端框架,用于推理自动驾驶场景中车道中心线和交通元素间的连接关系。该框架采用图神经网络和知识图结构,整合异构特征并加强特征交互。TopoNet在OpenLane-V2数据集上展现了领先性能,为自动驾驶场景拓扑推理树立新标准。项目提供开源代码和预训练模型,促进自动驾驶研究发展。
MTR - 自动驾驶多模态运动预测的先进框架
Motion Transformer自动驾驶多模态运动预测神经网络Waymo数据集Github开源项目
MTR项目是一个创新的多模态运动预测框架,专为自动驾驶场景设计。它通过全局意图定位和局部运动细化的联合优化来进行运动预测,采用可学习的运动查询对处理不同的运动模式。在Waymo开放运动数据集的评测中,MTR在边缘和联合运动预测任务上均表现出色,位居排行榜首位。该框架以其简洁性、高效性和准确性为自动驾驶领域的多模态运动预测提供了一个有力的基准。
End-to-end-Autonomous-Driving - 端到端自动驾驶研究资源综合集成
自动驾驶端到端机器学习计算机视觉CARLAGithub开源项目
该项目整合端到端自动驾驶研究资源,涵盖学习材料、研讨会、论文集、基准测试、数据集及竞赛信息。旨在为自动驾驶研究提供全面参考,推动技术发展。内容定期更新,欢迎社区参与贡献。
TAD_Sim - 高效安全的跨平台自动驾驶测试仿真系统
TAD Sim自动驾驶仿真系统虚拟现实算法验证Github开源项目
TAD_Sim是腾讯自动驾驶团队开发的跨平台分布式仿真系统。该系统集成了工业级车辆动力学模型和专业渲染引擎,可实现自动驾驶全模块的闭环仿真验证。TAD_Sim支持Windows和Ubuntu平台,提供完整的开发文档和SDK。通过降低研发成本和缩短周期,TAD_Sim为自动驾驶算法的测试和验证提供了高效的解决方案。
LaneGCN - 基于车道图表示的车辆运动预测方法
LaneGCN运动预测车道图表示自动驾驶计算机视觉Github开源项目
LaneGCN是一种基于车道图表示的车辆运动预测方法。该方法利用图卷积网络处理复杂道路拓扑,提高了预测准确性。LaneGCN在Argoverse运动预测竞赛中取得第一名,显示了其在自动驾驶领域的应用潜力。项目提供了开源代码和预训练模型,便于研究人员进行复现和深入研究。
Learning-Deep-Learning - 自动驾驶与深度学习前沿技术论文笔记集锦
深度学习机器学习计算机视觉自动驾驶论文阅读Github开源项目
这个项目汇集了深度学习和机器学习领域的论文阅读笔记,重点关注自动驾驶技术。涵盖BEV感知、语义占用预测、可行驶空间检测和3D目标检测等热门研究方向。同时收录了多篇综述文章,全面呈现自动驾驶领域的最新进展和技术动向。
3D-PointCloud - 点云技术研究进展与应用综述
点云3D视觉自动驾驶目标检测语义分割Github开源项目
该项目汇总了3D点云处理相关的研究论文和数据集。内容涵盖目标检测、语义分割、点云配准和完成等多个任务。同时收录了自动驾驶、3D视觉变换器等领域的综述文献。这一资源有助于研究人员和工程师了解点云技术的最新进展。
bdd100k - 大规模驾驶视频数据集赋能自动驾驶多任务学习
BDD100K自动驾驶数据集计算机视觉多任务学习Github开源项目
BDD100K是一个专为异构多任务学习设计的多样化驾驶数据集,包含10万个视频和10个评估任务。这些数据涵盖了超过1000小时的驾驶经验,体现了地理、环境和天气的多样性。BDD100K支持图像标记、车道检测、可行驶区域分割等多项任务,为自动驾驶技术研究提供了丰富的数据资源,有助于评估图像识别算法在实际驾驶场景中的表现。
lidar-slam-detection - 面向自动驾驶和机器人的开源感知系统架构
LSD自动驾驶机器人感知激光雷达SLAMGithub开源项目
LSD是一个面向自动驾驶和机器人的开源感知系统架构。它支持多种传感器集成,提供便捷的标定工具,实现软件时间同步及数据记录回放。系统集成了基于体素3D-CNN的点云目标检测、跟踪和预测功能,以及基于GICP、FLOAM和FastLIO的前端里程计算法和基于G2O的后端优化。LSD还包含基于Web的交互式地图编辑工具,并可与ROS系统对接。作为一个功能完备的感知方案,LSD为自动驾驶和机器人应用提供了坚实的技术基础。
awesome-CARLA - CARLA自动驾驶模拟器资源大全
CARLA自动驾驶模拟器开源教程Github开源项目
CARLA是一款开源的自动驾驶系统模拟器,本文汇总了CARLA相关的优质资源,包括官方发布、教程、示例代码等。涵盖强化学习、模仿学习、多智能体、目标检测、图像分割等多个领域,为开发者提供全面的CARLA学习和应用参考。无论是入门还是进阶,都能在这里找到有价值的CARLA项目和工具。