DriveMLM

融合大语言模型的自动驾驶行为规划框架

DriveMLM 自动驾驶大语言模型行为规划多模态 Github 开源项目

DriveMLM是一个创新的自动驾驶框架，融合了大语言模型技术。该框架通过标准化决策状态、采用多模态大语言模型进行行为规划，并设计数据引擎收集训练数据，实现了在真实模拟环境中的闭环自动驾驶。在CARLA Town05 Long测试中，DriveMLM获得76.1分的驾驶得分，比Apollo基准高出4.7分。这一成果为大语言模型在自动驾驶领域的应用提供了新的研究方向。

Github

介绍相关项目

awesome-azure-openai-llm - 揭示Azure OpenAI与大型语言模型（LLM）的综合功能

API集成Azure OpenAIGithub信息检索大语言模型开源项目语言模型训练

提供Azure OpenAI和大型语言模型（LLM）的综合参考，包括服务与技术的详细比较和专有功能介绍。深入探讨私有网络支持、角色认证和AI内容过滤的优势，非常适合希望全面了解并运用Azure OpenAI整合服务的技术用户。

MG-LLaVA - 融合多粒度视觉特征的大语言模型

GithubMG-LLaVA多模态大语言模型多粒度视觉指令调优开源项目性能提升视觉处理

MG-LLaVA是一种创新的多模态大语言模型，通过整合低分辨率、高分辨率和物体中心特征，显著提升了视觉处理能力。模型引入高分辨率视觉编码器捕捉细节，并利用Conv-Gate网络融合视觉特征。同时集成离线检测器的物体级特征，增强了物体识别能力。仅基于公开多模态数据进行指令微调，MG-LLaVA在多项基准测试中展现出优异的感知表现。

easyllm - 开源工具库助力简化大语言模型应用开发

API客户端EasyLLMGithubOpenAI兼容大语言模型开源项目

EasyLLM是一个开源项目，为开发者提供简化大语言模型操作的工具和方法。该项目实现了兼容OpenAI API的客户端，支持HuggingFace、Amazon SageMaker和Amazon Bedrock等平台的模型。EasyLLM允许开发者轻松切换不同语言模型，实现聊天、文本补全和嵌入等功能。此外，项目还包含进化指令生成和提示词工具等辅助模块，有效简化了大语言模型的应用开发流程。

OpenLLM - 一键部署开源LLM，支持企业级云部署和OpenAI兼容API

GithubOpenAI兼容APIOpenLLM云部署开源项目热门自托管LLM量化模型

OpenLLM为开发者提供一键部署各种开源大型语言模型(LLM)到企业级云环境的解决方案，支持OpenAI兼容的API端点。该项目集成最新的加速解码技术，并提供内置的ChatGPT界面，能够快速实现模型的互动和部署。用户只需简单的命令，即可本地运行或部署到云端，轻松管理和使用各种顶尖LLM，如Llama 3.1、Mistral和Qwen2等。

Time-LLM - 开发用于时序预测的高级语言模型

GithubICLR 2024Time-LLM大语言模型开源项目时间序列预测框架重编程

Time-LLM将大型语言模型重新用于时序预测，利用其强大功能处理时序数据，并结合专家知识和任务说明提升预测精度。支持Llama-7B、GPT-2和BERT等模型，框架灵活且适应性广泛。了解Time-LLM的最新更新、使用案例和技术细节，访问我们的详细介绍及相关资源。

VideoLLaMA2 - 增强视频理解的多模态语言模型

AIGithubVideoLLaMA2多模态大语言模型开源项目视频理解

VideoLLaMA2是一款先进的视频语言模型,通过增强空间-时间建模和音频理解能力,提高了视频问答和描述任务的性能。该模型在零样本视频问答等多项基准测试中表现出色。VideoLLaMA2能处理长视频序列并理解复杂视听内容,为视频理解技术带来新进展。

Awesome_Multimodel_LLM - 多模态大语言模型资源集锦及研究动态

Github上下文学习多模态大语言模型开源项目思维链指令微调视觉推理

本项目汇集了多模态大语言模型(MLLM)相关资源,涵盖数据集、指令微调、上下文学习、思维链等多个方面。内容持续更新,跟踪MLLM领域最新进展。项目还将发布LLM和MLLM最新研究综述。这是研究人员和开发者了解MLLM前沿动态的重要参考。

awesome-CARLA - CARLA自动驾驶模拟器资源大全

CARLAGithub开源开源项目教程模拟器自动驾驶

CARLA是一款开源的自动驾驶系统模拟器,本文汇总了CARLA相关的优质资源,包括官方发布、教程、示例代码等。涵盖强化学习、模仿学习、多智能体、目标检测、图像分割等多个领域,为开发者提供全面的CARLA学习和应用参考。无论是入门还是进阶,都能在这里找到有价值的CARLA项目和工具。

Awesome-World-Model - 自动驾驶领域的世界模型研究与应用进展

Autonomous DrivingCVPRGenerative AIGithubSurveyWorld Models开源项目

本页面汇总了关于自动驾驶世界模型的最新论文和研究成果，涵盖包括CVPR、ECCV、ICML和ICLR等知名会议和期刊的前沿研究。通过这些世界模型，研究人员能够预测未来状态，提升基础模型性能，并生成未来的点云数据。此外，页面还介绍了重要的研讨会与挑战赛，以及业界专家的技术博客和视频，提供了对自动驾驶世界模型应用的全面视角。

LVM - 大规模视觉模型的创新顺序建模方法

GithubLVM大规模视觉模型序列建模开源项目视觉句子视觉预训练模型

LVM是一种创新视觉预训练模型，将多种视觉数据转化为视觉句子，并进行自回归式标记预测。该模型采用顺序建模方法，无需语言数据即可学习大规模视觉模型。通过设计视觉提示，LVM可解决多种视觉任务。兼容GPU和TPU，为大规模视觉模型学习提供新方法。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号