Project Icon

Agent-Driver

革命性智能驾驶系统 融合人类智慧与AI技术

Agent-Driver是一个创新型自动驾驶系统,通过大型语言模型作为认知代理,将人类智能整合到自动驾驶中。系统包括多功能工具库、认知记忆和推理引擎,实现类人的推理和决策能力。在nuScenes基准测试中,Agent-Driver性能显著超越现有方法,并展现出优秀的可解释性和少样本学习能力。这一项目为自动驾驶领域提供了新的研究方向,向实现人类级别驾驶迈进。

AppAgent - 智能代理框架简化智能手机应用操作
AppAgentGPT-4VGithub多模态开源项目探索学习智能手机应用
AppAgent是一种基于LLM的多模态智能代理框架,模仿人类点击和滑动操作来运行智能手机应用。框架通过自主探索或观察人类演示学习新操作,生成知识库以执行复杂任务。无需系统后端访问,适用性广泛。提供详细配置步骤、评估基准和使用案例,支持GPT-4V和通义千问-VL等多种模型。
Awesome-Multimodal-LLM-Autonomous-Driving - 多模态大语言模型推动自动驾驶技术创新
GithubWACV人工智能多模态大语言模型开源项目自动驾驶计算机视觉
该资源库汇集自动驾驶领域多模态大语言模型(MLLM)相关研究,全面介绍MLLM在感知、规划和控制方面的应用。内容涵盖最新模型、数据集和基准,并总结WACV 2024 LLVM-AD研讨会成果。项目探讨了MLLM应用于自动驾驶系统的挑战和机遇,为研究人员和工程师提供了解该前沿领域发展的宝贵参考。
RD-Agent - 工业研发自动化的智能数据驱动平台
GithubR&DRDAgent开源项目数据驱动模型开发自动化
RDAgent专注于自动化工业研发的关键环节,尤其在数据驱动的场景下,优化模型和数据的开发。通过‘R’(科研)和‘D’(开发)两个核心组件,实现研发流程的自动化升级,带来显著的工业应用价值。RDAgent提供多种自动化功能,如量化交易、数据挖掘和研究助手等,显著提升研发效率。用户可通过Docker和Conda快速安装和运行RDAgent,并体验多种在线演示。
vision-agent - 开源AI代理库用于生成计算机视觉代码
AI代码生成GithubOpenAI APIVision Agent图像处理开源项目计算机视觉
Vision Agent是一个开源库,通过AI代理框架快速生成计算机视觉任务代码。用户可以用文本描述问题,AI代理会生成相应的解决方案。该库包括对话型VisionAgent和代码生成型VisionAgentCoder两种代理,提供多种视觉工具,支持自定义工具添加,并可与Azure OpenAI集成。Vision Agent能将解决视觉问题的时间大幅缩短,提高开发效率。
agentchain - 使用大型语言模型(LLM)来规划和编排多个代理,或使用大型模型(LM)来完成复杂的任务。
AgentChainGithub交互代理任务编排多模态大型语言模型开源项目
AgentChain采用先进的的大型语言模型,提供基于自然语言输入的规划与决策能力,支持文本、图像、音频和表格数据等多模态输入输出。其智能系统能够协调多个agent执行复杂任务,适用于计算机视觉、语音识别等数据处理工作,并可定制以满足各类项目需求,从自动化生成旅游图片到金融分析报告。此外,AgentChain还能通过Twilio等平台实现邮件发送和电话通知等通信任务。
AgentLLM - 用LLM打造自主代理,浏览器端高效运行
AgentLLMChatGPTGithubWebGPUWizardLM开源项目浏览器原生LLM
AgentLLM展示了使用开源大型语言模型(LLM)在浏览器上运行自主代理的潜力,可有效处理复杂的目标导向任务。通过利用WebGPU,项目显著提升了性能,并在无工具简化版的AgentGPT环境中实现。该平台适合于希望快速验证LLM能力的用户,界面友好且功能丰富。
Best-AI-Agents - 顶尖AI代理实现创新自动化和智能任务执行
AI代理Github开源开源项目无代码平台智能助手自动化
Best-AI-Agents项目展示一系列先进的人工智能技术,展现出先进的自动化代理带来的智能解决方案。项目涉及广泛的商业和教育领域应用,包括代码生成、研究创新和模型部署等多种功能。其中涵盖的AI代理如AutoGPT、AgentGPT和Cognosys,展示出各自在机器学习领域的独特应用和功能。
HighwayEnv - 多场景自动驾驶模拟与决策训练环境
Githubhighway-env决策系统开源项目强化学习环境仿真自动驾驶
HighwayEnv是一个自动驾驶和决策任务模拟环境集。它包含高速公路、环岛、停车场和十字路口等多种场景,模拟真实驾驶情况。支持DQN、DDPG和MCTS等多种强化学习算法,便于研究人员开发和测试自动驾驶策略。该项目具有良好的可用性和扩展性,适用于自动驾驶研究和教学。
Autonomous-Driving-in-Carla-using-Deep-Reinforcement-Learning - CARLA仿真中的深度强化学习自动驾驶模型
CARLAGithubPPO变分自编码器开源项目深度强化学习自动驾驶
该项目在CARLA仿真环境中,使用深度强化学习方法进行自动驾驶训练。通过结合PPO算法和变分自编码器(VAE),加速学习并提高驾驶决策能力。项目采用Python和PyTorch构建,重点在于自动驾驶和障碍物回避的持续学习。对于推动自动驾驶技术和决策效率研究具有显著意义。
pytorch-auto-drive - 基于 PyTorch 的分割模型和车道检测模型
GithubPyTorchPytorchAutoDrive开源项目模型部署语义分割车道检测
框架基于纯Python和PyTorch,提供从模型训练、测试到可视化和部署的全方位支持。特色包括多种主干网络、简洁易懂的代码、混合精度训练及ONNX和TensorRT的部署支持。该框架中模型训练速度快,性能优于其他实现,支持多种数据集和模型方法,为自动驾驶研究提供可靠的基准测试和高效工具。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号