Project Icon

ibc

隐式行为克隆算法在机器人策略学习中的创新应用

IBC项目提出的隐式行为克隆算法在机器人策略学习中表现优异。该方法善于处理复杂、不连续和多值函数,适用于高维动作空间和视觉输入场景。在D4RL基准测试中,IBC在人类专家任务上与顶尖离线强化学习方法相当。实际应用中,IBC能让机器人学习复杂精细行为,应对高组合复杂性和毫米级精度任务。

DriveMLM - 融合大语言模型的自动驾驶行为规划框架
DriveMLMGithub多模态大语言模型开源项目自动驾驶行为规划
DriveMLM是一个创新的自动驾驶框架,融合了大语言模型技术。该框架通过标准化决策状态、采用多模态大语言模型进行行为规划,并设计数据引擎收集训练数据,实现了在真实模拟环境中的闭环自动驾驶。在CARLA Town05 Long测试中,DriveMLM获得76.1分的驾驶得分,比Apollo基准高出4.7分。这一成果为大语言模型在自动驾驶领域的应用提供了新的研究方向。
Imitator - 个性化语音驱动3D面部动画生成系统
3D面部动画GithubICCV 2023Imitator个性化开源项目语音驱动
Imitator是一个3D面部动画生成系统,能将个人语音转化为逼真的面部表情。该项目基于深度学习技术,实现了语音到面部动作的精确映射。Imitator提供通用模型和个性化训练方法,可适应不同说话者的特征。这项技术可应用于虚拟现实、电影制作和人机交互等领域。
beebot - 多功能自主AI助手项目
AI助手BeeBotGithub工具选择开源项目持久化自主任务
BeeBot是一个开源的自主AI助手项目,设计用于执行多样化实际任务。该项目集成了工具选择、持久性和REST API等功能,并支持动态历史记录操作和缓存。尽管当前开发处于暂停状态,BeeBot未来可能随LLM技术进步或特定任务需求而重启。项目注重功能性、灵活性和可靠性,采用工具导向和LLM专业化方法,致力于推动AI助手技术创新。
octo - 基于transformer的通用机器人控制策略
AI模型GithubOcto开源项目微调机器人政策预训练模型
Octo是一个基于transformer的扩散策略模型,通过80万条多样化机器人轨迹数据训练而成。该模型支持多个RGB相机输入,可控制各种机器人手臂,并接受语言命令或目标图像指令。其模块化注意力结构使其能高效迁移至新的传感器输入、动作空间和形态。项目提供预训练模型、微调脚本和评估示例,便于研究人员进行深入开发和应用。
rllte - 强化学习研究和应用的长期演进项目
GithubRLLTE工具包开源项目强化学习生态系统算法实现
RLLTE项目受到电信长期演进标准的启发,旨在为强化学习研究与应用提供开发组件和标准。项目不仅提供高质量的算法实现,还作为开发算法的实用工具包。RLLTE支持模块化设计、优化硬件加速、兼容多种计算设备和自定义环境,且包含大量可重复使用的基准。
reflexion - 具有语言强化学习的代理
AlfWorldGPT-4GithubHotPotQAReflexionVerbal Reinforcement Learning开源项目
介绍Reflexion项目及其在语言强化学习中的应用。该项目提供详细的实验指南,涵盖推理和决策过程的操作步骤与策略。用户可以通过不同智能体类型和反射策略进行实验,了解其对结果的影响。项目代码和日志已发布,并附有丰富的资源和支持信息。
LuckyRobots - 创新虚拟平台助力机器人AI模型开发与测试
AI工具AI模型RobotGPT机器人模拟自然语言命令虚拟环境
LuckyRobots提供创新的虚拟机器人训练环境,简化软件工程师的机器人开发流程。平台特色包括先进仿真环境、端到端AI模型部署、自然语言控制、逼真物理引擎和多样虚拟场景。支持复杂任务训练和测试,致力推动RobotGPT技术发展,为机器人实际应用奠定基础。
calvin - 机器人长时间操作任务中基于语言条件的策略学习
CALVINGithub开源基准开源项目机器人操控语言模型长期任务
CALVIN是一个开源的模拟基准,用于学习长时间的语言条件任务,旨在开发能够通过人类语言指令和车载传感器完成多种机器人操作任务的代理。该项目支持复杂任务序列、动作空间和语言规格,提供灵活的传感器配置详细评估协议,并通过多种难度模式提高测试效能。项目资源包括训练模型、评估脚本和数据下载选项,是机器人视觉与语言研究的理想选择。
Deep-RL-Keras - 模块化实现深度强化学习算法,支持A2C、A3C、DDPG、DDQN
Actor-Critic算法GithubKeras优化算法开源项目深度Q学习深度增强学习
本项目在Keras框架下实现了多种常用的深度强化学习算法模块化,包括A2C、A3C、DDPG、DDQN等。用户可以通过命令行参数运行不同的RL算法,并在OpenAI Gym环境中进行训练。项目支持模型可视化和Tensorboard监控,提供详细的算法说明和使用案例,帮助用户理解和应用这些技术。
umi-on-legs - 四足机器人操作技能的全身控制框架
GithubUMI on Legs全身控制器四足机器人开源项目机器人操作视觉运动策略
UMI on Legs项目为四足机器人与机械臂结合提供了可扩展的操作技能框架。该框架整合真实人类示范和模拟训练的全身控制器,实现视觉运动策略在四足机器人上的应用。项目涵盖全身控制器模拟训练、实际部署、iPhone里程计应用、UMI真实环境类和ARX5 SDK等组件,为机器人操作研究提供综合解决方案。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号