humanplus

先进AI系统实现人形机器人影随和模仿人类

HumanPlus 人形机器人模仿学习强化学习姿态估计 Github 开源项目

HumanPlus是一个开源AI项目，致力于提升人形机器人的影随和模仿能力。项目包含两个主要组件：用于模拟环境强化学习的Humanoid Shadowing Transformer (HST)和用于现实世界模仿学习的Humanoid Imitation Transformer (HIT)。此外，HumanPlus还提供全身姿态估计和相关硬件的代码库，为研究人员和开发者提供完整的技术平台，推动人形机器人与人类互动技术的发展。

访问官网

Github

介绍相关项目

avp_teleoperate - Apple Vision Pro远程操控Unitree H1_2人形机器人

Apple Vision ProGithubUnitree H1_2VR技术开源项目机器人控制遥操作

该项目实现了Apple Vision Pro远程操控Unitree H1_2人形机器人的功能。通过逆运动学和图像传输技术，实现了双手和双臂的精确控制。项目提供了详细的环境配置指南，涵盖Isaac Gym模拟环境和本地流媒体设置。代码基于TeleVision框架，针对Unitree机器人进行了优化。这一解决方案为人形机器人远程操作开辟了新途径，具有广阔的应用前景。

Thought-Cloning - 模仿人类思维的智能体学习框架

GithubThought Cloning人工智能开源项目强化学习模仿学习神经网络

Thought Cloning是一种模仿学习框架，训练智能体模拟人类思维模式以提升性能和可解释性。该项目基于BabyAI环境实现，采用合成思维数据集。研究显示，这种方法能提高智能体在复杂任务中的表现和泛化能力。项目开源了代码、数据集和预训练模型，为研究人员提供了分析智能体思维过程的工具。

LuckyRobots - 创新虚拟平台助力机器人AI模型开发与测试

AI工具AI模型RobotGPT机器人模拟自然语言命令虚拟环境

LuckyRobots提供创新的虚拟机器人训练环境，简化软件工程师的机器人开发流程。平台特色包括先进仿真环境、端到端AI模型部署、自然语言控制、逼真物理引擎和多样虚拟场景。支持复杂任务训练和测试，致力推动RobotGPT技术发展，为机器人实际应用奠定基础。

metahuman-stream - 实时交互音视频同步对话的开源数字人项目

AI模型Github交互流式开源项目数字人视频处理音视频同步

metahuman-stream是一个开源的实时交互数字人项目，支持音视频同步对话和多种数字人模型。项目具备声音克隆、说话打断和全身视频拼接等功能，支持rtmp和webrtc传输。系统集成了多种TTS模型和LLM对话功能，为数字人应用开发提供丰富选择。该项目适用于商业级数字人应用开发，支持视频编排等高级特性。

AiOS - 先进的全流程人体姿态与形状估计框架

AiOSGithubSMPL-X人体姿态估计开源项目深度学习计算机视觉

AiOS是一个创新的人体姿态和形状估计框架，采用全新的全流程方法。该项目通过三阶段的渐进式处理，实现高精度的SMPL-X参数回归。AiOS支持多人场景分析，并能有效处理复杂遮挡情况。在AGORA和BEDLAM等多个基准数据集上，AiOS展现出卓越的性能表现。这一开源项目为计算机视觉和人机交互等领域提供了有力的研究工具。

open_x_embodiment - 统一格式机器人数据集和RT-X模型

GithubOpen X-EmbodimentRT-X模型开源项目数据集机器人学习深度学习

Open X-Embodiment项目整合多个开源机器人数据集，采用统一RLDS格式。它提供RT-1-X模型检查点，支持RGB图像输入和7维机械臂动作输出。项目包含数据集可视化和模型推理Colab示例，以及详细使用指南。这一开放资源促进机器人学习研究，简化数据处理和模型应用流程。

OmniControl - 先进的人体动作生成与精确控制技术

GithubOmniControl人体动作生成关节控制开源项目机器学习计算机视觉

OmniControl是一个基于扩散模型的人体动作生成项目，实现了对任意关节在任意时间的精确控制。通过空间引导和真实性引导，该项目能生成高质量、自然的动作序列。OmniControl提供预训练模型、训练代码和评估工具，支持HumanML3D等数据集，为动作生成研究和应用领域提供了灵活有力的解决方案。

WHAM - 基于世界坐标系的高精度3D人体动作重建技术

3D人体重建GithubWHAM人体姿态估计开源项目深度学习计算机视觉

WHAM是一种创新的3D人体动作重建技术，能在世界坐标系中精确重现人体动作。该技术基于PyTorch平台，整合了视觉变换器和SLAM技术，可从单一视频中提取精确的人体运动和姿态数据。WHAM在3DPW和EMDB等多个基准数据集上展现出卓越性能，为人体动作分析和计算机视觉研究开辟了新途径。

he4o - 通用人工智能系统,支持多种学习方式和实时决策

Githubhe4o开源项目机器学习神经网络螺旋熵减机通用人工智能

he4o系统是一种通用人工智能（AGI）解决方案，结合了迁移学习和强化学习，支持稀疏码、概念和时序等知识表征。系统能自主执行终身动态学习，基于集合论和概率论进行计算，并利用DOP编程思想进行知识演化。he4o能在单机终端如iOS设备上高效运行。

robosuite - 基于MuJoCo的机器人学习仿真框架

GithubMuJoCorobosuite基准测试开源项目机器人学习模拟框架

robosuite是基于MuJoCo物理引擎的机器人学习仿真框架，提供标准化基准环境和模块化设计。框架包含多种机器人模型、抓手模型、控制器模式和标准化任务，支持程序化生成新环境、多模态传感和逼真渲染。robosuite为机器人智能研究提供了可靠、灵活的仿真平台，降低了前沿研究的门槛。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号