humanplus

先进AI系统实现人形机器人影随和模仿人类

HumanPlus 人形机器人模仿学习强化学习姿态估计 Github 开源项目

HumanPlus是一个开源AI项目，致力于提升人形机器人的影随和模仿能力。项目包含两个主要组件：用于模拟环境强化学习的Humanoid Shadowing Transformer (HST)和用于现实世界模仿学习的Humanoid Imitation Transformer (HIT)。此外，HumanPlus还提供全身姿态估计和相关硬件的代码库，为研究人员和开发者提供完整的技术平台，推动人形机器人与人类互动技术的发展。

访问官网

Github

介绍相关项目

openpose - 实时检测人体、手部、面部和足部的多人人体关键点

CMU Panoptic StudioGithubOpenPose三维重建人体姿态识别实时多人人体关键点检测开源项目

OpenPose是首个实现实时多人人体、手部、面部和足部关键点检测的系统，能够在单张图像上检测135个关键点。其功能包括2D和3D姿态估计、支持Unity插件和多种输入输出方式，兼容多个操作系统和硬件配置，适用于研究和开发项目。

MonoHuman - 单目视频生成可动画化3D人体神经场景技术

3D渲染GithubMonoHuman人体神经场动画化人体单目视频开源项目

MonoHuman框架利用单目视频生成高质量、视角一致的3D人体动画。通过双向变形约束和关键帧信息建模变形场，实现任意新姿势的高保真渲染。该技术在ZJU-Mocap数据集和自然场景视频中表现优异，为虚拟现实和数字娱乐领域提供了有力支持。

EchoMimic - 音频驱动的逼真人像动画系统支持关键点编辑

AI模型EchoMimicGithub关键点条件开源项目肖像动画音频驱动

EchoMimic是一个音频驱动的人像动画系统，通过编辑关键点来控制动画效果。系统支持英语和中文音频输入，可生成自然的口型、表情和头部动作。项目开源了推理代码和预训练模型，可用于生成高质量的说话头视频，适用于虚拟主播等应用场景。

habitat-lab - 模块化库，支持多任务AI训练与人机交互

GithubHabitat-Labembodied AI任务训练多代理开源项目模拟器

Habitat-Lab是一个模块化库，专为端到端体态AI任务开发设计。支持多种任务定义、代理配置与训练评估，以及人机交互。结合Habitat-Sim模拟器，Habitat-Lab提供灵活的训练环境和评估工具，是体态AI研究的关键平台。

Virtual-Human-for-Chatting - Unity驱动的实时交互Live2D虚拟人系统

APIGithubLive2DUnity开源项目聊天虚拟人物

Virtual-Human-for-Chatting项目是Unity驱动的实时交互Live2D虚拟人系统。整合Azure、OpenAI和APISpace API，提供虚拟人物对话、表情变化和人脸检测功能。项目附带详细部署指南和技术文档，面向研究人员和开发者需求。支持1920*1080高清分辨率，采用OpenCVPlusUnity等开源计算机视觉工具。遵循MIT许可证，同时尊重模型和美术资源版权。

robohive - 多功能机器人学习环境集合提供丰富模拟任务

GithubMuJoCoOpenAI-GymRoboHive开源项目机器人操作机器人环境

RoboHive是基于MuJoCo物理引擎的机器人学习环境集合,包含手部操作、机械臂控制、肌肉骨骼模拟等多个任务套件。支持OpenAI Gym接口,兼容主流强化学习框架。环境丰富多样,安装使用简便,适合各类机器人学习研究。

PHALP - 基于3D外观、位置和姿态预测的人体跟踪技术

3D外观预测GithubPHALP人体跟踪位置预测姿态预测开源项目

PHALP是一个开源的3D人体跟踪项目，利用人体3D外观、位置和姿态预测实现精确跟踪。该项目提供完整代码实现，包含安装指南、演示代码、数据集准备和评估工具。PHALP可处理视频文件、YouTube视频和图像目录等多种输入源，并具备多样化的可视化功能。这一工具为人体动作分析和计算机视觉研究提供了有力支持。

lerobot - 实用机器学习库助力实际机器人开发

GithubLeRobot开源项目强化学习机器人模拟环境预训练模型

LeRobot是一个基于PyTorch的机器人应用开发库,提供模型、数据集和工具。它侧重模仿学习和强化学习,包含预训练模型、人类示范数据集和仿真环境,降低机器人技术门槛。该库支持ALOHA、PushT和XArm等多种环境和策略,未来将扩展实际机器人支持。LeRobot旨在促进数据集和预训练模型的共享,推动机器人技术发展。

ROS-LLM - 一个用于具身智能应用的ROS框架

GPT-4GithubROS-LLMROS2开源项目机器人控制自然语言交互

ROS-LLM项目打造了一个使用大语言模型（如GPT-4和ChatGPT）的ROS框架，用于机器人决策和控制。框架易于扩展和集成，只需简单API配置，十分钟内即可完成机器人与ROS-LLM的结合，快速创建互动与控制体验。支持ROS系统，并拥有本地和云端自然语音交互、历史记录保存功能。未来计划增加导航接口和传感器输入接口，以提升机器人导航与环境感知能力。

multi_verse_model - 运用创新方法展示人工智能学习与发展的可能性

GithubHuggingface人工智能创新概念学习机器人开源项目持续学习模型知识吸收

基于先进训练技术的人工智能项目，展示了持续学习和发展的未来潜力，体现技术研发中的突破性实验成果。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号