MocapNET

基于RGB图像的3D人体姿态实时估计

MocapNET 3D姿态估计实时性能 RGB图像 Tensorflow Github 开源项目

MocapNET项目通过2D关节估计，将单目RGB图像转换为3D人体姿态，实现实时估计。它采用NSRM表示法、新的人体方位分类器和复合神经网络，能够在显著遮挡情况下精确恢复人体姿态。通过逆运动学解算器，MocapNET显著提升了人体姿态估计的准确性。最新的MocapNET v4版本用Python重写，支持3D凝视和BVH面部配置检索，并提供一键Google Collab部署和Blender 3D编辑器插件。项目不断更新，旨在提高其对社区的实用性和可访问性。

访问官网

Github

介绍相关项目

OpenSeeFace - 基于MobileNetV3的面部特征点检测，支持多种动画模型

GithubOpenSeeFaceUnityVRMVSeeFace人脸跟踪开源项目

OpenSeeFace基于MobileNetV3进行面部特征点检测，通过ONNX优化提高了在Windows平台的推理速度，实现每秒30-60帧的单人面部跟踪。该项目提供多种模型选择，结合速度与跟踪质量，可在Unity等平台上动画化VRM和Live2D模型，支持眼睛眨动检测和面部表情识别。项目在低光和高噪声环境下表现优异，适用于多种动画和实时应用场景，并提供详细示例和自定义命令。

controlnet-openpose-sdxl-1.0 - 基于SDXL的开源人体姿态控制模型

ControlNetGithubHuggingfaceSDXL人体姿态检测图像生成开源项目机器学习模型

controlnet-openpose-sdxl-1.0是一个基于SDXL开发的人体姿态控制模型，通过OpenPose技术实现对AI生成图像中人物姿态的控制。模型在HumanArt数据集上达到0.357 mAP指标，可用于生成真实人物和动漫风格图像。该项目基于stabilityai的SDXL基础模型开发，采用Apache 2.0许可证发布。

WHAM - 基于世界坐标系的高精度3D人体动作重建技术

3D人体重建GithubWHAM人体姿态估计开源项目深度学习计算机视觉

WHAM是一种创新的3D人体动作重建技术，能在世界坐标系中精确重现人体动作。该技术基于PyTorch平台，整合了视觉变换器和SLAM技术，可从单一视频中提取精确的人体运动和姿态数据。WHAM在3DPW和EMDB等多个基准数据集上展现出卓越性能，为人体动作分析和计算机视觉研究开辟了新途径。

Webcam Motion Capture - AI网络摄像头动作捕捉软件

3D虚拟形象AI工具AI虚拟主播VTuber动作捕捉实时跟踪

Webcam Motion Capture是一款基于AI技术的动作捕捉软件，利用普通网络摄像头实现全身、手指和面部表情的追踪。无需昂贵设备，用户即可成为虚拟主播，实时捕捉手部动作、头部运动和面部表情。该软件兼容多种VTuber应用，也可用于动画制作。自2021年11月发布以来，已吸引118个国家超过22600名用户使用。

DWPose - 基于两阶段蒸馏的高效全身姿态估计方法

COCO数据集ControlNetDWPoseGithub两阶段蒸馏全身姿态估计开源项目

DWPose是一种采用两阶段知识蒸馏的全身姿态估计方法。该项目提供多个不同规模的模型,在COCO-WholeBody数据集上表现出色。DWPose可替代OpenPose用于ControlNet,提升图像生成质量。项目开源了模型及相关代码,支持ONNX推理,并可与Stable Diffusion WebUI集成。

litepose - 高效实时多人姿态估计的单分支架构

GithubLitePose人体姿态估计大核卷积开源项目效率优化边缘设备

LitePose是一种针对边缘设备的高效单分支架构，专用于实时多人姿态估计。通过融合解卷积头和大卷积核，该模型显著提升了性能。在移动平台上，LitePose将延迟降低5倍，同时保持估计精度。项目开源了预训练模型、训练脚本和评估工具，支持COCO和CrowdPose数据集。

PHALP - 基于3D外观、位置和姿态预测的人体跟踪技术

3D外观预测GithubPHALP人体跟踪位置预测姿态预测开源项目

PHALP是一个开源的3D人体跟踪项目，利用人体3D外观、位置和姿态预测实现精确跟踪。该项目提供完整代码实现，包含安装指南、演示代码、数据集准备和评估工具。PHALP可处理视频文件、YouTube视频和图像目录等多种输入源，并具备多样化的可视化功能。这一工具为人体动作分析和计算机视觉研究提供了有力支持。

gdrnpp_bop2022 - GDRNPP：BOP挑战赛获奖的6D物体姿态估计算法

6D姿态估计BOP Challenge 2022GDRNPPGithub姿态优化开源项目目标检测

GDRNPP_BOP2022是一个在ECCV'22 BOP挑战赛中获得多项大奖的6D物体姿态估计算法。该项目采用域随机化技术、ConvNext骨干网络和双重掩码头，并结合深度信息进行姿态优化。项目提供完整的训练和测试代码，涵盖目标检测、姿态估计和优化，为计算机视觉研究提供高性能的6D姿态估计工具。

DigiHuman - 基于摄像头输入的3D角色全身动画生成系统

3D动画生成DigiHumanGithubUnity3D姿态估计开源项目面部动画

DigiHuman是一个开源的人工智能项目，通过摄像头输入自动生成3D角色模型的全身和面部动画。系统结合MediaPipe生成3D关键点和Unity3D渲染技术，实现了全身动作、面部表情等多种动画效果。支持多个混合形状动画、视频导出等功能，为3D虚拟角色动画制作提供了自动化解决方案。该项目支持多种3D模型类型，并优化了动画平滑度，为动画创作者和研究人员提供了创新工具和无限可能。

control_v11p_sd15_openpose - 基于OpenPose的人体姿态控制AI图像生成模型

ControlNetGithubHuggingfaceStable Diffusion人工智能图像生成姿态检测开源项目模型

这是一个基于Stable Diffusion v1-5的图像生成控制模型，专注于人体姿态控制。相比1.0版本，该模型改进了OpenPose实现，增强了手部和面部细节控制，并优化了训练数据集。它能生成更自然准确的图像，为创作者提供精确的人物姿态控制功能。该模型可与Stable Diffusion v1-5无缝集成，适用于需要精细人体姿态控制的AI图像生成场景。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号