Project Icon

AvatarPoser

革新全身姿态跟踪 仅需头手运动数据

AvatarPoser是一项突破性的全身姿态预测技术,仅需头部和手部运动数据即可在世界坐标系中准确估计全身姿态。该方法结合Transformer编码器和运动解耦技术,通过逆运动学优化生成逼真动作。AvatarPoser在大型动作捕捉数据集上表现出色,并具备实时推理能力,为元宇宙应用中的全身虚拟形象控制提供了实用解决方案。

ED-Pose - 革新端到端多人姿态估计框架
ED-PoseGithub多人姿态估计开源项目深度学习目标检测计算机视觉
ED-Pose创新性地将多人姿态估计任务重新定义为两个显式框检测过程,无需后处理和密集热图监督。该框架在COCO数据集上超越同等骨干网络的热图方法1.2 AP,并在CrowdPose数据集上达到76.6 AP的领先水平。ED-Pose还兼容Human-Art数据集,并优化了推理速度。
TF-SimpleHumanPose - 2D多人体姿态估计和追踪的简易基线方法
GithubMS COCOTensorFlow姿态估计开源项目简单基线跟踪
该项目是利用TensorFlow实现的2D多人体姿态估计与追踪代码库,兼容多个数据集如MPII、PoseTrack 2018和MS COCO 2017。其代码简洁灵活,提供训练、测试和可视化功能,并生成与MS COCO和PoseTrack兼容的输出文件。在CUDA和cuDNN环境的Ubuntu系统上进行多GPU训练和测试。
Imitator - 个性化语音驱动3D面部动画生成系统
3D面部动画GithubICCV 2023Imitator个性化开源项目语音驱动
Imitator是一个3D面部动画生成系统,能将个人语音转化为逼真的面部表情。该项目基于深度学习技术,实现了语音到面部动作的精确映射。Imitator提供通用模型和个性化训练方法,可适应不同说话者的特征。这项技术可应用于虚拟现实、电影制作和人机交互等领域。
lightning-pose - 基于PyTorch Lightning的高效姿态估计框架
GithubLightning Pose姿态估计开源项目深度学习计算机视觉
Lightning Pose是一个基于PyTorch Lightning的姿态估计框架,利用NVIDIA DALI加速未标记视频的训练。框架集成了TensorBoard、FiftyOne和Streamlit等评估工具,支持已标记数据和未标记视频的模型训练与评估。项目还提供浏览器应用,涵盖数据标注、模型训练到结果可视化的完整流程。此外,团队开发的Ensemble Kalman Smoother (EKS)后处理器可与多种姿态估计包兼容。
DreamWaltz - 基于文本生成3D可动画化虚拟形象和场景
3D动画头像DreamWaltzGithubNeRF人体姿态开源项目文本生成3D
DreamWaltz是一个文本驱动的3D可动画化虚拟形象创建框架,结合了预训练2D扩散模型和人体参数模型。通过优化可变形NeRF表示,该框架能从骨骼条件下的扩散监督中学习,实现3D一致性和对任意姿势的泛化。DreamWaltz不仅可以生成单个可动画化虚拟形象,还能构建复杂场景,实现虚拟形象与物体、环境及其他虚拟形象的交互。
Avatar AI - 专业级AI人像照片生成平台
AI工具AI模型训练AI照片生成Avatar AI人工智能摄影虚拟写真
Avatar AI是一款生成逼真人像照片的智能工具。用户上传自拍后可创建AI模型,通过提示词生成各种场景和风格的照片。该平台提供预设模板、服装试穿和视频生成等功能,能为用户节省摄影成本。内容创作者和电商店主可利用其高效生成所需图片素材。
Avaturn - AI逼真3D头像创建和定制化平台
AI工具Avaturn头像定制实时渲染插件集成游戏开发
Avaturn是一款先进的3D头像创建工具,通过AI技术将单张自拍照转换为高质量3D模型。平台提供丰富的定制选项,包括多样化的身体类型、发型、服装和配饰,可创建超过10,000种独特外观。生成的头像支持标准人形骨骼和ARKit混合形状,兼容Mixamo动画系统和VTubing软件。Avaturn还为开发者提供插件和SDK,方便将其技术整合到各类游戏、应用或元宇宙项目中,提升最终用户体验。
head-pose-estimation - 实时人脸姿态估计,使用ONNX Runtime和OpenCV进行处理
GithubONNX RuntimeOpenCV人脸检测头部姿态估计开源项目面部特征点检测
本项目提供了一个实时的人脸姿态估计解决方案,依赖于ONNX Runtime和OpenCV框架。主要步骤包括人脸检测、68个面部标志点检测以及姿态估计。支持Ubuntu 22.04,提供简单的安装步骤和预训练模型下载链接,使用户可以快速启动并运行。本项目支持视频文件和摄像头输入,提供了详尽的训练指导和代码库,确保了高度的灵活性和扩展性,适合开发和测试用途。
DigiHuman - 基于摄像头输入的3D角色全身动画生成系统
3D动画生成DigiHumanGithubUnity3D姿态估计开源项目面部动画
DigiHuman是一个开源的人工智能项目,通过摄像头输入自动生成3D角色模型的全身和面部动画。系统结合MediaPipe生成3D关键点和Unity3D渲染技术,实现了全身动作、面部表情等多种动画效果。支持多个混合形状动画、视频导出等功能,为3D虚拟角色动画制作提供了自动化解决方案。该项目支持多种3D模型类型,并优化了动画平滑度,为动画创作者和研究人员提供了创新工具和无限可能。
PARE - 三维人体姿态与形状估计的遮挡问题解决方案
3D人体姿态估计GithubICCV 2021PAREPyTorch人体形状估计开源项目
PARE是一种三维人体姿态和形状估计方法,具备遮挡鲁棒性。该项目基于PyTorch实现,提供演示和评估代码,支持在Ubuntu 18.04和Python 3.7以上环境下运行。用户可以通过Google Colab体验其功能,包括详细的训练和评估指引以及遮挡敏感性分析脚本,适用于非商业科学研究。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号