Project Icon

PARE

三维人体姿态与形状估计的遮挡问题解决方案

PARE是一种三维人体姿态和形状估计方法,具备遮挡鲁棒性。该项目基于PyTorch实现,提供演示和评估代码,支持在Ubuntu 18.04和Python 3.7以上环境下运行。用户可以通过Google Colab体验其功能,包括详细的训练和评估指引以及遮挡敏感性分析脚本,适用于非商业科学研究。

SKEL - 生物力学驱动的精准3D人体模型
3D人体模型GithubSKEL体型参数姿态参数开源项目骨骼模型
SKEL是一种创新的参数化人体模型,融合身体形状和骨骼结构,生成解剖学精确的3D人体。通过调整形状和姿势参数,SKEL能够控制身体外形和骨骼位置,输出关节位置、身体网格和骨骼网格。作为可微分模型,SKEL可适配多种数据源,如运动捕捉和SMPL序列。该项目开源了SKEL加载器和SMPL序列对齐工具,为数字人体建模领域提供了新的研究方向。
FoundationPose - 创新性6D物体姿态估计与跟踪的统一框架
6D物体姿态估计FoundationPoseGithub开源项目机器人应用物体跟踪计算机视觉
FoundationPose是一个统一的6D物体姿态估计和跟踪框架,支持基于模型和无模型两种方式。该框架无需微调即可应用于新物体,通过大规模合成训练、大型语言模型辅助和创新架构实现强大泛化能力。在多个公共数据集的评估中,FoundationPose在challenging场景下显著优于现有方法,即使减少假设也能达到与实例级方法相当的效果。
ROMP - 单目实时多人体3D网格重建技术
3D人物重建BEVGithubROMPTRACE单摄像头开源项目
ROMP项目是一种用于实时单目多人体3D网格重建的工具,具备一阶段处理优势,并支持跨平台API(Linux、Windows、Mac)。用户可通过pip安装。最近的更新包括TRACE代码发布,增加了对动态摄像机背景中的5D时间回归,以及BEV的训练和评估代码发布,深入研究多人体深度关系,支持所有年龄段。ROMP还支持Python调用,BVH模型导出,并通过Blender插件实现角色驱动。详细信息请参考项目的论文、数据集及相关演示视频。
6DRepNet - 全范围无约束头部姿态估计方法
6DRepNetGithub头部姿态估计开源项目旋转矩阵深度学习计算机视觉
6DRepNet是一种创新的头部姿态估计方法,采用6D旋转矩阵表示和测地线距离损失函数。该方法能学习完整的旋转外观,实现无约束全范围头部姿态预测。在AFLW2000和BIWI数据集上,6DRepNet显著优于现有方法,平均角度误差降低20%。项目提供pip安装包,支持实时摄像头演示。
GPS-Gaussian - 通用像素级3D高斯表示实现实时人体新视角合成
3D Gaussian SplattingGithub人体新视角合成实时渲染开源项目深度学习计算机视觉
GPS-Gaussian提出了一种通用像素级3D高斯表示方法,可实时合成未见过人物的新视角。无需微调或优化即可生成高质量图像,具有出色的泛化性能。项目包含安装指南、数据准备、训练和测试流程,支持合成和真实数据集评估。该方法在人体新视角合成任务中展现实时渲染能力。
sewformer - 从单一图像重建服装缝纫模式的创新方法
GithubSIGGRAPH AsiaSewformer单图像重建开源项目服装缝纫模式重建深度学习
Sewformer项目开发了一种从单张图像重建服装缝纫模式的方法。通过深度学习技术,实现2D服装图像到3D缝纫模式的转换。这一技术为服装设计、制造、虚拟试衣和个性化定制带来新的可能。项目开源了代码、预训练模型和数据集,方便研究者进行进一步探索和应用。
Total-Recon - 可变形场景重建技术实现沉浸式视角合成
3D重建GithubICCV 2023可变形场景重建开源项目视角合成计算机视觉
Total-Recon是一种可变形场景重建系统,能从RGBD传感器拍摄的长视频中重建场景几何、外观和物体运动。该系统支持从新视角渲染场景,包括第一人称和第三人称跟随视角,并提供3D视频滤镜功能。这项技术为沉浸式视角合成和增强现实应用提供了基础支持。
segformer_b2_clothes - SegFormer B2服装和人体语义分割模型
GithubHuggingfaceSegFormer人体分割图像分割开源项目模型衣物分割语义分割
这个开源项目利用SegFormer B2模型在ATR数据集上进行微调,实现了服装和人体分割功能。模型可识别17个语义类别,包括背景、服饰部件和身体部位。评估显示模型平均IoU为0.69,在多数类别中表现良好。项目还提供了简洁的示例代码,便于研究人员和开发者在实际应用中快速部署。
OpenShape_code - 革新3D形状表示方法 实现开放世界理解
3D形状表示GithubOpenShape多模态检索开放世界理解开源项目零样本分类
该项目开发了新型3D形状表示方法,通过大规模训练实现开放世界理解。这一技术在零样本3D形状分类、检索和语义理解任务中表现优异,支持多模态交互并能进行点云描述和图像生成。提供的在线演示、预训练模型和训练代码为3D视觉研究与应用拓展了新方向。
RobustCap - 单目图像和稀疏IMU信号融合的实时人体动作捕捉
GithubIMU传感器RobustCap人体动作捕捉单目图像实时系统开源项目
RobustCap是一个开源项目,提出了融合单目图像和稀疏IMU信号的实时人体动作捕捉方法。该技术在遮挡、剧烈运动和弱光等复杂场景下仍能实现高精度动作重建,适用于虚拟现实、电影制作和运动分析等领域。项目提供了完整的系统实现、评估代码以及详细的安装和使用指南,便于研究人员复现和拓展。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号