awesome-digital-human

数字人技术资源集锦涵盖3D头像生成到虚拟试衣

数字人类 3D头像生成人体动画 3D重建计算机图形学 Github 开源项目

该项目整理了数字人领域的前沿研究和资源,包括3D人体重建、头部重建、动画生成等多个方向。内容涉及学术论文和工业应用,涵盖3D头像生成、服装建模、人体重塑等热点。为研究人员和开发者提供了解数字人技术最新进展的全面参考。

文档

Virtual-Human-for-Chatting - Unity驱动的实时交互Live2D虚拟人系统

APIGithubLive2DUnity开源项目聊天虚拟人物

Virtual-Human-for-Chatting项目是Unity驱动的实时交互Live2D虚拟人系统。整合Azure、OpenAI和APISpace API，提供虚拟人物对话、表情变化和人脸检测功能。项目附带详细部署指南和技术文档，面向研究人员和开发者需求。支持1920*1080高清分辨率，采用OpenCVPlusUnity等开源计算机视觉工具。遵循MIT许可证，同时尊重模型和美术资源版权。

ml-hugs - 从单个视频重建可动画化人体和场景的3D技术

3D重建GithubHUGS人体高斯分层动画生成开源项目神经辐射场

HUGS是一种利用神经辐射场的计算机视觉技术，能从单个视频重建背景场景和可动画化的人体3D表示。该开源项目提供完整实现，包括数据准备、模型训练和评估脚本。HUGS支持三种训练模式：联合人体和场景、仅人体以及仅场景，适用于多种应用场景。在PSNR、SSIM和LPIPS等指标上，HUGS展现了优异的性能，为人体动画和场景重建研究提供了新思路。

Awesome-Embodied-Agent-with-LLMs - 大语言模型在智能体研究与应用中的精选资源

Embodied AIGithubInteractive Embodied LearningLarge Language ModelsMulti-Agent LearningSelf-Evolving Agents开源项目

该项目汇集了使用大语言模型(LLMs)进行智能体(Embodied AI)研究的精选资源，涵盖自适应智能体、社交智能体、复杂应用、模拟学习、规划与操作、多智能体协调等专题。项目主页提供丰富的论文资料和最新研究进展，适合相关领域研究者和开发者参考，不断更新。

TalkingHead - 实时3D虚拟人物交互与唇形同步系统

3D头像GithubTalkingHeadWebGL唇形同步实时对话开源项目

TalkingHead是一个开源的JavaScript类，用于创建具有实时语音和唇形同步功能的3D虚拟形象。该系统集成了Ready Player Me全身3D头像和Mixamo动画，并支持字幕显示。借助Google Cloud TTS实现文本转语音，TalkingHead还提供英语、芬兰语和立陶宛语的内置唇形同步。通过ThreeJS/WebGL进行3D渲染，开发者可以将其轻松集成到各种网页应用中。

HR-VITON - 高分辨率虚拟试衣技术的突破性进展

GithubHR-VITON图像生成开源项目深度学习虚拟试衣计算机视觉

HR-VITON项目开发了创新的虚拟试衣条件生成器，解决了现有技术中的错位和遮挡问题。该方法通过统一模块实现服装变形和分割图生成的信息交换，避免了错位和像素挤压伪影。项目还采用判别器拒绝机制，过滤不正确的分割图预测。高分辨率数据集实验显示，HR-VITON在处理错位和遮挡方面性能显著提升，超越了现有基准方法。

flare - 高效生成可动画和可重光照的3D头像模型

FLAREGithub可动画化可重光照开源项目神经渲染网格头像

FLARE是一种新型3D头像生成方法，能从多视角图像快速学习几何形状、材质和光照信息。该技术生成的头像模型具有高质量的可动画化和可重光照特性，同时提高了生成效率。FLARE在计算机图形学领域具有重要应用价值，可用于虚拟现实、增强现实和数字人等领域，为创建个性化和交互式虚拟形象提供了新的技术支持。

awesome-multimodal-ml - 多模态机器学习最新研究与进展一览

CMUGithub多模态机器学习多模态融合多模态表示开源项目教学内容

awesome-multimodal-ml项目是多模态机器学习的综合资源库，集成了最新研究、详细教程和定期更新。它涵盖了语音、视觉、文本的深度融合技术，为学者和开发者提供一站式信息获取和学习平台，助力多模态学习研究的深入发展。

dressing-in-order - 递归生成人物图像的姿势迁移和虚拟试衣技术

GithubICCV人像生成姿势迁移开源项目服装编辑虚拟试衣

Dressing in Order 项目开发了一种创新的人物图像生成方法，实现姿势迁移、虚拟试衣和服装编辑功能。系统通过递归方式按顺序生成人物图像各部分，提高了图像操控的精细度和灵活性。项目提供开源代码、预训练模型和在线演示，便于研究者探索和应用这一技术。

Awesome-Anything - 通用AI方法的精选资源库

GithubSegment Anything人工智能图像分割开源项目目标检测计算机视觉

Awesome-Anything是一个精选的通用人工智能资源库，涵盖对象分割、图像生成、3D处理、模型优化和多任务学习等领域。该项目汇集了各种创新技术和工具，为AI研究和开发提供全面支持，助力人工智能技术的进步。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com