我是一个人
实时交互式GPT数字人
一. 数字人形象生成与定制
- 人体姿态估计和渲染
- 数字人动作与换装换衣试穿.md
- 视频生成.md
- 换脸
- AI换脸系列
- https://github.com/modelscope/facechain.git
- https://github.com/ZHKKKe/MODNet
- AI绘图(稳定扩散)
- 人脸人体检测分割
二. 数字人输入--语音识别
- AI语音-01-概述
- k2语音识别.md
- 耳语
- funasr+Paraformer:https://github.com/modelscope/FunASR
- SenseVoice:https://github.com/FunAudioLLM/SenseVoice
三. 数字人大脑--大语言模型
- 角色扮演模型
- Index-1.9B-Character:https://github.com/bilibili/Index-1.9B
- Character-LLM:https://github.com/choosewhatulike/trainable-agents
- 小模型
- miniCPM
- MiniCPM-V
- Phi-3-v
- gemna2b
四. 数字人讲话唱歌--语音合成
- 文本转语音
- vits,vits2
- bert-vits2学习.md
- gpt-sovits
- fish-speech
- CosyVoice:https://github.com/FunAudioLLM/CosyVoice
- 歌声合成(歌声转换):
- so-vits-svc
- NeuCoSVC
- 聊天语音合成
- 其他
- XTTS
- openvoice与MeloTTS
- https://github.com/PaddlePaddle/PaddleSpeech
五. 数字人驱动
- 真人数字人项目
- 数字人-01-方案概述
- 虚拟数字人
- 三维重建数字人
- 学习NeRF(新视角合成)
- 3D高斯gaussian-splatting.md
- 苹果联合德国马普所推出的,基于高斯函数的3D数字人合成工具HUGS
- https://machinelearning.apple.com/research/hugs
- 动作捕捉