Duix - 基于硅的数字人SDK 🌐🤖 [英文]
Duix.Snap(新产品)
将照片转换为有趣的视频和表情符号
支持
加入我们的微信或Discord社区获取支持和讨论。关注Twitter,观看基于DUIX开源能力创建的最新数字人视频。
💬 加入我们的微信
😄 加入我们的Discord
✨ 在Twitter上关注我们
简介
DUIX,全称"对话用户界面系统",是硅基智能创建的AI驱动的数字人交互平台。通过开源数字人交互能力,开发者可以轻松集成大规模模型、自动语音识别(ASR)和文本转语音(TTS)能力,实现与数字人的实时交互。它支持在Android和iOS等多个平台上一键部署,使每个开发者都能轻松创建智能和个性化的数字人代理,并应用于各行各业。
项目特点
- 低部署成本:客户无需提供技术团队合作,支持在各种终端和大屏上低成本快速部署。
- 低网络依赖:适用于地铁、银行、政务等场景的虚拟助手自助服务。
- 功能多样:可根据客户需求满足多个行业的视频、媒体、客户服务、金融、广播电视等多样化需求。
源代码目录说明
duix-android: 安卓演示
duix-ios: iOS演示
开放文档入口
安卓请参考 README_en.md
iOS请参考 GJLocalDigitalSDK_en.md
如何部署
本文档详细描述了开发者在此项目中的集成过程。需要注意的是,每个开发者在集成过程中可能会遇到不同的阶段。本文档旨在供开发者参考使用。
接口参考手册_中文版
接口参考手册_英文版
下载数字人本地模型
我们提供了一系列数字人模型供下载使用。我们会不定期更新本地模型包,以便您下载并使用最新的模型。以下是目前可用的本地模型包列表:
男性
女性
亲爱的姐姐 下载 |
请根据您的需求下载模型文件。我们建议您在下载后仔细阅读随附的文档,以确保正确安装和使用模型。
商业案例展示
https://apps.apple.com/us/app/duix-your-ai-companion/id6451088879
常见问题解答
1. 免费的形象模型可以商用吗?支持数字人定制吗?是根据照片还是视频定制的?
回答:免费的形象模型不可以商用!如有需要,我们可以支持数字人定制。我们的数字人定制是基于视频的。您可以定制一个独特的数字人用于SDK中。但是,定制数字人服务是付费服务。您可以通过扫描微信二维码联系我们。
2. 如何定制数字头像?
回答:要定制硅基数字人,您需要拍摄一段3-5分钟的视频,其中真人直接面对摄像机说话。具体的姿势和演讲内容可以根据实际使用场景来确定。例如,如果视频是用于法律咨询目的,您可以选择穿着正式服装并谈论法律相关内容,确保与整体背景一致。
3. 数字头像定制如何收费?
回答:我们提供包括头像外观和声音在内的数字人定制,兼容我们的SDK开源接口。如有其他定制需求,您可以通过电子邮件联系我们的客户服务。
4. 数字头像如何更新?
回答:目前,开源版本主要提供公共模型。根据要求可以进行定制。
5. 是否有头像克隆的API接口
回答:目前训练服务仅支持部署在我们的内部服务器上进行调用。
6. 广播的wav文件是否支持流式数据?
回答:流式支持目前正在修改和优化中,暂时不支持。
7. 是否有广播开始和结束的回调方法?
回答:广播开始和结束的回调方法在SDK文档中有详细说明。
8. 是否有控制数字人动作的API?
回答:目前不支持控制数字人动作的API。
9. 如何替换下载的文件?
回答:下载文件的替换在代码中有详细说明。
···更多常见问题,请参阅 📑 FAQ
版本记录
- 3.0.4:修复了某些设备默认gl浮点低精度导致头像无法正常显示的问题。
- 3.0.3:优化了本地渲染
致谢
- 我们在音频特征方面借鉴了wenet的经验。
联系我们
maoliyan@guiji.ai