13 KiB
Duix - 硅基数字人实时交互SDK 🌐🤖 [English]
在线体验:
😄 DUIX数字人实时交互平台:https://duix.com
📖 文档 Documentation
😄 实时交互SDK:[Android]
😄 实时交互SDK:[iOS]
😄 常见问题:[FQA]
😄 数字人快速克隆及视频合成开源项目(非实时交互):[HeyGem.ai]
支持 Support
加入我们的微信或 Discord 社区以获得支持和讨论。关注Twitter,观看基于DUIX开源能力制作的最新数字人视频。
💬 联系邮箱 (James@toolwiz.com)
💬 加入 WeChat (微信)
😄 加入 Discord
✨ 关注 Twitter
简介 Introduction
DUIX(Dialogue User Interface System)是硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字人实时交互,并在Android和iOS多终端一键部署,让每个开发者可轻松创建智能化、个性化的数字人Agent,并应用到各行各业。
我们也为您提供了一站式全套数字人多模态实时交互SDK集成方案——DUIX交互数字人SDK。该SDK产品基于语音识别(ASR)、语音合成(TTS)、自然语言理解(NLP),AIGC,大模型等技术,实现“能听、能看、会说、懂你”式的智能人机交互体验,适用于智能客服、智慧大屏等多个企业应用场景。
查看详情:
😄 快速搭建DUIX数字人会话
😄 DUIX SDK版本及价格
😄 DUIX SDK开放文档
项目特点 Project features
- 部署成本低: 无需客户提供技术团队进行配合,支持低成本快速部署在多种终端及大屏。
- 网络依赖小: 适合地铁、银行、政务等多种场景的虚拟助理自助服务。
- 功能多样化: 可根据客户需求满足视频、媒体、客服、金融、广电等多个行业的多样化需求。
源码目录说明 Directory Structure
duix-android: android demo
duix-ios: ios demo
开放文档入口 Open Documentation Portal
如何部署 How to deploy
本文档详尽阐述了针对本项目的开发者对接流程。需要注意的是,每位开发者在进行对接时可能会遇到不同的流程环节。此文档仅供开发者作为参考使用。
Interface Reference Handbook_ZH
Interface Reference Handbook_EN
数字人本地模型下载 Download Digital Human Local Model
我们提供了一些数字人模型,可供下载和使用。我们将不定期更新本地模型包,以便您可以下载和使用最新的模型。以下是当前可用的本地模型包列表:
男性
![]() |
![]() |
![]() |
![]() |
![]() |
|---|---|---|---|---|
| 安德鲁 下载 | 财神 下载 | 苏轼 下载 | 艾瑞克 下载 | 子轩 下载 |
![]() |
|---|
| 明轩 下载 |
女性
![]() |
![]() |
![]() |
![]() |
![]() |
|---|---|---|---|---|
| 张颖 下载 | 雪梨 下载 | 观音 下载 | 苏菲 下载 | 慕容晓 下载 |
![]() |
![]() |
![]() |
![]() |
![]() |
|---|---|---|---|---|
| 冷焱 下载 | 艾米丽 下载 | 赵雅 下载 | 忆瑶 下载 | 心妍 下载 |
![]() |
![]() |
![]() |
![]() |
|---|---|---|---|
| 晓萱 下载 | 思瑶 下载 | 诗雅 下载 | 知心姐姐 下载 |
请根据您的需求下载相应的模型文件。我们建议您在下载后仔细阅读随附的文档,以确保正确安装和使用模型。
商业案例展示
手机及普通终端屏案例
![]() |
![]() |
![]() |
![]() |
|---|---|---|---|
| 数字律师 下载视频 | 数字医生 下载视频 | 虚拟陪伴 下载视频 | 口语老师 下载视频 |
低配终端屏案例
![]() |
![]() |
![]() |
![]() |
|---|---|---|---|
| 财神爷 下载视频 | 观音菩萨 下载视频 | 苏轼 下载视频 | 虚拟女友 下载视频 |
常见问题解答
1.免费形象模型是否可以商用?可以支持数字人定制吗?是基于照片还是视频?
答:免费提供的形象模型支持全球免费商用(用户量超过10万或年营收达1000万美元以上的企业需签署商业许可协议)。如有需要可以支持数字人定制,我们是基于视频进行数字人定制。您可以定制专属的数字人用于SDK中。但定制的数字人属于付费服务,您可以通过微信扫码与我们联系。

2.如何定制形象?
答:定制硅基数字人需要拍摄一段 3-5 分钟的真人出镜口播视频,具体出镜姿势、口播内容,可以根据最终的真实使用场景来确定。比如用来制作法律咨询相关视频,即可选择正装出镜,口播法律相关内容,这样整体情景比较一致。
3.定制形象如何收费?
答:我们提供与SDK开源接口配套的数字人定制,包括形象+声音,若有更多定制需求,可以联系客服邮箱。
4.数字人形象怎么更新?
答:目前开源的主要提供公共模特,有需求可以定制
5.形象克隆有API接口么?
答:训练服务目前只支持部署在我们的内部服务器进行调用
6.播报的wav文件,支持流式数据吗?
答:流式驱动正在做改造优化,暂时还不支持;
7.播报开始结束有没有相关回调方法?
答:播报开始结束的回调方法详见sdk文档
8.数字人动作有没有相关api控制?
答:数字人动作API,暂时还不支持
9.下载的文件如何替换?
答:下载文件的替换详见代码
10、想要了解一体化方案或者更多高级版本?
答:请访问 https://guiji.cn/duix-light-document/introduce/ 体验更多功能
更多FAQ,请参阅📑 FAQ
版本记录 Changelog
- 3.0.4: 修复部分设备gl默认float低精度导致无法正常显示形象问题。
- 3.0.3: 优化本地渲染
致谢 Acknowledgments
-音频特征我们借鉴了 wenet
联系我们 contact us
James@toolwiz.com




























