gavin/duix.ai

Fork 0

mirror of https://github.com/GuijiAI/duix.ai.git synced 2026-03-12 17:51:43 +08:00

Files

songwei 3e28a95b0f by songwei

2025-04-23 16:03:57 +08:00

13 KiB

Raw Blame History

Duix - 硅基数字人实时交互SDK 🌐🤖 [English]

在线体验：

😄 DUIX数字人实时交互平台：https://duix.com

📖 文档 Documentation

😄 实时交互SDK：[Android]
😄 实时交互SDK：[iOS]
😄 常见问题：[FQA]
😄 数字人快速克隆及视频合成开源项目（非实时交互）：[HeyGem.ai]

支持 Support

加入我们的微信或 Discord 社区以获得支持和讨论。关注Twitter，观看基于DUIX开源能力制作的最新数字人视频。
💬 联系邮箱 (James@toolwiz.com)
💬 加入 WeChat (微信)
😄 加入 Discord
✨ 关注 Twitter

简介 Introduction

DUIX（Dialogue User Interface System）是硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源，开发者可自行接入多方大模型、语音识别（ASR）、语音合成（TTS）能力，实现数字人实时交互，并在Android和iOS多终端一键部署，让每个开发者可轻松创建智能化、个性化的数字人Agent，并应用到各行各业。

我们也为您提供了一站式全套数字人多模态实时交互SDK集成方案——DUIX交互数字人SDK。该SDK产品基于语音识别（ASR）、语音合成（TTS）、自然语言理解（NLP），AIGC，大模型等技术，实现“能听、能看、会说、懂你”式的智能人机交互体验，适用于智能客服、智慧大屏等多个企业应用场景。查看详情：

😄 快速搭建DUIX数字人会话
😄 DUIX SDK版本及价格
😄 DUIX SDK开放文档

项目特点 Project features

部署成本低: 无需客户提供技术团队进行配合，支持低成本快速部署在多种终端及大屏。
网络依赖小: 适合地铁、银行、政务等多种场景的虚拟助理自助服务。
功能多样化: 可根据客户需求满足视频、媒体、客服、金融、广电等多个行业的多样化需求。

源码目录说明 Directory Structure

duix-android: android demo       
duix-ios: ios demo

开放文档入口 Open Documentation Portal

android参考简体中文
ios参考简体中文

如何部署 How to deploy

本文档详尽阐述了针对本项目的开发者对接流程。需要注意的是，每位开发者在进行对接时可能会遇到不同的流程环节。此文档仅供开发者作为参考使用。
Interface Reference Handbook_ZH
Interface Reference Handbook_EN

数字人本地模型下载 Download Digital Human Local Model

我们提供了一些数字人模型，可供下载和使用。我们将不定期更新本地模型包，以便您可以下载和使用最新的模型。以下是当前可用的本地模型包列表：

男性


安德鲁下载	财神下载	苏轼下载	艾瑞克下载	子轩下载


明轩下载

女性


张颖下载	雪梨下载	观音下载	苏菲下载	慕容晓下载


冷焱下载	艾米丽下载	赵雅下载	忆瑶下载	心妍下载


晓萱下载	思瑶下载	诗雅下载	知心姐姐下载

请根据您的需求下载相应的模型文件。我们建议您在下载后仔细阅读随附的文档，以确保正确安装和使用模型。

商业案例展示

手机及普通终端屏案例


数字律师下载视频	数字医生下载视频	虚拟陪伴下载视频	口语老师下载视频

低配终端屏案例


财神爷下载视频	观音菩萨下载视频	苏轼下载视频	虚拟女友下载视频

常见问题解答

1.免费形象模型是否可以商用？可以支持数字人定制吗？是基于照片还是视频？

答：免费提供的形象模型支持全球免费商用（用户量超过10万或年营收达1000万美元以上的企业需签署商业许可协议）。如有需要可以支持数字人定制，我们是基于视频进行数字人定制。您可以定制专属的数字人用于SDK中。但定制的数字人属于付费服务，您可以通过微信扫码与我们联系。

2.如何定制形象？

答：定制硅基数字人需要拍摄一段 3-5 分钟的真人出镜口播视频，具体出镜姿势、口播内容，可以根据最终的真实使用场景来确定。比如用来制作法律咨询相关视频，即可选择正装出镜，口播法律相关内容，这样整体情景比较一致。

3.定制形象如何收费？

答：我们提供与SDK开源接口配套的数字人定制，包括形象+声音，若有更多定制需求，可以联系客服邮箱。

4.数字人形象怎么更新？

答：目前开源的主要提供公共模特，有需求可以定制

5.形象克隆有API接口么？

答：训练服务目前只支持部署在我们的内部服务器进行调用

6.播报的wav文件，支持流式数据吗？

答：流式驱动正在做改造优化，暂时还不支持；

7.播报开始结束有没有相关回调方法？

答：播报开始结束的回调方法详见sdk文档

8.数字人动作有没有相关api控制？

答：数字人动作API，暂时还不支持

9.下载的文件如何替换？

答：下载文件的替换详见代码

10、想要了解一体化方案或者更多高级版本？

答：请访问 https://guiji.cn/duix-light-document/introduce/ 体验更多功能

更多FAQ，请参阅📑 FAQ

版本记录 Changelog

3.0.4: 修复部分设备gl默认float低精度导致无法正常显示形象问题。
3.0.3: 优化本地渲染

致谢 Acknowledgments

-音频特征我们借鉴了 wenet

联系我们 contact us

James@toolwiz.com

13 KiB Raw Blame History Unescape Escape