Files
Fay/README.md
guo zebin bb9dd4bef4 自然进化
- 重构会话管理逻辑支持以下链路基于llm输出、mcp执行、qa问答对匹配时,文字或音频输出的单向或双向打断:
	- 1、flask_server.api_send()(gui窗口文字发送) <--> flask_server.api_send_v1_chat_completions()(fay对外的openai兼容接口)
	- 2、flask_server.api_send(gui窗口文字发送) <--  flask_server.transparent_pass(消息透传接口)
	- 3、flask_server.api_send(gui窗口文字发送) <-- flask_server.to_stop_talking(打断接口)
	- 4、flask_server.api_send(gui窗口文字发送) <--> 远程音频
	- 5、flask_server.api_send(gui窗口文字发送) <-- 唤醒(普通唤醒、前置词唤醒)
	- 6、flask_server.api_send(gui窗口文字发送) <-->日程执行
	- 7、flask_server.api_send_v1_chat_completions(fay对外的openai兼容接口) <--> flask_server.transparent_pass(消息透传接口)
	- 8、flask_server.api_send_v1_chat_completions(fay对外的openai兼容接口) <-- flask_server.to_stop_talking(打断接口)
	- 9、flask_server.api_send_v1_chat_completions(fay对外的openai兼容接口) <--> 远程音频
	- 10、flask_server.api_send_v1_chat_completions(fay对外的openai兼容接口) <-- 唤醒(普通唤醒、前置词唤醒)
	- 11、flask_server.api_send_v1_chat_completions(fay对外的openai兼容接口)  <-->日程执行
	- 12、flask_server.transparent_pass(消息透传接口) <-- flask_server.to_stop_talking(打断接口)
	- 13、flask_server.transparent_pass(消息透传接口) <--> 远程音频
	- 14、flask_server.transparent_pass(消息透传接口) <-- 唤醒(普通唤醒、前置词唤醒)
	- 15、flask_server.transparent_pass(消息透传接口) <-->日程执行
	- 16、远程音频 <-- 唤醒(普通唤醒、前置词唤醒)
	- 17、远程音频 <-->日程执行
2025-09-17 15:53:54 +08:00

3.0 KiB
Raw Blame History


Fay

FAY

Fay数字人框架

重要通知我们已经把Fay的三个版本合并成1个并致力提供更稳定更全面的功能。

我们致力于思考面向终端的数字人落地应用并通过完整代码把思考结果呈现给大家。Fay数字人框架向上适配各种数字人模型技术向下接入各式大语言模型并且便于更换诸如TTS、ASR等模型为单片机、app、网站提供全面的数字人应用接口。
更新日志:https://qqk9ntwbcit.feishu.cn/wiki/UlbZwfAXgiKSquk52AkcibhHngg 文档:https://qqk9ntwbcit.feishu.cn/wiki/JzMJw7AghiO8eHktMwlcxznenIg

功能特点

  • 完全开源,商用免责
  • 支持全离线使用
  • 全时流式的支持
  • 自由匹配数字人模型、大语言模型、ASR、TTS模型
  • 支持数字人自动播报模式(虚拟教师、虚拟主播、新闻播报)
  • 支持任意终端使用单片机、app、网站、大屏、成熟系统接入等
  • 支持多用户多路并发
  • 提供文字交互接口、语音交互接口、数字人驱动接口、管理控制接口、自动播报接口、意图接口
  • 支持语音指令灵活配置执行
  • 支持自定义知识库、自定义问答对、自定义人设信息
  • 支持唤醒及打断对话
  • 支持服务器及单机模式
  • 支持机器人表情输出
  • 支持react agent自主决策执行、主动对话
  • 支持后台静默启动
  • 支持deepseek等thinking llm
  • 设计独特的认知模型
  • 支持MCP
  • 提供配置管理中心
  • 全链路交互互通

Fay数字人框架

源码启动

环境

  • Python 3.12

  • Windows、macos、ubuntu

  • ubuntu需要先安装gcc及portaudio

  • sudo apt update
    sudo apt install build-essential
    sudo apt install portaudio19-dev
    

安装依赖

pip install -r requirements.txt

配置

  • 依照说明修改 ./system.conf 文件(默认运行将自动使用公共配置)

启动

启动Fay控制器

python main.py

镜像快速启动

https://www.compshare.cn/images/compshareImage-1cft3sk9gvta?ytag=GPU_fay

高级玩法

使用数字人(非必须)

ue: https://github.com/xszyou/fay-ue5

unityhttps://qqk9ntwbcit.feishu.cn/wiki/Se9xw04hUiss00kb2Lmci1BVnM9

metahuman-stream2dhttps://qqk9ntwbcit.feishu.cn/wiki/Ik1kwO9X5iilnGkFwRhcnmtvn3e

duixandroid)https://qqk9ntwbcit.feishu.cn/wiki/Ik1kwO9X5iilnGkFwRhcnmtvn3e()

aibote(windows cpu克隆人)https://qqk9ntwbcit.feishu.cn/wiki/ULaywzVRti0HXWkhCzacoSPAnIg

集成到自家产品(非必须)

接口:https://qqk9ntwbcit.feishu.cn/wiki/Mcw3wbA3RiNZzwkexz6cnKCsnhh

联系

交流群及资料教程关注公众号 fay数字人请先star本仓库