Commit Graph

92 Commits

Author SHA1 Message Date
guo zebin
f37680a7d0 自然进化 2025-11-07 11:24:46 +08:00
guo zebin
cd7a482264 自然进化
数字人接口音频输出控制。
2025-11-03 16:02:26 +08:00
xszyou
ca63d30824 自然进化
2025年10月15日,Fay升级全新的工具调用机制,实现ai ide级的工具调用稳定性。(参考openai codex cli的实现逻辑):
1. 工具调用逻辑由ReAct替换为更稳定的workflow;
2. 为mcp服务补充一个编辑功能;
3. 提供logseq mcp服务器,并作为fay的默认配置之一;
4. 工具调用的文本支持了流式输出;
5. 非富了工具调用时的think日志;
6. 优化agent、llm、工具调用的prompt。
7. 可用的mcp工具列表单独维护,不在nlp时更新;
8. 优化日程管理工具;
9. 修复了若干已知bug。
2025-10-15 19:57:31 +08:00
guo zebin
bb9dd4bef4 自然进化
- 重构会话管理逻辑支持以下链路基于llm输出、mcp执行、qa问答对匹配时,文字或音频输出的单向或双向打断:
	- 1、flask_server.api_send()(gui窗口文字发送) <--> flask_server.api_send_v1_chat_completions()(fay对外的openai兼容接口)
	- 2、flask_server.api_send(gui窗口文字发送) <--  flask_server.transparent_pass(消息透传接口)
	- 3、flask_server.api_send(gui窗口文字发送) <-- flask_server.to_stop_talking(打断接口)
	- 4、flask_server.api_send(gui窗口文字发送) <--> 远程音频
	- 5、flask_server.api_send(gui窗口文字发送) <-- 唤醒(普通唤醒、前置词唤醒)
	- 6、flask_server.api_send(gui窗口文字发送) <-->日程执行
	- 7、flask_server.api_send_v1_chat_completions(fay对外的openai兼容接口) <--> flask_server.transparent_pass(消息透传接口)
	- 8、flask_server.api_send_v1_chat_completions(fay对外的openai兼容接口) <-- flask_server.to_stop_talking(打断接口)
	- 9、flask_server.api_send_v1_chat_completions(fay对外的openai兼容接口) <--> 远程音频
	- 10、flask_server.api_send_v1_chat_completions(fay对外的openai兼容接口) <-- 唤醒(普通唤醒、前置词唤醒)
	- 11、flask_server.api_send_v1_chat_completions(fay对外的openai兼容接口)  <-->日程执行
	- 12、flask_server.transparent_pass(消息透传接口) <-- flask_server.to_stop_talking(打断接口)
	- 13、flask_server.transparent_pass(消息透传接口) <--> 远程音频
	- 14、flask_server.transparent_pass(消息透传接口) <-- 唤醒(普通唤醒、前置词唤醒)
	- 15、flask_server.transparent_pass(消息透传接口) <-->日程执行
	- 16、远程音频 <-- 唤醒(普通唤醒、前置词唤醒)
	- 17、远程音频 <-->日程执行
2025-09-17 15:53:54 +08:00
guo zebin
754d2b51c6 自然进化
1、修复mcp流式输出及打断功能。
2025-09-17 09:36:35 +08:00
guo zebin
4f14ec4b9c 自然进化
1、修复普通唤醒的打断功能;
2、清除flask_server.py的多余代码。
2025-09-16 09:39:15 +08:00
guo zebin
a2214f0b62 自然进化
1、修复qa标签误输到类gpt接口;
2、优化打断操作介入时机。
2025-09-15 22:17:45 +08:00
guo zebin
8540fa5dac 自然进化
1、修复文字沟通接口打断功能;
2、修复qa命中采纳按钮点亮。
2025-09-14 01:08:57 +08:00
guo zebin
4d7102c8cf 自然进化
1、优化qa代码。
2025-09-13 19:54:06 +08:00
guo zebin
4e0507df78 自然进化
1、修复透传打断功能。
2、修复新消息无法采纳功能。
2025-09-12 23:39:07 +08:00
guo zebin
30d342670c 自然进化
进一步优化会话管理。
2025-09-12 15:29:35 +08:00
guo zebin
0e02e03d70 自然进化
1、使用conversation_id规划session_id。
2025-09-11 17:06:31 +08:00
guo zebin
ce19f1c3ef 自然进行
1、加入session_version管理,让会话管理更稳健。
2025-09-11 15:18:01 +08:00
guo zebin
15b940e8ad 自然进化
1、修复flask_server.api_send()(gui文字消息)打断逻辑;
2。优化流式输出manager_stream流式输出的并发处理机制。
2025-09-10 15:28:11 +08:00
guo zebin
95be7648a1 紧急修复
修复接口打断bug。
2025-09-04 21:33:18 +08:00
xszyou
af2f8d682a 紧急修复
修复透传接口bug。
2025-08-29 11:27:27 +08:00
xszyou
4889583cc1 自然进化
1.恢复文字、唤醒词、意图接口打断功能;
2、新增支持本地mcp工具调用;
3、支持mcp工具独立控制;
4、内置mcp工具箱及日程管理mcp工具;
5、结束fay时主动关闭(断开)mcp服务;
6、优化线程管理逻辑;
7、支持ctrl+c退出fay。
2025-08-28 00:24:21 +08:00
xszyou
dd96e5001d Update fay_core.py
修复不语音合成的bug。
2025-08-13 14:13:57 +08:00
xszyou
d2d4e8fdb8 fay自然进行
1.优化认知机制;
2.funasr依赖更新;
3.更换公共配置中心服务器;
4.优化mcp管理;
5.去除单独情绪计算(llm已经支持);
6.优化think的“请稍等”提醒逻辑;
7.流式推送给数字人接口的文本补充会话id及消息序号。
2025-08-05 00:40:02 +08:00
xszyou
0df7a26e8e fay进化
1. 内置RAG知识库(请把docx、pptx、txt文件存放到llm/data目录);
2. 流式回复逻辑优化;
3. 语音交互逻辑优化;
4. 线程安全增强;
5. 数字人驱动接口增加流式输出开始结束标记;
6. 修复因记忆反思而导致的记忆混乱,无法多轮对话问题;
7. 修复mcp工具获取于调用的线程同步问题;
8. 修复funasr依赖版本问题。
2025-06-27 23:33:24 +08:00
xszyou
b4ecc6996b 紧急修复
--修复因流式音频结束标记提前而导致的麦克风风不释放问题;
--使用更短的文本切割。
2025-06-10 23:15:41 +08:00
xszyou
2a204a13ed fay进化
1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式,包括token计算及流式控制等
--把认知模式作为llm对接的方式,并对认知模型进行了优化升级,可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm,可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心,便于多个fay做配置管理
--当根目录中system.conf或config.json不存在,启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理,单项目也支持多fay对接,源码地址:https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题
2025-05-17 01:25:45 +08:00
xszyou
11e115b228 fay自然进化
1. 增加清除记忆功能;
2. 增加克隆性格功能;
3. 增加认知模型(专属的记忆逻辑、反思逻辑);
4. 修复自动播报bug;
5. fay_url配置响修正;
6. 修复流式输出前置换行问题;
7. 修复没有用户聊天记录前端反复添加默认用户问题;
8. 更新dockerfile;
9. 重构util.py代码。
1. Fay ai编程指南:https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型:https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio
2025-04-02 23:31:46 +08:00
Lucky
c7c0e4605e Update fay_core.py
减小thinking数据的重复向数字人输出。
2025-03-13 15:33:53 +08:00
xszyou
10ad9d001c fay进化
1、修复面板机器人表情“思考中”不释放问题;
2、修复因声卡导致pygame出错而无法继续运行问题;
3、兼容mp3及wav音频格式的tts;
4、修复流式空字符tts出错问题;
5、修复因tts出错不解锁麦克风问题;
6、防止流式音频之间被插话;
7、修复"gpt_stream" api出错不回消息;
8、修复aliyun tts的嗒嗒声。
2025-03-12 22:41:01 +08:00
xszyou
7a512709c7 fay进化
1、stream_manager.py补充注释;
2、 gevent包版本更新;#146
3、修复booter与core双互引入问题;#148
4、fay gui支持流式显示,包括<think>标签的内容;
5、修复gpt_stream模式时qa回复不合成语音问题;
6、优化流式deepseek,fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码;
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”,消除误解。
2025-02-27 17:47:59 +08:00
xszyou
d70547d70f 年番更新
1、ui显示deepseek 思考窗口;
2、提供Fay ai编程工具二开指南:https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
3、修复使用gpt stream是声音重复合成播放的bug;
4、优化<think>标签内容处理逻辑,只在显示上和声音输出上做处理;
5、去除开启自动运行脚本功能,提高linux和mac的兼容性;
6、优化前端自动获取后端接口地址的方式;
7、agent 模式兼容deepseek。https://qqk9ntwbcit.feishu.cn/wiki/WLg5wde5di5ACqkUu6IcD4w7n0e
2025-02-20 00:22:51 +08:00
莣仔
001b249614 紧急修复
去除多余引用
2025-02-13 10:21:29 +08:00
xszyou
964bf9ca32 年番更新
1、修复录音失败时输出问题;
2、修复linux端启动时,因subprocess报错问题;
3、修复获取状态接口报错问题;
4、新增数字人定位、目标设置;
5、新增启动日志提醒;
6、新增支持流式llm及tts;
7、修正agent多个bug;
8、支持deepseek https://qqk9ntwbcit.feishu.cn/wiki/Ghh9wFpMIiiFxTk8SlQcZLIrnMf
2025-02-12 22:20:37 +08:00
xszyou
9186f91afa 年番更新
1、增加一组意图接口:唤醒、打招呼、打断;
2、增加一个自启动脚本列表;
3、修复aliyun asr错误后无法继续拾音问题;
4、优化本地拾音逻辑:麦克风启动时间减小、VAD判断时间减小、错误检查机制、拾音音量动态阈值、调整缓冲区大小;
5、补充自动播放时推送数据的检测;
6、更正qa.csv文件默认编码;
7、去掉http请求日志信息。
2025-01-09 01:36:33 +08:00
xszyou
421157c667 年番更新
1、自动播放逻辑优化:交互完停30秒才继续;
2、降低socket心跳频率,可以一定程序节省安卓远程设备的用电量;
3、增加消息透传接口:https://qqk9ntwbcit.feishu.cn/wiki/PNKFwVgUKig6fDkMH03cMPiInIb
4、修复底部用户列表样式错误;
5、提高agent日程执行成功率;
2025-01-01 00:14:19 +08:00
莣仔
7a438d82a3 年番更新
1、修复UE连接数字人接口不稳定问题;
2、修复运行途中关闭麦克风依然监听问题;
3、增加打招呼接口;
4、智普清流llm对接;
2024-12-18 17:48:57 +08:00
xszyou
ea2d67cfae 年翻更新
1、qa回复新增在范围内多条匹配随机命中;
2、gpt问答补充当前时间;
3、命中qa的回复,标示为采纳;
4、新增执行python main.py start命令可自启动;
5、优化CLI机制;
6、优化运行成功后的操作提醒;
7、删掉langchain nlp mudule,修复langchain新旧版包兼容问题。
2024-12-11 21:36:14 +08:00
莣仔
c65c2f7239 年番更新
1、qa回复新增在范围内随机命中;
2、gpt问答新增当前时间获取;
3、命中qa的回复,标示为采纳;
4,新增执行python main.py start命令可自启动。
2024-12-11 19:08:04 +08:00
xszyou
0ade2eb074 fay年翻更新
- 消灭langchain警告信息;
- 修复与funasr对接的包兼容性;
- 推送给数字人的消息区分交互和自动播放;
- 上传ReWoo agent测试代码。
2024-12-04 22:20:51 +08:00
xszyou
87ed1c4425 Fay年翻更新
- 升级Agent(chat_module=agent切换):升级到langgraph react agent逻辑、集成到主分支fay中、基于自动决策工具调用机制、基于日程跟踪的主动沟通、支持外部观测数据传入;
- 修复因线程同步问题导致的配置文件读写不稳定
- 聊天采纳功能的bug修复
2024-11-20 23:44:47 +08:00
xszyou
f871b6a532 Merge branch 'main' of https://github.com/xszyou/Fay 2024-11-19 00:26:55 +08:00
莣仔
fa92b8e124 年翻更新
1、接口新增错误处理机制;
2、nlp_gpt代码重构;
3、首页新增服务器麦克风控制;
4、首页新增服务器扬声器控制;
5、优化socket10001映射到websocket连接;
6、新增未启动时也可以在控制台输入exit进行关闭;
7、新增10002数字人接口传入Output参数可设定不合成音频;
8、处理音色接口格式报错问题;
9、取消edge_tts版本限定;
10、优化手动采纳错误处理。
2024-11-13 18:01:03 +08:00
xszyou
4bcb28e182 紧急修复
修复麦克风热启动的bug.
2024-11-07 11:30:21 +08:00
莣仔
19e5273fb0 年翻更新
1、qa自动缓存改为手动采纳;
2、socket10001映射到websocket 9001;
3、修复声音沟通接口无法收音问题;
4、修复阿里云不稳定问题;
2024-11-06 18:42:52 +08:00
莣仔
8efec0355d 年翻更新
1、qa自动缓存改为手动采纳;
2、socket10001映射到websocket 9001;
3、修复声音沟通接口无法收音问题;
4、修复阿里云不稳定问题;
2024-11-06 18:34:56 +08:00
guo zebin
10d419e1e6 紧急更新
1、删除意外出的语音合成开关;
2、唤醒、麦克风、扬声器可以启动后开启和关闭。
2024-11-01 09:18:19 +08:00
莣仔
059b6cee6d 年翻更新
1、修复服务器ip配置,配置页没替换问题;
2、修复开启状态偶尔没对齐问题;
3、修复关闭时关闭按钮停留在关闭中问题;
4、修复星座读取错误问题;
5、修复刷新重复提醒开启问题;
6、新增是否进行语音合成的选择;
7、文字沟通接口加入“观察描述”;
8、聊天记录时间改为毫秒级;
9、补充数字人和远程音频的连接状态显示;
10、修复备注填写无法保存问题。
2024-10-30 19:11:15 +08:00
xszyou
28c7097af4 紧急修复
更新依赖
2024-10-28 19:27:44 +08:00
guo zebin
4cfad5ae0f 年翻更新
- 全新ui
- 全面优化websocket逻辑,提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑,提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量,支持多声道麦克风拾音
- 优化自动播放服务器的对接机制,提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情,以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式,可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项,以方便服务器部署
2024-10-26 11:34:55 +08:00
莣仔
64e4213cae 恢复 2024-02-21 16:12:00 +08:00
莣仔
b39a2e0eb2 首次上传 2024-02-21 15:44:42 +08:00
xszyou
16f8d599d7 工作愉快
删库跑路了?
2024-01-08 18:32:23 +08:00
xszyou
22d1e4ce10 元旦快乐
2024.01.01:
openai token计算✓
优化ReAct Agent 与 LLM Chain自动切换逻辑✓
*添加双记忆机制:长时记忆流及短时聊天记忆✓
修复record.py asr bug✓
提高远程音频(android 连接器)的稳定性✓
修复执行时间计算bug✓
优化语音输出逻辑✓
2024-01-01 22:53:06 +08:00
xszyou
01c19c13e8 工作愉快
*实现agent ReAct与LLM chain自动切换逻辑✓

聊天窗区分任务消息✓

修复删除日程bug✓

优化远程音频逻辑✓

等待处理引入加载中效果✓

优化prompt以解决日程任务递归调用问题✓

修复一次性日程清除的bug✓
2023-12-25 22:13:09 +08:00