44 Commits

Author SHA1 Message Date
guo zebin
eecbb931a9 交互模块
1. [增加]embedding维度检查自动修正逻辑。
2026-01-29 15:09:37 +08:00
guo zebin
27e31431a0 fay支持mcp客户端连接,对外暴广播工具 2026-01-06 20:01:08 +08:00
guo zebin
a24b8c9a42 自然进化
1、去掉原知识库逻辑;
2、上传知识库mcp服务器;
3、上传window 窗口截图mcp服务器;
4、聊天窗口支持markdown排版;
5、聊天窗口支持缩略图展示。
2025-12-10 21:21:43 +08:00
guo zebin
da05cd73e6 自然进化
1.加入仿生记忆功能。
2025-11-11 14:45:49 +08:00
xszyou
4889583cc1 自然进化
1.恢复文字、唤醒词、意图接口打断功能;
2、新增支持本地mcp工具调用;
3、支持mcp工具独立控制;
4、内置mcp工具箱及日程管理mcp工具;
5、结束fay时主动关闭(断开)mcp服务;
6、优化线程管理逻辑;
7、支持ctrl+c退出fay。
2025-08-28 00:24:21 +08:00
xszyou
0df7a26e8e fay进化
1. 内置RAG知识库(请把docx、pptx、txt文件存放到llm/data目录);
2. 流式回复逻辑优化;
3. 语音交互逻辑优化;
4. 线程安全增强;
5. 数字人驱动接口增加流式输出开始结束标记;
6. 修复因记忆反思而导致的记忆混乱,无法多轮对话问题;
7. 修复mcp工具获取于调用的线程同步问题;
8. 修复funasr依赖版本问题。
2025-06-27 23:33:24 +08:00
xszyou
2a204a13ed fay进化
1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式,包括token计算及流式控制等
--把认知模式作为llm对接的方式,并对认知模型进行了优化升级,可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm,可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心,便于多个fay做配置管理
--当根目录中system.conf或config.json不存在,启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理,单项目也支持多fay对接,源码地址:https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题
2025-05-17 01:25:45 +08:00
xszyou
11e115b228 fay自然进化
1. 增加清除记忆功能;
2. 增加克隆性格功能;
3. 增加认知模型(专属的记忆逻辑、反思逻辑);
4. 修复自动播报bug;
5. fay_url配置响修正;
6. 修复流式输出前置换行问题;
7. 修复没有用户聊天记录前端反复添加默认用户问题;
8. 更新dockerfile;
9. 重构util.py代码。
1. Fay ai编程指南:https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型:https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio
2025-04-02 23:31:46 +08:00
xszyou
10ad9d001c fay进化
1、修复面板机器人表情“思考中”不释放问题;
2、修复因声卡导致pygame出错而无法继续运行问题;
3、兼容mp3及wav音频格式的tts;
4、修复流式空字符tts出错问题;
5、修复因tts出错不解锁麦克风问题;
6、防止流式音频之间被插话;
7、修复"gpt_stream" api出错不回消息;
8、修复aliyun tts的嗒嗒声。
2025-03-12 22:41:01 +08:00
xszyou
7a512709c7 fay进化
1、stream_manager.py补充注释;
2、 gevent包版本更新;#146
3、修复booter与core双互引入问题;#148
4、fay gui支持流式显示,包括<think>标签的内容;
5、修复gpt_stream模式时qa回复不合成语音问题;
6、优化流式deepseek,fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码;
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”,消除误解。
2025-02-27 17:47:59 +08:00
xszyou
d70547d70f 年番更新
1、ui显示deepseek 思考窗口;
2、提供Fay ai编程工具二开指南:https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
3、修复使用gpt stream是声音重复合成播放的bug;
4、优化<think>标签内容处理逻辑,只在显示上和声音输出上做处理;
5、去除开启自动运行脚本功能,提高linux和mac的兼容性;
6、优化前端自动获取后端接口地址的方式;
7、agent 模式兼容deepseek。https://qqk9ntwbcit.feishu.cn/wiki/WLg5wde5di5ACqkUu6IcD4w7n0e
2025-02-20 00:22:51 +08:00
xszyou
964bf9ca32 年番更新
1、修复录音失败时输出问题;
2、修复linux端启动时,因subprocess报错问题;
3、修复获取状态接口报错问题;
4、新增数字人定位、目标设置;
5、新增启动日志提醒;
6、新增支持流式llm及tts;
7、修正agent多个bug;
8、支持deepseek https://qqk9ntwbcit.feishu.cn/wiki/Ghh9wFpMIiiFxTk8SlQcZLIrnMf
2025-02-12 22:20:37 +08:00
xszyou
9186f91afa 年番更新
1、增加一组意图接口:唤醒、打招呼、打断;
2、增加一个自启动脚本列表;
3、修复aliyun asr错误后无法继续拾音问题;
4、优化本地拾音逻辑:麦克风启动时间减小、VAD判断时间减小、错误检查机制、拾音音量动态阈值、调整缓冲区大小;
5、补充自动播放时推送数据的检测;
6、更正qa.csv文件默认编码;
7、去掉http请求日志信息。
2025-01-09 01:36:33 +08:00
xszyou
421157c667 年番更新
1、自动播放逻辑优化:交互完停30秒才继续;
2、降低socket心跳频率,可以一定程序节省安卓远程设备的用电量;
3、增加消息透传接口:https://qqk9ntwbcit.feishu.cn/wiki/PNKFwVgUKig6fDkMH03cMPiInIb
4、修复底部用户列表样式错误;
5、提高agent日程执行成功率;
2025-01-01 00:14:19 +08:00
xszyou
ea2d67cfae 年翻更新
1、qa回复新增在范围内多条匹配随机命中;
2、gpt问答补充当前时间;
3、命中qa的回复,标示为采纳;
4、新增执行python main.py start命令可自启动;
5、优化CLI机制;
6、优化运行成功后的操作提醒;
7、删掉langchain nlp mudule,修复langchain新旧版包兼容问题。
2024-12-11 21:36:14 +08:00
xszyou
87ed1c4425 Fay年翻更新
- 升级Agent(chat_module=agent切换):升级到langgraph react agent逻辑、集成到主分支fay中、基于自动决策工具调用机制、基于日程跟踪的主动沟通、支持外部观测数据传入;
- 修复因线程同步问题导致的配置文件读写不稳定
- 聊天采纳功能的bug修复
2024-11-20 23:44:47 +08:00
莣仔
fa92b8e124 年翻更新
1、接口新增错误处理机制;
2、nlp_gpt代码重构;
3、首页新增服务器麦克风控制;
4、首页新增服务器扬声器控制;
5、优化socket10001映射到websocket连接;
6、新增未启动时也可以在控制台输入exit进行关闭;
7、新增10002数字人接口传入Output参数可设定不合成音频;
8、处理音色接口格式报错问题;
9、取消edge_tts版本限定;
10、优化手动采纳错误处理。
2024-11-13 18:01:03 +08:00
莣仔
19e5273fb0 年翻更新
1、qa自动缓存改为手动采纳;
2、socket10001映射到websocket 9001;
3、修复声音沟通接口无法收音问题;
4、修复阿里云不稳定问题;
2024-11-06 18:42:52 +08:00
莣仔
8efec0355d 年翻更新
1、qa自动缓存改为手动采纳;
2、socket10001映射到websocket 9001;
3、修复声音沟通接口无法收音问题;
4、修复阿里云不稳定问题;
2024-11-06 18:34:56 +08:00
guo zebin
10d419e1e6 紧急更新
1、删除意外出的语音合成开关;
2、唤醒、麦克风、扬声器可以启动后开启和关闭。
2024-11-01 09:18:19 +08:00
guo zebin
341d045375 Update fay_booter.py
去掉调试信息
2024-10-30 18:44:28 +08:00
guo zebin
4cfad5ae0f 年翻更新
- 全新ui
- 全面优化websocket逻辑,提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑,提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量,支持多声道麦克风拾音
- 优化自动播放服务器的对接机制,提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情,以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式,可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项,以方便服务器部署
2024-10-26 11:34:55 +08:00
莣仔
64e4213cae 恢复 2024-02-21 16:12:00 +08:00
莣仔
b39a2e0eb2 首次上传 2024-02-21 15:44:42 +08:00
xszyou
16f8d599d7 工作愉快
删库跑路了?
2024-01-08 18:32:23 +08:00
xszyou
01c19c13e8 工作愉快
*实现agent ReAct与LLM chain自动切换逻辑✓

聊天窗区分任务消息✓

修复删除日程bug✓

优化远程音频逻辑✓

等待处理引入加载中效果✓

优化prompt以解决日程任务递归调用问题✓

修复一次性日程清除的bug✓
2023-12-25 22:13:09 +08:00
xszyou
a27ab9dfba 第3次更新
更换ReAct agent✓
修复Thread.timer管理逻辑✓
优化提示词减小返回格式出错概率(格式出错会导致重复执行)✓
消息窗里加上执行任务标记✓
更换gpt 3.5模型测试✓
2023-12-14 10:38:08 +08:00
xszyou
d68e759873 紧急修复
1、修复agent run的结果文字显示、保存DB✓
2、区分文字输入和语音输入✓
3、修复Speech.close bug✓
4、增加个人信息存入向量库✓
5、修复处理时间计算不准确✓
6、修复gpt key出错✓
2023-12-12 18:23:43 +08:00
xszyou
875ed28b58 初始上传
初始上传
2023-12-12 00:03:36 +08:00
xszyou
894a9b6ea4 提交Fay AI Agent版计划
提交Fay AI Agent版计划
2023-09-18 10:17:31 +08:00
xszyou
ba6972a647 周末愉快
1、唇型计算的视音素更换成33毫秒;
2、内置rwkv_api nlp可以直接使用;
3、降低情绪性向数字人端推送的频度;
4、非数字人连接状态不产生接口消息;
5、修复因mp3格式错误而导致一定概率不推送播放信息给数字人端的问题;
6、修复静音等指令执行时提前结束nlp逻辑,而导致用户提问消息不推送数字人端问题;
7、补充wav文件启动清理;
8、websocket工具类升级完善。
2023-08-04 19:13:28 +08:00
xszyou
fb8caf7645 20230719
1、修复远程语音不识别问题;
2、修复asr时有不灵问题;
3、去除唱歌指令;
2023-07-19 22:45:03 +08:00
xszyou
b53bc6e124 修复麦克风&文字回复问题
1、修复助理版文字输入不读取人设回复问题;
2、修复助理版文字输入不读取qa回复问题;
3、增强麦克风接入稳定性。
2023-07-12 18:56:17 +08:00
xszyou
5c5e9d08bd 修复声音播放问题
1、修复唇形算法运行出错而导致的声音不播放问题。
2023-07-05 22:21:20 +08:00
xszyou
7c67bb5858 助理版多处优化
1、解决多声道麦克风兼容问题;
2、重构fay_core.py及fay_booter.py代码;
3、ui适应布局调整;
4、恢复男女声音选择;
5、”思考中...“显示逻辑修复。
2023-06-14 20:34:36 +08:00
xszyou
ae1d2ae292 多模态的支持
+ 修复多个bug:消息框换行及空格问题、语音识别优化;
+ 彩蛋转正,Fay沟通与ChatGPT并行;
+ 加入yolov8姿态识别;
+ 加入VisualGLM-6B多模态单机离线大语言模型。
2023-05-27 17:03:43 +08:00
xszyou
604cab787b 20230427
1、 更新gpt接口:局部接入代理、prompt上补充角色模拟及简化回复内容(感谢 江湖墨明);
2、修复控制台输入测试消息的bug;
3、 补充推荐两个优秀仓库:chatglm、全平台的抖音抓包。
2023-04-27 22:52:00 +08:00
xszyou
57b362fa6b 提高抖音字幕监听的稳定性及包兼容性
1、清除旧逻辑代码;
2、优化监听逻辑;
3、调整包版本的兼容性python3.8、3.9、3.10。
2023-04-24 12:46:17 +08:00
xszyou
cfd4a3fbbd 2023.02.09
1、降低音量识别阈值;
2、修改ngrok是否开启判断逻辑;
3、修改js uuid 生成方式;
4、优化android demo:破音问题、服务运行状态判断问题。
2023-02-09 12:55:16 +08:00
xszyou
88ed6984f0 2022.02
1、集成live2d看板娘;
2、更新ngrok是否开启判断;
2023-02-03 19:27:55 +08:00
xszyou
732e7e3b61 2023.02
1、集成live2d看板娘;
2、修改ngrok穿透是否开启的判断逻辑;
2023-02-03 18:46:12 +08:00
xszyou
55fb0896b8 2023.01
Fay2.0:
1、控制器pc内网穿透,音频输入输出设备远程直连;
2、提供android 音频输入输出工程示例代码;
3、提供python音频输入输出工程示例代码(远程PC、树莓派等可用);
4、补传1.0语音指令音乐播放模块(暂不支持远程播放);
5、重构及补充若干工具模块:websocket、多线程、缓冲器、音频流录制器等;
6、修复1.x版本的多个bug。
2023-01-31 12:40:36 +08:00
xszyou
7f535686ef 2022.10.27
1、更新mac上的麦克风参数;
2、解决mac上无法重启问题;
3、上传brew安装脚本。
2022-10-27 14:58:48 +08:00
Ram
338917fdf7 Update 2022-06-20 11:05:10 +08:00