core/fay_core.py

#作用是处理交互逻辑，文字输入，语音、文字及情绪的发送、播放及展示输出
import math
from operator import index
import os
import time
import socket
import requests
from pydub import AudioSegment
from queue import Queue
import re  # 添加正则表达式模块用于过滤表情符号
import uuid

# 适应模型使用
import numpy as np
from ai_module import baidu_emotion
from core import wsa_server
from core.interact import Interact
from tts.tts_voice import EnumVoice
from scheduler.thread_manager import MyThread
from tts import tts_voice
from utils import util, config_util
from core import qa_service
from utils import config_util as cfg
from core import content_db
from ai_module import nlp_cemotion
from llm import nlp_cognitive_stream
from core import stream_manager

from core import member_db
import threading

#加载配置
cfg.load_config()
if cfg.tts_module =='ali':
    from tts.ali_tss import Speech
elif cfg.tts_module == 'gptsovits':
    from tts.gptsovits import Speech
elif cfg.tts_module == 'gptsovits_v3':
    from tts.gptsovits_v3 import Speech    
elif cfg.tts_module == 'volcano':
    from tts.volcano_tts import Speech
else:
    from tts.ms_tts_sdk import Speech

#windows运行推送唇形数据
import platform
if platform.system() == "Windows":
    import sys
    sys.path.append("test/ovr_lipsync")
    from test_olipsync import LipSyncGenerator
    

#可以使用自动播报的标记    
can_auto_play = True
auto_play_lock = threading.RLock()

class FeiFei:
    def __init__(self):
        self.lock = threading.Lock()
        self.nlp_streams = {} # 存储用户ID到句子缓存的映射
        self.nlp_stream_lock = threading.Lock() # 保护nlp_streams字典的锁
        self.mood = 0.0  # 情绪值
        self.old_mood = 0.0
        self.item_index = 0
        self.X = np.array([1, 0, 0, 0, 0, 0, 0, 0]).reshape(1, -1)  # 适应模型变量矩阵
        # self.W = np.array([0.01577594,1.16119452,0.75828,0.207746,1.25017864,0.1044121,0.4294899,0.2770932]).reshape(-1,1) #适应模型变量矩阵
        self.W = np.array([0.0, 0.6, 0.1, 0.7, 0.3, 0.0, 0.0, 0.0]).reshape(-1, 1)  # 适应模型变量矩阵

        self.wsParam = None
        self.wss = None
        self.sp = Speech()
        self.speaking = False #声音是否在播放
        self.__running = True
        self.sp.connect()  #TODO 预连接
        self.cemotion = None
        self.timer = None
        self.sound_query = Queue()
        self.think_mode_users = {}  # 使用字典存储每个用户的think模式状态
        self.think_time_users = {} #使用字典存储每个用户的think开始时间
        self.user_conv_map = {} #存储用户对话id及句子流序号
    
    def __remove_emojis(self, text):
        """
        改进的表情包过滤，避免误删除正常Unicode字符
        """
        # 更精确的emoji范围，避免误删除正常字符
        emoji_pattern = re.compile(
            "["
            "\U0001F600-\U0001F64F"  # 表情符号 (Emoticons)
            "\U0001F300-\U0001F5FF"  # 杂项符号和象形文字 (Miscellaneous Symbols and Pictographs)
            "\U0001F680-\U0001F6FF"  # 交通和地图符号 (Transport and Map Symbols)
            "\U0001F1E0-\U0001F1FF"  # 区域指示符号 (Regional Indicator Symbols)
            "\U0001F900-\U0001F9FF"  # 补充符号和象形文字 (Supplemental Symbols and Pictographs)
            "\U0001FA70-\U0001FAFF"  # 扩展A符号和象形文字 (Symbols and Pictographs Extended-A)
            "\U00002600-\U000026FF"  # 杂项符号 (Miscellaneous Symbols)
            "\U00002700-\U000027BF"  # 装饰符号 (Dingbats)
            "\U0000FE00-\U0000FE0F"  # 变体选择器 (Variation Selectors)
            "\U0001F000-\U0001F02F"  # 麻将牌 (Mahjong Tiles)
            "\U0001F0A0-\U0001F0FF"  # 扑克牌 (Playing Cards)
            "]+",
            flags=re.UNICODE,
        )

        # 保护常用的中文标点符号和特殊字符
        protected_chars = ["。", "，", "！", "？", "：", "；", "、", """, """, "'", "'", "（", "）", "【", "】", "《", "》"]

        # 先保存保护字符的位置
        protected_positions = {}
        for i, char in enumerate(text):
            if char in protected_chars:
                protected_positions[i] = char

        # 执行emoji过滤
        filtered_text = emoji_pattern.sub('', text)

        # 如果过滤后文本长度变化太大，可能误删了正常字符，返回原文本
        if len(filtered_text) < len(text) * 0.5:  # 如果删除了超过50%的内容
            return text

        return filtered_text

    def __process_qa_stream(self, text, username):
        """
        按流式方式分割和发送Q&A答案
        使用安全的流式文本处理器和状态管理器
        """
        if not text or text.strip() == "":
            return

        # 使用安全的流式文本处理器
        from utils.stream_text_processor import get_processor
        from utils.stream_state_manager import get_state_manager

        processor = get_processor()
        state_manager = get_state_manager()

        # 处理Q&A流式文本，is_qa=True表示Q&A模式
        success = processor.process_stream_text(text, username, is_qa=True, session_type="qa")

        if success:
            # Q&A模式结束会话（不再需要发送额外的结束标记）
            state_manager.end_session(username)
        else:
            util.log(1, f"Q&A流式处理失败，文本长度: {len(text)}")
            # 失败时也要确保结束会话
            state_manager.force_reset_user_state(username)

    #语音消息处理检查是否命中q&a
    def __get_answer(self, interleaver, text):
        answer = None
        # 全局问答
        answer, type = qa_service.QAService().question('qa',text)
        if answer is not None:
            return answer, type
        else:
            return None, None
        
       
    #语音消息处理
    def __process_interact(self, interact: Interact):
        if self.__running:
            try:
                index = interact.interact_type
                username = interact.data.get("user", "User")
                uid = member_db.new_instance().find_user(username)
                if index == 1: #语音文字交互
                    #记录用户问题,方便obs等调用
                    self.write_to_file("./logs", "asr_result.txt",  interact.data["msg"])

                    #同步用户问题到数字人
                    if wsa_server.get_instance().is_connected(username): 
                        content = {'Topic': 'human', 'Data': {'Key': 'question', 'Value': interact.data["msg"]}, 'Username' : interact.data.get("user")}
                        wsa_server.get_instance().add_cmd(content)

                    #记录用户问题
                    content_id = content_db.new_instance().add_content('member','speak',interact.data["msg"], username, uid)
                    if wsa_server.get_web_instance().is_connected(username):
                        wsa_server.get_web_instance().add_cmd({"panelReply": {"type":"member","content":interact.data["msg"], "username":username, "uid":uid, "id":content_id}, "Username" : username})
                    
                    #确定是否命中q&a
                    answer, type = self.__get_answer(interact.interleaver, interact.data["msg"])
                    
                    #大语言模型回复    
                    text = ''
                    if answer is None or type != "qa":
                        if wsa_server.get_web_instance().is_connected(username):
                            wsa_server.get_web_instance().add_cmd({"panelMsg": "思考中...", "Username" : username, 'robot': f'{cfg.fay_url}/robot/Thinking.jpg'})
                        if wsa_server.get_instance().is_connected(username):
                            content = {'Topic': 'human', 'Data': {'Key': 'log', 'Value': "思考中..."}, 'Username' : username, 'robot': f'{cfg.fay_url}/robot/Thinking.jpg'}
                            wsa_server.get_instance().add_cmd(content)
                        text = nlp_cognitive_stream.question(interact.data["msg"], username, interact.data.get("observation", None))

                    else: 
                        text = answer
                        # 使用流式分割处理Q&A答案
                        self.__process_qa_stream(text, username)
                           
                    #完整文本记录回复并输出到各个终端
                    self.__process_text_output(text, username, uid  )

                    return text      
                
                elif (index == 2):#透传模式，用于适配自动播报控制及agent的通知工具

                    if interact.data.get("text"):
                        text = interact.data.get("text")
                        # 使用统一的文本处理方法，空列表表示没有额外回复
                        self.__process_text_output(text, username, uid)
                        MyThread(target=self.say, args=[interact, text]).start()  
                    return 'success'
   
            except BaseException as e:
                print(e)
                return e
        else:
            return "还没有开始运行"

    #记录问答到log
    def write_to_file(self, path, filename, content):
        if not os.path.exists(path):
            os.makedirs(path)
        full_path = os.path.join(path, filename)
        with open(full_path, 'w', encoding='utf-8') as file:
            file.write(content)
            file.flush()  
            os.fsync(file.fileno()) 

    #触发语音交互
    def on_interact(self, interact: Interact):
        #创建用户
        username = interact.data.get("user", "User")
        if member_db.new_instance().is_username_exist(username)  == "notexists":
            member_db.new_instance().add_user(username)
        MyThread(target=self.__process_interact, args=[interact]).start()
        return None

    #获取不同情绪声音
    def __get_mood_voice(self):
        voice = tts_voice.get_voice_of(config_util.config["attribute"]["voice"])
        if voice is None:
            voice = EnumVoice.XIAO_XIAO
        styleList = voice.value["styleList"]
        sayType = styleList["calm"]
        return sayType

    # 合成声音
    def say(self, interact, text, type = ""):
        try:
            uid = member_db.new_instance().find_user(interact.data.get("user"))
            is_end = interact.data.get("isend", False)
            is_first = interact.data.get("isfirst", False)
            if is_first == True:
                conv = "conv_" + str(uuid.uuid4())
                conv_no = 0
                self.user_conv_map[interact.data.get("user", "User")] = {"conversation_id" : conv, "conversation_msg_no" : conv_no}
            else:
                self.user_conv_map[interact.data.get("user", "User")]["conversation_msg_no"] += 1


            if not is_first and not is_end and (text is None or text.strip() == ""):
                return None
            self.__send_panel_message(text, interact.data.get('user'), uid, 0, type)
            
            # 处理think标签
            is_start_think = False
            # 第一步：处理结束标记</think>
            if "</think>" in text:
                # 设置用户退出思考模式
                self.think_mode_users[uid] = False
                
                # 分割文本，提取</think>后面的内容
                # 如果有多个</think>，我们只关心最后一个后面的内容
                parts = text.split("</think>")
                text = parts[-1].strip()
                
                # 如果提取出的文本为空，则不需要继续处理
                if text == "":
                    return None
            
            # 第二步：处理开始标记<think>
            # 注意：这里要检查经过上面处理后的text
            if "<think>" in text:
                is_start_think = True
                self.think_mode_users[uid] = True
                self.think_time_users[uid] = time.time()
            
            if self.think_mode_users.get(uid, False) and is_start_think:
                if wsa_server.get_web_instance().is_connected(interact.data.get('user')):
                    wsa_server.get_web_instance().add_cmd({"panelMsg": "思考中...", "Username" : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Thinking.jpg'})
                if wsa_server.get_instance().is_connected(interact.data.get("user")):
                    content = {'Topic': 'human', 'Data': {'Key': 'log', 'Value': "思考中..."}, 'Username' : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Thinking.jpg'}
                    wsa_server.get_instance().add_cmd(content)
            if self.think_mode_users.get(uid, False) == True and time.time() - self.think_time_users[uid] >= 5:
                self.think_time_users[uid] = time.time()
                text = "请稍等..."
            
            # 流式输出think中的内容
                
            elif self.think_mode_users.get(uid, False) == True and "</think>" not in text:
                return None
            result = None
            audio_url = interact.data.get('audio')#透传的音频
            if audio_url is not None:#透传音频下载
                file_name = 'sample-' + str(int(time.time() * 1000)) + audio_url[-4:]
                result = self.download_wav(audio_url, './samples/', file_name)
            elif config_util.config["interact"]["playSound"] or wsa_server.get_instance().is_connected(interact.data.get("user")) or self.__is_send_remote_device_audio(interact):#tts
                if text != None and text.replace("*", "").strip() != "":
                    # 先过滤表情符号，然后再合成语音
                    filtered_text = self.__remove_emojis(text.replace("*", ""))
                    if filtered_text is not None and filtered_text.strip() != "":
                        util.printInfo(1,  interact.data.get('user'), '合成音频...')
                        tm = time.time()
                        result = self.sp.to_sample(filtered_text, self.__get_mood_voice())
                        util.printInfo(1,  interact.data.get("user"), "合成音频完成. 耗时: {} ms 文件:{}".format(math.floor((time.time() - tm) * 1000), result))
            else:
                if is_end and wsa_server.get_web_instance().is_connected(interact.data.get('user')):
                    wsa_server.get_web_instance().add_cmd({"panelMsg": "", 'Username' : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Normal.jpg'})

            if result is not None or is_first or is_end:
                if is_end:#如果结束标记，则延迟1秒处理,免得is end比前面的音频tts要快
                    time.sleep(1)          
                MyThread(target=self.__process_output_audio, args=[result, interact, text]).start()
                return result         
                
        except BaseException as e:
            print(e) 
        return None
    
    #下载wav
    def download_wav(self, url, save_directory, filename):
        try:
            # 发送HTTP GET请求以获取WAV文件内容
            response = requests.get(url, stream=True)
            response.raise_for_status()  # 检查请求是否成功

            # 确保保存目录存在
            if not os.path.exists(save_directory):
                os.makedirs(save_directory)

            # 构建保存文件的路径
            save_path = os.path.join(save_directory, filename)

            # 将WAV文件内容保存到指定文件
            with open(save_path, 'wb') as f:
                for chunk in response.iter_content(chunk_size=1024):
                    if chunk:
                        f.write(chunk)

            return save_path
        except requests.exceptions.RequestException as e:
            print(f"[Error] Failed to download file: {e}")
            return None


    #面板播放声音
    def __play_sound(self):
        try:
            import pygame
            pygame.mixer.init()  # 初始化pygame.mixer，只需要在此处初始化一次, 如果初始化失败，则不播放音频
        except Exception as e:
            util.printInfo(1, "System", "音频播放初始化失败,本机无法播放音频")
            return

        while self.__running:
            time.sleep(0.01)
            if not self.sound_query.empty():  # 如果队列不为空则播放音频
                file_url, audio_length, interact = self.sound_query.get()

                is_first = interact.data.get('isfirst') is True
                is_end = interact.data.get('isend') is True


                if file_url is not None:
                    util.printInfo(1, interact.data.get('user'), '播放音频...')

                    if is_first:
                        self.speaking = True
                    elif not is_end:
                        self.speaking = True

                #自动播报关闭
                global auto_play_lock
                global can_auto_play
                with auto_play_lock:
                    if self.timer is not None:
                        self.timer.cancel()
                        self.timer = None
                    can_auto_play = False

                if wsa_server.get_web_instance().is_connected(interact.data.get('user')):
                    wsa_server.get_web_instance().add_cmd({"panelMsg": "播放中 ...", "Username" : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Speaking.jpg'})

                if file_url is not None:
                    pygame.mixer.music.load(file_url)
                    pygame.mixer.music.play()

                    # 播放过程中计时，直到音频播放完毕
                    length = 0
                    while length < audio_length:
                        length += 0.01
                        time.sleep(0.01)

                if is_end:
                    self.play_end(interact)

                if wsa_server.get_web_instance().is_connected(interact.data.get('user')):
                    wsa_server.get_web_instance().add_cmd({"panelMsg": "", "Username" : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Normal.jpg'})
                # 播放完毕后通知
                if wsa_server.get_web_instance().is_connected(interact.data.get("user")):
                    wsa_server.get_web_instance().add_cmd({"panelMsg": "", 'Username': interact.data.get('user')})
    
    #推送远程音频
    def __send_remote_device_audio(self, file_url, interact):
        if file_url is None:
            return
        delkey = None    
        for key, value in fay_booter.DeviceInputListenerDict.items():
            if value.username == interact.data.get("user") and value.isOutput: #按username选择推送，booter.devicelistenerdice按用户名记录
                try:
                    value.deviceConnector.send(b"\x00\x01\x02\x03\x04\x05\x06\x07\x08") # 发送音频开始标志，同时也检查设备是否在线
                    wavfile = open(os.path.abspath(file_url), "rb")
                    data = wavfile.read(102400)
                    total = 0
                    while data:
                        total += len(data)
                        value.deviceConnector.send(data)
                        data = wavfile.read(102400)
                        time.sleep(0.0001)
                    value.deviceConnector.send(b'\x08\x07\x06\x05\x04\x03\x02\x01\x00')# 发送音频结束标志
                    util.printInfo(1, value.username, "远程音频发送完成：{}".format(total))
                except socket.error as serr:
                    util.printInfo(1, value.username, "远程音频输入输出设备已经断开：{}".format(key)) 
                    value.stop()
                    delkey = key
        if delkey:
             value =  fay_booter.DeviceInputListenerDict.pop(delkey)
             if wsa_server.get_web_instance().is_connected(interact.data.get('user')):
                wsa_server.get_web_instance().add_cmd({"remote_audio_connect": False, "Username" : interact.data.get('user')})

    def __is_send_remote_device_audio(self, interact):
        for key, value in fay_booter.DeviceInputListenerDict.items():
            if value.username == interact.data.get("user") and value.isOutput:
                return True
        return False 

    #输出音频处理
    def __process_output_audio(self, file_url, interact, text):
        try:
            try:
                if file_url is None:
                    audio_length = 0
                elif file_url.endswith('.wav'):
                    audio = AudioSegment.from_wav(file_url)
                    audio_length = len(audio) / 1000.0  # 时长以秒为单位
                elif file_url.endswith('.mp3'):
                    audio = AudioSegment.from_mp3(file_url)
                    audio_length = len(audio) / 1000.0  # 时长以秒为单位
            except Exception as e:
                audio_length = 3

            #推送远程音频
            if file_url is not None:
                MyThread(target=self.__send_remote_device_audio, args=[file_url, interact]).start()       

            #发送音频给数字人接口
            if file_url is not None and wsa_server.get_instance().is_connected(interact.data.get("user")):
                content = {'Topic': 'human', 'Data': {'Key': 'audio', 'Value': os.path.abspath(file_url), 'HttpValue': f'{cfg.fay_url}/audio/' + os.path.basename(file_url),  'Text': text, 'Time': audio_length, 'Type': interact.interleaver, 'IsFirst': 1 if interact.data.get("isfirst", False) else 0,  'IsEnd': 1 if interact.data.get("isend", False) else 0, 'CONV_ID' : self.user_conv_map[interact.data.get("user", "User")]["conversation_id"], 'CONV_MSG_NO' : self.user_conv_map[interact.data.get("user", "User")]["conversation_msg_no"]  }, 'Username' : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Speaking.jpg'}
                #计算lips
                if platform.system() == "Windows":
                    try:
                        lip_sync_generator = LipSyncGenerator()
                        viseme_list = lip_sync_generator.generate_visemes(os.path.abspath(file_url))
                        consolidated_visemes = lip_sync_generator.consolidate_visemes(viseme_list)
                        content["Data"]["Lips"] = consolidated_visemes
                    except Exception as e:
                        print(e)
                        util.printInfo(1, interact.data.get("user"),  "唇型数据生成失败")
                wsa_server.get_instance().add_cmd(content)
                util.printInfo(1, interact.data.get("user"),  "数字人接口发送音频数据成功")

            #面板播放
            config_util.load_config()
            if config_util.config["interact"]["playSound"]:
                  self.sound_query.put((file_url, audio_length, interact))
            else:
                if wsa_server.get_web_instance().is_connected(interact.data.get('user')):
                    wsa_server.get_web_instance().add_cmd({"panelMsg": "", 'Username' : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Normal.jpg'})
            
        except Exception as e:
            print(e)

    def play_end(self, interact):
        self.speaking = False
        global can_auto_play
        global auto_play_lock
        with auto_play_lock:
            if self.timer:
                self.timer.cancel()
                self.timer = None
            if interact.interleaver != 'auto_play': #交互后暂停自动播报30秒
                self.timer = threading.Timer(30, self.set_auto_play)
                self.timer.start()
            else:
                can_auto_play = True

    #恢复自动播报(如果有)   
    def set_auto_play(self):
        global auto_play_lock
        global can_auto_play
        with auto_play_lock:
            can_auto_play = True
            self.timer = None

    #启动核心服务
    def start(self):
        if cfg.ltp_mode == "cemotion":
            from cemotion import Cemotion
            self.cemotion = Cemotion()
        MyThread(target=self.__play_sound).start()

    #停止核心服务
    def stop(self):
        self.__running = False
        self.speaking = False
        self.sp.close()
        wsa_server.get_web_instance().add_cmd({"panelMsg": ""})
        content = {'Topic': 'human', 'Data': {'Key': 'log', 'Value': ""}}
        wsa_server.get_instance().add_cmd(content)

    def __record_response(self, text, username, uid):
        """
        记录AI的回复内容
        :param text: 回复文本
        :param username: 用户名
        :param uid: 用户ID
        :return: content_id
        """
        self.write_to_file("./logs", "answer_result.txt", text)
        return content_db.new_instance().add_content('fay', 'speak', text, username, uid)

    def __send_panel_message(self, text, username, uid, content_id=None, type=None):
        """
        发送消息到Web面板
        :param text: 消息文本
        :param username: 用户名
        :param uid: 用户ID
        :param content_id: 内容ID
        :param type: 消息类型
        """
        if not wsa_server.get_web_instance().is_connected(username):
            return
            
        # 发送基本消息
        wsa_server.get_web_instance().add_cmd({
            "panelMsg": text,
            "Username": username
        })
        
        # 如果有content_id，发送回复消息
        if content_id is not None:
            wsa_server.get_web_instance().add_cmd({
                "panelReply": {
                    "type": "fay",
                    "content": text,
                    "username": username,
                    "uid": uid,
                    "id": content_id,
                    "is_adopted": type == 'qa'
                },
                "Username": username
            })

    def __send_digital_human_message(self, text, username):
        """
        发送消息到数字人（语音应该在say方法驱动数字人输出）
        :param text: 消息文本
        :param username: 用户名
        """
        full_text = self.__remove_emojis(text.replace("*", ""))
        if wsa_server.get_instance().is_connected(username):
            content = {
                'Topic': 'human',
                'Data': {
                    'Key': 'text',
                    'Value': full_text
                },
                'Username': username
            }
            wsa_server.get_instance().add_cmd(content)

    def __process_text_output(self, text, username, uid):
        """
        处理文本输出到各个终端
        :param text: 主要回复文本
        :param textlist: 额外回复列表
        :param username: 用户名
        :param uid: 用户ID
        :param type: 消息类型
        """
        if text:
            text = text.strip()
            
        # 记录主回复
        content_id = self.__record_response(text, username, uid)
        
        # 发送主回复到面板和数字人
        # self.__send_panel_message(text, username, uid, content_id, type)
        self.__send_digital_human_message(text, username)
        
        # 打印日志
        util.printInfo(1, username, '({}) {}'.format(self.__get_mood_voice(), text))

import importlib
fay_booter = importlib.import_module('fay_booter')
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								#作用是处理交互逻辑，文字输入，语音、文字及情绪的发送、播放及展示输出
 								import math
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								from operator import index
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								import os
 								import time
 								import socket
 								import requests
 								from pydub import AudioSegment
-												年番更新

1、修复录音失败时输出问题；
2、修复linux端启动时，因subprocess报错问题；
3、修复获取状态接口报错问题；
4、新增数字人定位、目标设置；
5、新增启动日志提醒；
6、新增支持流式llm及tts；
7、修正agent多个bug；
8、支持deepseek https://qqk9ntwbcit.feishu.cn/wiki/Ghh9wFpMIiiFxTk8SlQcZLIrnMf

											
										
										
											2025-02-12 22:20:37 +08:00
+								from queue import Queue
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								import re  # 添加正则表达式模块用于过滤表情符号
-												fay自然进行

1.优化认知机制；
2.funasr依赖更新；
3.更换公共配置中心服务器；
4.优化mcp管理；
5.去除单独情绪计算（llm已经支持）；
6.优化think的“请稍等”提醒逻辑；
7.流式推送给数字人接口的文本补充会话id及消息序号。

											
										
										
											2025-08-05 00:40:02 +08:00
+								import uuid
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								# 适应模型使用
 								import numpy as np
 								from ai_module import baidu_emotion
 								from core import wsa_server
 								from core.interact import Interact
 								from tts.tts_voice import EnumVoice
 								from scheduler.thread_manager import MyThread
 								from tts import tts_voice
 								from utils import util, config_util
 								from core import qa_service
 								from utils import config_util as cfg
 								from core import content_db
 								from ai_module import nlp_cemotion
-												fay自然进化

1. 增加清除记忆功能；
2. 增加克隆性格功能；
3. 增加认知模型（专属的记忆逻辑、反思逻辑）；
4. 修复自动播报bug；
5. fay_url配置响修正；
6. 修复流式输出前置换行问题；
7. 修复没有用户聊天记录前端反复添加默认用户问题；
8. 更新dockerfile；
9. 重构util.py代码。
1. Fay ai编程指南：https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型：https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio

											
										
										
											2025-04-02 23:31:46 +08:00
+								from llm import nlp_cognitive_stream
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								from core import stream_manager
-												年番更新

1、修复UE连接数字人接口不稳定问题；
2、修复运行途中关闭麦克风依然监听问题；
3、增加打招呼接口；
4、智普清流llm对接；

											
										
										
											2024-12-18 17:48:57 +08:00
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								from core import member_db
 								import threading
 								#加载配置
 								cfg.load_config()
 								if cfg.tts_module =='ali':
 								    from tts.ali_tss import Speech
 								elif cfg.tts_module == 'gptsovits':
 								    from tts.gptsovits import Speech
 								elif cfg.tts_module == 'gptsovits_v3':
 								    from tts.gptsovits_v3 import Speech
 								elif cfg.tts_module == 'volcano':
 								    from tts.volcano_tts import Speech
 								else:
 								    from tts.ms_tts_sdk import Speech
 								#windows运行推送唇形数据
 								import platform
 								if platform.system() == "Windows":
 								    import sys
 								    sys.path.append("test/ovr_lipsync")
 								    from test_olipsync import LipSyncGenerator
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								#可以使用自动播报的标记
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								can_auto_play = True
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								auto_play_lock = threading.RLock()
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								class FeiFei:
 								    def __init__(self):
 								        self.lock = threading.Lock()
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								        self.nlp_streams = {} # 存储用户ID到句子缓存的映射
 								        self.nlp_stream_lock = threading.Lock() # 保护nlp_streams字典的锁
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								        self.mood = 0.0  # 情绪值
 								        self.old_mood = 0.0
 								        self.item_index = 0
 								        self.X = np.array([1, 0, 0, 0, 0, 0, 0, 0]).reshape(1, -1)  # 适应模型变量矩阵
 								        # self.W = np.array([0.01577594,1.16119452,0.75828,0.207746,1.25017864,0.1044121,0.4294899,0.2770932]).reshape(-1,1) #适应模型变量矩阵
 								        self.W = np.array([0.0, 0.6, 0.1, 0.7, 0.3, 0.0, 0.0, 0.0]).reshape(-1, 1)  # 适应模型变量矩阵
 								        self.wsParam = None
 								        self.wss = None
 								        self.sp = Speech()
 								        self.speaking = False #声音是否在播放
 								        self.__running = True
 								        self.sp.connect()  #TODO 预连接
 								        self.cemotion = None
-												年番更新

1、自动播放逻辑优化：交互完停30秒才继续；
2、降低socket心跳频率，可以一定程序节省安卓远程设备的用电量；
3、增加消息透传接口：https://qqk9ntwbcit.feishu.cn/wiki/PNKFwVgUKig6fDkMH03cMPiInIb
4、修复底部用户列表样式错误；
5、提高agent日程执行成功率；

											
										
										
											2025-01-01 00:14:19 +08:00
+								        self.timer = None
-												年番更新

1、修复录音失败时输出问题；
2、修复linux端启动时，因subprocess报错问题；
3、修复获取状态接口报错问题；
4、新增数字人定位、目标设置；
5、新增启动日志提醒；
6、新增支持流式llm及tts；
7、修正agent多个bug；
8、支持deepseek https://qqk9ntwbcit.feishu.cn/wiki/Ghh9wFpMIiiFxTk8SlQcZLIrnMf

											
										
										
											2025-02-12 22:20:37 +08:00
+								        self.sound_query = Queue()
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								        self.think_mode_users = {}  # 使用字典存储每个用户的think模式状态
-												fay自然进行

1.优化认知机制；
2.funasr依赖更新；
3.更换公共配置中心服务器；
4.优化mcp管理；
5.去除单独情绪计算（llm已经支持）；
6.优化think的“请稍等”提醒逻辑；
7.流式推送给数字人接口的文本补充会话id及消息序号。

											
										
										
											2025-08-05 00:40:02 +08:00
+								        self.think_time_users = {} #使用字典存储每个用户的think开始时间
 								        self.user_conv_map = {} #存储用户对话id及句子流序号
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
 								    def __remove_emojis(self, text):
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
+								        """
 								        改进的表情包过滤，避免误删除正常Unicode字符
 								        """
 								        # 更精确的emoji范围，避免误删除正常字符
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								        emoji_pattern = re.compile(
 								            "["
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
+								            "\U0001F600-\U0001F64F"  # 表情符号 (Emoticons)
 								            "\U0001F300-\U0001F5FF"  # 杂项符号和象形文字 (Miscellaneous Symbols and Pictographs)
 								            "\U0001F680-\U0001F6FF"  # 交通和地图符号 (Transport and Map Symbols)
 								            "\U0001F1E0-\U0001F1FF"  # 区域指示符号 (Regional Indicator Symbols)
 								            "\U0001F900-\U0001F9FF"  # 补充符号和象形文字 (Supplemental Symbols and Pictographs)
 								            "\U0001FA70-\U0001FAFF"  # 扩展A符号和象形文字 (Symbols and Pictographs Extended-A)
 								            "\U00002600-\U000026FF"  # 杂项符号 (Miscellaneous Symbols)
 								            "\U00002700-\U000027BF"  # 装饰符号 (Dingbats)
 								            "\U0000FE00-\U0000FE0F"  # 变体选择器 (Variation Selectors)
 								            "\U0001F000-\U0001F02F"  # 麻将牌 (Mahjong Tiles)
 								            "\U0001F0A0-\U0001F0FF"  # 扑克牌 (Playing Cards)
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								            "]+",
 								            flags=re.UNICODE,
 								        )
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
 								        # 保护常用的中文标点符号和特殊字符
 								        protected_chars = ["。", "，", "！", "？", "：", "；", "、", """, """, "'", "'", "（", "）", "【", "】", "《", "》"]
 								        # 先保存保护字符的位置
 								        protected_positions = {}
 								        for i, char in enumerate(text):
 								            if char in protected_chars:
 								                protected_positions[i] = char
 								        # 执行emoji过滤
 								        filtered_text = emoji_pattern.sub('', text)
 								        # 如果过滤后文本长度变化太大，可能误删了正常字符，返回原文本
 								        if len(filtered_text) < len(text) * 0.5:  # 如果删除了超过50%的内容
 								            return text
 								        return filtered_text
 								    def __process_qa_stream(self, text, username):
 								        """
 								        按流式方式分割和发送Q&A答案
 								        使用安全的流式文本处理器和状态管理器
 								        """
 								        if not text or text.strip() == "":
 								            return
 								        # 使用安全的流式文本处理器
 								        from utils.stream_text_processor import get_processor
 								        from utils.stream_state_manager import get_state_manager
 								        processor = get_processor()
 								        state_manager = get_state_manager()
 								        # 处理Q&A流式文本，is_qa=True表示Q&A模式
 								        success = processor.process_stream_text(text, username, is_qa=True, session_type="qa")
 								        if success:
 								            # Q&A模式结束会话（不再需要发送额外的结束标记）
 								            state_manager.end_session(username)
 								        else:
 								            util.log(1, f"Q&A流式处理失败，文本长度: {len(text)}")
 								            # 失败时也要确保结束会话
 								            state_manager.force_reset_user_state(username)
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								    #语音消息处理检查是否命中q&a
 								    def __get_answer(self, interleaver, text):
 								        answer = None
 								        # 全局问答
-												年番更新

1、qa回复新增在范围内随机命中；
2、gpt问答新增当前时间获取；
3、命中qa的回复，标示为采纳；
4，新增执行python main.py start命令可自启动。

											
										
										
											2024-12-11 19:08:04 +08:00
+								        answer, type = qa_service.QAService().question('qa',text)
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								        if answer is not None:
-												年番更新

1、qa回复新增在范围内随机命中；
2、gpt问答新增当前时间获取；
3、命中qa的回复，标示为采纳；
4，新增执行python main.py start命令可自启动。

											
										
										
											2024-12-11 19:08:04 +08:00
+								            return answer, type
 								        else:
 								            return None, None
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								    #语音消息处理
 								    def __process_interact(self, interact: Interact):
 								        if self.__running:
 								            try:
 								                index = interact.interact_type
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								                username = interact.data.get("user", "User")
 								                uid = member_db.new_instance().find_user(username)
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								                if index == 1: #语音文字交互
 								                    #记录用户问题,方便obs等调用
 								                    self.write_to_file("./logs", "asr_result.txt",  interact.data["msg"])
 								                    #同步用户问题到数字人
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								                    if wsa_server.get_instance().is_connected(username):
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								                        content = {'Topic': 'human', 'Data': {'Key': 'question', 'Value': interact.data["msg"]}, 'Username' : interact.data.get("user")}
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								                        wsa_server.get_instance().add_cmd(content)
 								                    #记录用户问题
-												Fay年翻更新

- 升级Agent（chat_module=agent切换）：升级到langgraph react agent逻辑、集成到主分支fay中、基于自动决策工具调用机制、基于日程跟踪的主动沟通、支持外部观测数据传入；
- 修复因线程同步问题导致的配置文件读写不稳定
- 聊天采纳功能的bug修复

											
										
										
											2024-11-20 23:44:47 +08:00
+								                    content_id = content_db.new_instance().add_content('member','speak',interact.data["msg"], username, uid)
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								                    if wsa_server.get_web_instance().is_connected(username):
-												Fay年翻更新

- 升级Agent（chat_module=agent切换）：升级到langgraph react agent逻辑、集成到主分支fay中、基于自动决策工具调用机制、基于日程跟踪的主动沟通、支持外部观测数据传入；
- 修复因线程同步问题导致的配置文件读写不稳定
- 聊天采纳功能的bug修复

											
										
										
											2024-11-20 23:44:47 +08:00
+								                        wsa_server.get_web_instance().add_cmd({"panelReply": {"type":"member","content":interact.data["msg"], "username":username, "uid":uid, "id":content_id}, "Username" : username})
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								                    #确定是否命中q&a
-												年番更新

1、qa回复新增在范围内随机命中；
2、gpt问答新增当前时间获取；
3、命中qa的回复，标示为采纳；
4，新增执行python main.py start命令可自启动。

											
										
										
											2024-12-11 19:08:04 +08:00
+								                    answer, type = self.__get_answer(interact.interleaver, interact.data["msg"])
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								                    #大语言模型回复
 								                    text = ''
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								                    if answer is None or type != "qa":
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								                        if wsa_server.get_web_instance().is_connected(username):
-												fay自然进化

1. 增加清除记忆功能；
2. 增加克隆性格功能；
3. 增加认知模型（专属的记忆逻辑、反思逻辑）；
4. 修复自动播报bug；
5. fay_url配置响修正；
6. 修复流式输出前置换行问题；
7. 修复没有用户聊天记录前端反复添加默认用户问题；
8. 更新dockerfile；
9. 重构util.py代码。
1. Fay ai编程指南：https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型：https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio

											
										
										
											2025-04-02 23:31:46 +08:00
+								                            wsa_server.get_web_instance().add_cmd({"panelMsg": "思考中...", "Username" : username, 'robot': f'{cfg.fay_url}/robot/Thinking.jpg'})
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								                        if wsa_server.get_instance().is_connected(username):
-												fay自然进化

1. 增加清除记忆功能；
2. 增加克隆性格功能；
3. 增加认知模型（专属的记忆逻辑、反思逻辑）；
4. 修复自动播报bug；
5. fay_url配置响修正；
6. 修复流式输出前置换行问题；
7. 修复没有用户聊天记录前端反复添加默认用户问题；
8. 更新dockerfile；
9. 重构util.py代码。
1. Fay ai编程指南：https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型：https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio

											
										
										
											2025-04-02 23:31:46 +08:00
+								                            content = {'Topic': 'human', 'Data': {'Key': 'log', 'Value': "思考中..."}, 'Username' : username, 'robot': f'{cfg.fay_url}/robot/Thinking.jpg'}
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								                            wsa_server.get_instance().add_cmd(content)
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								                        text = nlp_cognitive_stream.question(interact.data["msg"], username, interact.data.get("observation", None))
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								                    else:
 								                        text = answer
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
+								                        # 使用流式分割处理Q&A答案
 								                        self.__process_qa_stream(text, username)
-												年番更新

1、qa回复新增在范围内随机命中；
2、gpt问答新增当前时间获取；
3、命中qa的回复，标示为采纳；
4，新增执行python main.py start命令可自启动。

											
										
										
											2024-12-11 19:08:04 +08:00
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								                    #完整文本记录回复并输出到各个终端
 								                    self.__process_text_output(text, username, uid  )
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								                    return text
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								                elif (index == 2):#透传模式，用于适配自动播报控制及agent的通知工具
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								                    if interact.data.get("text"):
 								                        text = interact.data.get("text")
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								                        # 使用统一的文本处理方法，空列表表示没有额外回复
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								                        self.__process_text_output(text, username, uid)
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								                        MyThread(target=self.say, args=[interact, text]).start()
-												年番更新

1、自动播放逻辑优化：交互完停30秒才继续；
2、降低socket心跳频率，可以一定程序节省安卓远程设备的用电量；
3、增加消息透传接口：https://qqk9ntwbcit.feishu.cn/wiki/PNKFwVgUKig6fDkMH03cMPiInIb
4、修复底部用户列表样式错误；
5、提高agent日程执行成功率；

											
										
										
											2025-01-01 00:14:19 +08:00
+								                    return 'success'
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								            except BaseException as e:
 								                print(e)
 								                return e
 								        else:
 								            return "还没有开始运行"
 								    #记录问答到log
 								    def write_to_file(self, path, filename, content):
 								        if not os.path.exists(path):
 								            os.makedirs(path)
 								        full_path = os.path.join(path, filename)
 								        with open(full_path, 'w', encoding='utf-8') as file:
 								            file.write(content)
 								            file.flush()
 								            os.fsync(file.fileno())
 								    #触发语音交互
 								    def on_interact(self, interact: Interact):
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								        #创建用户
 								        username = interact.data.get("user", "User")
 								        if member_db.new_instance().is_username_exist(username)  == "notexists":
 								            member_db.new_instance().add_user(username)
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								        MyThread(target=self.__process_interact, args=[interact]).start()
 								        return None
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								    #获取不同情绪声音
 								    def __get_mood_voice(self):
 								        voice = tts_voice.get_voice_of(config_util.config["attribute"]["voice"])
 								        if voice is None:
 								            voice = EnumVoice.XIAO_XIAO
 								        styleList = voice.value["styleList"]
 								        sayType = styleList["calm"]
 								        return sayType
 								    # 合成声音
-												fay自然进行

1.优化认知机制；
2.funasr依赖更新；
3.更换公共配置中心服务器；
4.优化mcp管理；
5.去除单独情绪计算（llm已经支持）；
6.优化think的“请稍等”提醒逻辑；
7.流式推送给数字人接口的文本补充会话id及消息序号。

											
										
										
											2025-08-05 00:40:02 +08:00
+								    def say(self, interact, text, type = ""):
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								        try:
-												fay自然进行

1.优化认知机制；
2.funasr依赖更新；
3.更换公共配置中心服务器；
4.优化mcp管理；
5.去除单独情绪计算（llm已经支持）；
6.优化think的“请稍等”提醒逻辑；
7.流式推送给数字人接口的文本补充会话id及消息序号。

											
										
										
											2025-08-05 00:40:02 +08:00
+								            uid = member_db.new_instance().find_user(interact.data.get("user"))
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								            is_end = interact.data.get("isend", False)
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								            is_first = interact.data.get("isfirst", False)
-												fay自然进行

1.优化认知机制；
2.funasr依赖更新；
3.更换公共配置中心服务器；
4.优化mcp管理；
5.去除单独情绪计算（llm已经支持）；
6.优化think的“请稍等”提醒逻辑；
7.流式推送给数字人接口的文本补充会话id及消息序号。

											
										
										
											2025-08-05 00:40:02 +08:00
+								            if is_first == True:
 								                conv = "conv_" + str(uuid.uuid4())
 								                conv_no = 0
 								                self.user_conv_map[interact.data.get("user", "User")] = {"conversation_id" : conv, "conversation_msg_no" : conv_no}
 								            else:
 								                self.user_conv_map[interact.data.get("user", "User")]["conversation_msg_no"] += 1
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
+								            if not is_first and not is_end and (text is None or text.strip() == ""):
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								                return None
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								            self.__send_panel_message(text, interact.data.get('user'), uid, 0, type)
 								            # 处理think标签
 								            is_start_think = False
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								            # 第一步：处理结束标记</think>
 								            if "</think>" in text:
 								                # 设置用户退出思考模式
 								                self.think_mode_users[uid] = False
 								                # 分割文本，提取</think>后面的内容
 								                # 如果有多个</think>，我们只关心最后一个后面的内容
 								                parts = text.split("</think>")
 								                text = parts[-1].strip()
 								                # 如果提取出的文本为空，则不需要继续处理
 								                if text == "":
 								                    return None
 								            # 第二步：处理开始标记<think>
 								            # 注意：这里要检查经过上面处理后的text
 								            if "<think>" in text:
 								                is_start_think = True
 								                self.think_mode_users[uid] = True
-												fay自然进行

1.优化认知机制；
2.funasr依赖更新；
3.更换公共配置中心服务器；
4.优化mcp管理；
5.去除单独情绪计算（llm已经支持）；
6.优化think的“请稍等”提醒逻辑；
7.流式推送给数字人接口的文本补充会话id及消息序号。

											
										
										
											2025-08-05 00:40:02 +08:00
+								                self.think_time_users[uid] = time.time()
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
-												Update fay_core.py

减小thinking数据的重复向数字人输出。

											
										
										
											2025-03-13 15:33:53 +08:00
+								            if self.think_mode_users.get(uid, False) and is_start_think:
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								                if wsa_server.get_web_instance().is_connected(interact.data.get('user')):
-												fay自然进化

1. 增加清除记忆功能；
2. 增加克隆性格功能；
3. 增加认知模型（专属的记忆逻辑、反思逻辑）；
4. 修复自动播报bug；
5. fay_url配置响修正；
6. 修复流式输出前置换行问题；
7. 修复没有用户聊天记录前端反复添加默认用户问题；
8. 更新dockerfile；
9. 重构util.py代码。
1. Fay ai编程指南：https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型：https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio

											
										
										
											2025-04-02 23:31:46 +08:00
+								                    wsa_server.get_web_instance().add_cmd({"panelMsg": "思考中...", "Username" : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Thinking.jpg'})
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								                if wsa_server.get_instance().is_connected(interact.data.get("user")):
-												fay自然进化

1. 增加清除记忆功能；
2. 增加克隆性格功能；
3. 增加认知模型（专属的记忆逻辑、反思逻辑）；
4. 修复自动播报bug；
5. fay_url配置响修正；
6. 修复流式输出前置换行问题；
7. 修复没有用户聊天记录前端反复添加默认用户问题；
8. 更新dockerfile；
9. 重构util.py代码。
1. Fay ai编程指南：https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型：https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio

											
										
										
											2025-04-02 23:31:46 +08:00
+								                    content = {'Topic': 'human', 'Data': {'Key': 'log', 'Value': "思考中..."}, 'Username' : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Thinking.jpg'}
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								                    wsa_server.get_instance().add_cmd(content)
-												Update fay_core.py

修复不语音合成的bug。

											
										
										
											2025-08-13 14:13:57 +08:00
+								            if self.think_mode_users.get(uid, False) == True and time.time() - self.think_time_users[uid] >= 5:
-												fay自然进行

1.优化认知机制；
2.funasr依赖更新；
3.更换公共配置中心服务器；
4.优化mcp管理；
5.去除单独情绪计算（llm已经支持）；
6.优化think的“请稍等”提醒逻辑；
7.流式推送给数字人接口的文本补充会话id及消息序号。

											
										
										
											2025-08-05 00:40:02 +08:00
+								                self.think_time_users[uid] = time.time()
 								                text = "请稍等..."
 								            # 流式输出think中的内容
-												Update fay_core.py

修复不语音合成的bug。

											
										
										
											2025-08-13 14:13:57 +08:00
-												fay自然进行

1.优化认知机制；
2.funasr依赖更新；
3.更换公共配置中心服务器；
4.优化mcp管理；
5.去除单独情绪计算（llm已经支持）；
6.优化think的“请稍等”提醒逻辑；
7.流式推送给数字人接口的文本补充会话id及消息序号。

											
										
										
											2025-08-05 00:40:02 +08:00
+								            elif self.think_mode_users.get(uid, False) == True and "</think>" not in text:
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								                return None
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								            result = None
-												紧急更新

1、删除意外出的语音合成开关；
2、唤醒、麦克风、扬声器可以启动后开启和关闭。

											
										
										
											2024-11-01 09:18:19 +08:00
+								            audio_url = interact.data.get('audio')#透传的音频
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								            if audio_url is not None:#透传音频下载
 								                file_name = 'sample-' + str(int(time.time() * 1000)) + audio_url[-4:]
-												紧急更新

1、删除意外出的语音合成开关；
2、唤醒、麦克风、扬声器可以启动后开启和关闭。

											
										
										
											2024-11-01 09:18:19 +08:00
+								                result = self.download_wav(audio_url, './samples/', file_name)
 								            elif config_util.config["interact"]["playSound"] or wsa_server.get_instance().is_connected(interact.data.get("user")) or self.__is_send_remote_device_audio(interact):#tts
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								                if text != None and text.replace("*", "").strip() != "":
 								                    # 先过滤表情符号，然后再合成语音
 								                    filtered_text = self.__remove_emojis(text.replace("*", ""))
 								                    if filtered_text is not None and filtered_text.strip() != "":
 								                        util.printInfo(1,  interact.data.get('user'), '合成音频...')
 								                        tm = time.time()
 								                        result = self.sp.to_sample(filtered_text, self.__get_mood_voice())
 								                        util.printInfo(1,  interact.data.get("user"), "合成音频完成. 耗时: {} ms 文件:{}".format(math.floor((time.time() - tm) * 1000), result))
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								            else:
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								                if is_end and wsa_server.get_web_instance().is_connected(interact.data.get('user')):
-												fay自然进化

1. 增加清除记忆功能；
2. 增加克隆性格功能；
3. 增加认知模型（专属的记忆逻辑、反思逻辑）；
4. 修复自动播报bug；
5. fay_url配置响修正；
6. 修复流式输出前置换行问题；
7. 修复没有用户聊天记录前端反复添加默认用户问题；
8. 更新dockerfile；
9. 重构util.py代码。
1. Fay ai编程指南：https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型：https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio

											
										
										
											2025-04-02 23:31:46 +08:00
+								                    wsa_server.get_web_instance().add_cmd({"panelMsg": "", 'Username' : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Normal.jpg'})
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
-												紧急修复

--修复因流式音频结束标记提前而导致的麦克风风不释放问题；
--使用更短的文本切割。

											
										
										
											2025-06-10 23:15:41 +08:00
+								            if result is not None or is_first or is_end:
 								                if is_end:#如果结束标记，则延迟1秒处理,免得is end比前面的音频tts要快
 								                    time.sleep(1)
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								                MyThread(target=self.__process_output_audio, args=[result, interact, text]).start()
 								                return result
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								        except BaseException as e:
-												自然进化

1.恢复文字、唤醒词、意图接口打断功能；
2、新增支持本地mcp工具调用；
3、支持mcp工具独立控制；
4、内置mcp工具箱及日程管理mcp工具；
5、结束fay时主动关闭（断开）mcp服务；
6、优化线程管理逻辑；
7、支持ctrl+c退出fay。

											
										
										
											2025-08-28 00:24:21 +08:00
+								            print(e)
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								        return None
 								    #下载wav
 								    def download_wav(self, url, save_directory, filename):
 								        try:
 								            # 发送HTTP GET请求以获取WAV文件内容
 								            response = requests.get(url, stream=True)
 								            response.raise_for_status()  # 检查请求是否成功
 								            # 确保保存目录存在
 								            if not os.path.exists(save_directory):
 								                os.makedirs(save_directory)
 								            # 构建保存文件的路径
 								            save_path = os.path.join(save_directory, filename)
 								            # 将WAV文件内容保存到指定文件
 								            with open(save_path, 'wb') as f:
 								                for chunk in response.iter_content(chunk_size=1024):
 								                    if chunk:
 								                        f.write(chunk)
 								            return save_path
 								        except requests.exceptions.RequestException as e:
 								            print(f"[Error] Failed to download file: {e}")
 								            return None
 								    #面板播放声音
-												年番更新

1、修复录音失败时输出问题；
2、修复linux端启动时，因subprocess报错问题；
3、修复获取状态接口报错问题；
4、新增数字人定位、目标设置；
5、新增启动日志提醒；
6、新增支持流式llm及tts；
7、修正agent多个bug；
8、支持deepseek https://qqk9ntwbcit.feishu.cn/wiki/Ghh9wFpMIiiFxTk8SlQcZLIrnMf

											
										
										
											2025-02-12 22:20:37 +08:00
+								    def __play_sound(self):
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								        try:
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								            import pygame
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								            pygame.mixer.init()  # 初始化pygame.mixer，只需要在此处初始化一次, 如果初始化失败，则不播放音频
 								        except Exception as e:
 								            util.printInfo(1, "System", "音频播放初始化失败,本机无法播放音频")
 								            return
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
-												年番更新

1、修复录音失败时输出问题；
2、修复linux端启动时，因subprocess报错问题；
3、修复获取状态接口报错问题；
4、新增数字人定位、目标设置；
5、新增启动日志提醒；
6、新增支持流式llm及tts；
7、修正agent多个bug；
8、支持deepseek https://qqk9ntwbcit.feishu.cn/wiki/Ghh9wFpMIiiFxTk8SlQcZLIrnMf

											
										
										
											2025-02-12 22:20:37 +08:00
+								        while self.__running:
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								            time.sleep(0.01)
-												年番更新

1、修复录音失败时输出问题；
2、修复linux端启动时，因subprocess报错问题；
3、修复获取状态接口报错问题；
4、新增数字人定位、目标设置；
5、新增启动日志提醒；
6、新增支持流式llm及tts；
7、修正agent多个bug；
8、支持deepseek https://qqk9ntwbcit.feishu.cn/wiki/Ghh9wFpMIiiFxTk8SlQcZLIrnMf

											
										
										
											2025-02-12 22:20:37 +08:00
+								            if not self.sound_query.empty():  # 如果队列不为空则播放音频
 								                file_url, audio_length, interact = self.sound_query.get()
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
 								                is_first = interact.data.get('isfirst') is True
 								                is_end = interact.data.get('isend') is True
-												紧急修复

--修复因流式音频结束标记提前而导致的麦克风风不释放问题；
--使用更短的文本切割。

											
										
										
											2025-06-10 23:15:41 +08:00
+								                if file_url is not None:
 								                    util.printInfo(1, interact.data.get('user'), '播放音频...')
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
 								                    if is_first:
 								                        self.speaking = True
 								                    elif not is_end:
 								                        self.speaking = True
-												fay自然进化

1. 增加清除记忆功能；
2. 增加克隆性格功能；
3. 增加认知模型（专属的记忆逻辑、反思逻辑）；
4. 修复自动播报bug；
5. fay_url配置响修正；
6. 修复流式输出前置换行问题；
7. 修复没有用户聊天记录前端反复添加默认用户问题；
8. 更新dockerfile；
9. 重构util.py代码。
1. Fay ai编程指南：https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型：https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio

											
										
										
											2025-04-02 23:31:46 +08:00
 								                #自动播报关闭
 								                global auto_play_lock
 								                global can_auto_play
 								                with auto_play_lock:
 								                    if self.timer is not None:
 								                        self.timer.cancel()
 								                        self.timer = None
 								                    can_auto_play = False
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								                if wsa_server.get_web_instance().is_connected(interact.data.get('user')):
-												fay自然进化

1. 增加清除记忆功能；
2. 增加克隆性格功能；
3. 增加认知模型（专属的记忆逻辑、反思逻辑）；
4. 修复自动播报bug；
5. fay_url配置响修正；
6. 修复流式输出前置换行问题；
7. 修复没有用户聊天记录前端反复添加默认用户问题；
8. 更新dockerfile；
9. 重构util.py代码。
1. Fay ai编程指南：https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型：https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio

											
										
										
											2025-04-02 23:31:46 +08:00
+								                    wsa_server.get_web_instance().add_cmd({"panelMsg": "播放中 ...", "Username" : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Speaking.jpg'})
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								                if file_url is not None:
 								                    pygame.mixer.music.load(file_url)
 								                    pygame.mixer.music.play()
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
-												紧急修复

--修复因流式音频结束标记提前而导致的麦克风风不释放问题；
--使用更短的文本切割。

											
										
										
											2025-06-10 23:15:41 +08:00
+								                    # 播放过程中计时，直到音频播放完毕
 								                    length = 0
 								                    while length < audio_length:
 								                        length += 0.01
 								                        time.sleep(0.01)
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								                if is_end:
 								                    self.play_end(interact)
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								                if wsa_server.get_web_instance().is_connected(interact.data.get('user')):
-												fay自然进化

1. 增加清除记忆功能；
2. 增加克隆性格功能；
3. 增加认知模型（专属的记忆逻辑、反思逻辑）；
4. 修复自动播报bug；
5. fay_url配置响修正；
6. 修复流式输出前置换行问题；
7. 修复没有用户聊天记录前端反复添加默认用户问题；
8. 更新dockerfile；
9. 重构util.py代码。
1. Fay ai编程指南：https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型：https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio

											
										
										
											2025-04-02 23:31:46 +08:00
+								                    wsa_server.get_web_instance().add_cmd({"panelMsg": "", "Username" : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Normal.jpg'})
-												年番更新

1、修复录音失败时输出问题；
2、修复linux端启动时，因subprocess报错问题；
3、修复获取状态接口报错问题；
4、新增数字人定位、目标设置；
5、新增启动日志提醒；
6、新增支持流式llm及tts；
7、修正agent多个bug；
8、支持deepseek https://qqk9ntwbcit.feishu.cn/wiki/Ghh9wFpMIiiFxTk8SlQcZLIrnMf

											
										
										
											2025-02-12 22:20:37 +08:00
+								                # 播放完毕后通知
 								                if wsa_server.get_web_instance().is_connected(interact.data.get("user")):
 								                    wsa_server.get_web_instance().add_cmd({"panelMsg": "", 'Username': interact.data.get('user')})
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								    #推送远程音频
 								    def __send_remote_device_audio(self, file_url, interact):
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								        if file_url is None:
 								            return
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								        delkey = None
 								        for key, value in fay_booter.DeviceInputListenerDict.items():
 								            if value.username == interact.data.get("user") and value.isOutput: #按username选择推送，booter.devicelistenerdice按用户名记录
 								                try:
 								                    value.deviceConnector.send(b"\x00\x01\x02\x03\x04\x05\x06\x07\x08") # 发送音频开始标志，同时也检查设备是否在线
 								                    wavfile = open(os.path.abspath(file_url), "rb")
 								                    data = wavfile.read(102400)
 								                    total = 0
 								                    while data:
 								                        total += len(data)
 								                        value.deviceConnector.send(data)
 								                        data = wavfile.read(102400)
 								                        time.sleep(0.0001)
 								                    value.deviceConnector.send(b'\x08\x07\x06\x05\x04\x03\x02\x01\x00')# 发送音频结束标志
 								                    util.printInfo(1, value.username, "远程音频发送完成：{}".format(total))
 								                except socket.error as serr:
 								                    util.printInfo(1, value.username, "远程音频输入输出设备已经断开：{}".format(key))
 								                    value.stop()
 								                    delkey = key
 								        if delkey:
 								             value =  fay_booter.DeviceInputListenerDict.pop(delkey)
 								             if wsa_server.get_web_instance().is_connected(interact.data.get('user')):
 								                wsa_server.get_web_instance().add_cmd({"remote_audio_connect": False, "Username" : interact.data.get('user')})
 								    def __is_send_remote_device_audio(self, interact):
 								        for key, value in fay_booter.DeviceInputListenerDict.items():
 								            if value.username == interact.data.get("user") and value.isOutput:
 								                return True
 								        return False
 								    #输出音频处理
 								    def __process_output_audio(self, file_url, interact, text):
 								        try:
 								            try:
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								                if file_url is None:
 								                    audio_length = 0
 								                elif file_url.endswith('.wav'):
 								                    audio = AudioSegment.from_wav(file_url)
 								                    audio_length = len(audio) / 1000.0  # 时长以秒为单位
 								                elif file_url.endswith('.mp3'):
 								                    audio = AudioSegment.from_mp3(file_url)
 								                    audio_length = len(audio) / 1000.0  # 时长以秒为单位
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								            except Exception as e:
 								                audio_length = 3
 								            #推送远程音频
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								            if file_url is not None:
 								                MyThread(target=self.__send_remote_device_audio, args=[file_url, interact]).start()
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								            #发送音频给数字人接口
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								            if file_url is not None and wsa_server.get_instance().is_connected(interact.data.get("user")):
-												fay自然进行

1.优化认知机制；
2.funasr依赖更新；
3.更换公共配置中心服务器；
4.优化mcp管理；
5.去除单独情绪计算（llm已经支持）；
6.优化think的“请稍等”提醒逻辑；
7.流式推送给数字人接口的文本补充会话id及消息序号。

											
										
										
											2025-08-05 00:40:02 +08:00
+								                content = {'Topic': 'human', 'Data': {'Key': 'audio', 'Value': os.path.abspath(file_url), 'HttpValue': f'{cfg.fay_url}/audio/' + os.path.basename(file_url),  'Text': text, 'Time': audio_length, 'Type': interact.interleaver, 'IsFirst': 1 if interact.data.get("isfirst", False) else 0,  'IsEnd': 1 if interact.data.get("isend", False) else 0, 'CONV_ID' : self.user_conv_map[interact.data.get("user", "User")]["conversation_id"], 'CONV_MSG_NO' : self.user_conv_map[interact.data.get("user", "User")]["conversation_msg_no"]  }, 'Username' : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Speaking.jpg'}
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								                #计算lips
 								                if platform.system() == "Windows":
 								                    try:
 								                        lip_sync_generator = LipSyncGenerator()
 								                        viseme_list = lip_sync_generator.generate_visemes(os.path.abspath(file_url))
 								                        consolidated_visemes = lip_sync_generator.consolidate_visemes(viseme_list)
 								                        content["Data"]["Lips"] = consolidated_visemes
 								                    except Exception as e:
 								                        print(e)
 								                        util.printInfo(1, interact.data.get("user"),  "唇型数据生成失败")
 								                wsa_server.get_instance().add_cmd(content)
 								                util.printInfo(1, interact.data.get("user"),  "数字人接口发送音频数据成功")
 								            #面板播放
-												年番更新

1、修复录音失败时输出问题；
2、修复linux端启动时，因subprocess报错问题；
3、修复获取状态接口报错问题；
4、新增数字人定位、目标设置；
5、新增启动日志提醒；
6、新增支持流式llm及tts；
7、修正agent多个bug；
8、支持deepseek https://qqk9ntwbcit.feishu.cn/wiki/Ghh9wFpMIiiFxTk8SlQcZLIrnMf

											
										
										
											2025-02-12 22:20:37 +08:00
+								            config_util.load_config()
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								            if config_util.config["interact"]["playSound"]:
-												年番更新

1、修复录音失败时输出问题；
2、修复linux端启动时，因subprocess报错问题；
3、修复获取状态接口报错问题；
4、新增数字人定位、目标设置；
5、新增启动日志提醒；
6、新增支持流式llm及tts；
7、修正agent多个bug；
8、支持deepseek https://qqk9ntwbcit.feishu.cn/wiki/Ghh9wFpMIiiFxTk8SlQcZLIrnMf

											
										
										
											2025-02-12 22:20:37 +08:00
+								                  self.sound_query.put((file_url, audio_length, interact))
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								            else:
 								                if wsa_server.get_web_instance().is_connected(interact.data.get('user')):
-												fay自然进化

1. 增加清除记忆功能；
2. 增加克隆性格功能；
3. 增加认知模型（专属的记忆逻辑、反思逻辑）；
4. 修复自动播报bug；
5. fay_url配置响修正；
6. 修复流式输出前置换行问题；
7. 修复没有用户聊天记录前端反复添加默认用户问题；
8. 更新dockerfile；
9. 重构util.py代码。
1. Fay ai编程指南：https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型：https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio

											
										
										
											2025-04-02 23:31:46 +08:00
+								                    wsa_server.get_web_instance().add_cmd({"panelMsg": "", 'Username' : interact.data.get('user'), 'robot': f'{cfg.fay_url}/robot/Normal.jpg'})
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								        except Exception as e:
 								            print(e)
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								    def play_end(self, interact):
-												年番更新

1、自动播放逻辑优化：交互完停30秒才继续；
2、降低socket心跳频率，可以一定程序节省安卓远程设备的用电量；
3、增加消息透传接口：https://qqk9ntwbcit.feishu.cn/wiki/PNKFwVgUKig6fDkMH03cMPiInIb
4、修复底部用户列表样式错误；
5、提高agent日程执行成功率；

											
										
										
											2025-01-01 00:14:19 +08:00
+								        self.speaking = False
 								        global can_auto_play
 								        global auto_play_lock
 								        with auto_play_lock:
 								            if self.timer:
 								                self.timer.cancel()
 								                self.timer = None
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								            if interact.interleaver != 'auto_play': #交互后暂停自动播报30秒
-												年番更新

1、自动播放逻辑优化：交互完停30秒才继续；
2、降低socket心跳频率，可以一定程序节省安卓远程设备的用电量；
3、增加消息透传接口：https://qqk9ntwbcit.feishu.cn/wiki/PNKFwVgUKig6fDkMH03cMPiInIb
4、修复底部用户列表样式错误；
5、提高agent日程执行成功率；

											
										
										
											2025-01-01 00:14:19 +08:00
+								                self.timer = threading.Timer(30, self.set_auto_play)
 								                self.timer.start()
 								            else:
 								                can_auto_play = True
-												fay进化

1、修复面板机器人表情“思考中”不释放问题；
2、修复因声卡导致pygame出错而无法继续运行问题；
3、兼容mp3及wav音频格式的tts；
4、修复流式空字符tts出错问题；
5、修复因tts出错不解锁麦克风问题；
6、防止流式音频之间被插话；
7、修复"gpt_stream" api出错不回消息；
8、修复aliyun tts的嗒嗒声。

											
										
										
											2025-03-12 22:41:01 +08:00
+								    #恢复自动播报(如果有)
-												年番更新

1、自动播放逻辑优化：交互完停30秒才继续；
2、降低socket心跳频率，可以一定程序节省安卓远程设备的用电量；
3、增加消息透传接口：https://qqk9ntwbcit.feishu.cn/wiki/PNKFwVgUKig6fDkMH03cMPiInIb
4、修复底部用户列表样式错误；
5、提高agent日程执行成功率；

											
										
										
											2025-01-01 00:14:19 +08:00
+								    def set_auto_play(self):
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								        global auto_play_lock
 								        global can_auto_play
 								        with auto_play_lock:
 								            can_auto_play = True
-												年番更新

1、自动播放逻辑优化：交互完停30秒才继续；
2、降低socket心跳频率，可以一定程序节省安卓远程设备的用电量；
3、增加消息透传接口：https://qqk9ntwbcit.feishu.cn/wiki/PNKFwVgUKig6fDkMH03cMPiInIb
4、修复底部用户列表样式错误；
5、提高agent日程执行成功率；

											
										
										
											2025-01-01 00:14:19 +08:00
+								            self.timer = None
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								    #启动核心服务
 								    def start(self):
 								        if cfg.ltp_mode == "cemotion":
 								            from cemotion import Cemotion
 								            self.cemotion = Cemotion()
-												年番更新

1、修复录音失败时输出问题；
2、修复linux端启动时，因subprocess报错问题；
3、修复获取状态接口报错问题；
4、新增数字人定位、目标设置；
5、新增启动日志提醒；
6、新增支持流式llm及tts；
7、修正agent多个bug；
8、支持deepseek https://qqk9ntwbcit.feishu.cn/wiki/Ghh9wFpMIiiFxTk8SlQcZLIrnMf

											
										
										
											2025-02-12 22:20:37 +08:00
+								        MyThread(target=self.__play_sound).start()
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
 								    #停止核心服务
 								    def stop(self):
 								        self.__running = False
 								        self.speaking = False
 								        self.sp.close()
 								        wsa_server.get_web_instance().add_cmd({"panelMsg": ""})
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								        content = {'Topic': 'human', 'Data': {'Key': 'log', 'Value': ""}}
-												年翻更新

- 全新ui
- 全面优化websocket逻辑，提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑，提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量，支持多声道麦克风拾音
- 优化自动播放服务器的对接机制，提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情，以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式，可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项，以方便服务器部署

											
										
										
											2024-10-26 11:34:55 +08:00
+								        wsa_server.get_instance().add_cmd(content)
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
 								    def __record_response(self, text, username, uid):
 								        """
 								        记录AI的回复内容
 								        :param text: 回复文本
 								        :param username: 用户名
 								        :param uid: 用户ID
 								        :return: content_id
 								        """
 								        self.write_to_file("./logs", "answer_result.txt", text)
 								        return content_db.new_instance().add_content('fay', 'speak', text, username, uid)
 								    def __send_panel_message(self, text, username, uid, content_id=None, type=None):
 								        """
 								        发送消息到Web面板
 								        :param text: 消息文本
 								        :param username: 用户名
 								        :param uid: 用户ID
 								        :param content_id: 内容ID
 								        :param type: 消息类型
 								        """
 								        if not wsa_server.get_web_instance().is_connected(username):
 								            return
 								        # 发送基本消息
 								        wsa_server.get_web_instance().add_cmd({
 								            "panelMsg": text,
 								            "Username": username
 								        })
 								        # 如果有content_id，发送回复消息
 								        if content_id is not None:
 								            wsa_server.get_web_instance().add_cmd({
 								                "panelReply": {
 								                    "type": "fay",
 								                    "content": text,
 								                    "username": username,
 								                    "uid": uid,
 								                    "id": content_id,
 								                    "is_adopted": type == 'qa'
 								                },
 								                "Username": username
 								            })
 								    def __send_digital_human_message(self, text, username):
 								        """
 								        发送消息到数字人（语音应该在say方法驱动数字人输出）
 								        :param text: 消息文本
 								        :param username: 用户名
 								        """
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
+								        full_text = self.__remove_emojis(text.replace("*", ""))
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								        if wsa_server.get_instance().is_connected(username):
 								            content = {
 								                'Topic': 'human',
 								                'Data': {
 								                    'Key': 'text',
-												fay进化

1. 内置RAG知识库（请把docx、pptx、txt文件存放到llm/data目录）；
2. 流式回复逻辑优化；
3. 语音交互逻辑优化；
4. 线程安全增强；
5. 数字人驱动接口增加流式输出开始结束标记；
6. 修复因记忆反思而导致的记忆混乱，无法多轮对话问题；
7. 修复mcp工具获取于调用的线程同步问题；
8. 修复funasr依赖版本问题。

											
										
										
											2025-06-27 23:33:24 +08:00
+								                    'Value': full_text
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								                },
 								                'Username': username
 								            }
 								            wsa_server.get_instance().add_cmd(content)
-												fay进化

1、支持mcp sse服务管理及动态功具调用
--对摩搭社区提供的sse对接的mcp工具做过兼容测试
2、llm模块统一
--严格匹配openai兼容接口范式，包括token计算及流式控制等
--把认知模式作为llm对接的方式，并对认知模型进行了优化升级，可控制各用户聊天认知是否隔离
--使用qwen3-4b作为默认llm，可以平衡速度、角色模拟与MCP工具调用
3、提供配置管理中心，便于多个fay做配置管理
--当根目录中system.conf或config.json不存在，启动时会自动载入config_uitl.py中指定的配置
--配置中心代码支持多项目管理，单项目也支持多fay对接，源码地址：https://github.com/xszyou/fay_config_server
4、多个bug修复
--修复重复反思和重复保存的问题
--修正认知模型的反思和检索算法
--处理pygame报错程序不继续执行问题
--表情不进行tts
--运行时再判断加载qt5
--修复文字交互接口流式输出时不会结束问题
--修复文字交互接口流式输出qa不输出问题

											
										
										
											2025-05-17 01:25:45 +08:00
+								    def __process_text_output(self, text, username, uid):
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								        """
 								        处理文本输出到各个终端
 								        :param text: 主要回复文本
 								        :param textlist: 额外回复列表
 								        :param username: 用户名
 								        :param uid: 用户ID
 								        :param type: 消息类型
 								        """
-												fay自然进化

1. 增加清除记忆功能；
2. 增加克隆性格功能；
3. 增加认知模型（专属的记忆逻辑、反思逻辑）；
4. 修复自动播报bug；
5. fay_url配置响修正；
6. 修复流式输出前置换行问题；
7. 修复没有用户聊天记录前端反复添加默认用户问题；
8. 更新dockerfile；
9. 重构util.py代码。
1. Fay ai编程指南：https://qqk9ntwbcit.feishu.cn/wiki/FKFywXWaeiBH28k4Q67c3eF7njC
2.Fay认知模型：https://qqk9ntwbcit.feishu.cn/wiki/BSW3wSsMdikiHUkiCJYcSp2lnio

											
										
										
											2025-04-02 23:31:46 +08:00
+								        if text:
 								            text = text.strip()
-												fay进化

1、stream_manager.py补充注释；
2、 gevent包版本更新；#146
3、修复booter与core双互引入问题；#148
4、fay gui支持流式显示，包括<think>标签的内容；
5、修复gpt_stream模式时qa回复不合成语音问题；
6、优化流式deepseek，fay gui及tts对think内容的处理。
7、重构了部分fay_core.py交互逻辑代码；
8、优化机器人表情显示逻辑;
9、把数字人驱动接口标识“Unreal”更改成“human”，消除误解。

											
										
										
											2025-02-27 17:47:59 +08:00
+								        # 记录主回复
 								        content_id = self.__record_response(text, username, uid)
 								        # 发送主回复到面板和数字人
 								        # self.__send_panel_message(text, username, uid, content_id, type)
 								        self.__send_digital_human_message(text, username)
 								        # 打印日志
 								        util.printInfo(1, username, '({}) {}'.format(self.__get_mood_voice(), text))
 								import importlib
 								fay_booter = importlib.import_module('fay_booter')