From 501866d12a8344b0a01faaed6b25b1b1ed72c0c9 Mon Sep 17 00:00:00 2001 From: saboteur7 Date: Tue, 3 Feb 2026 02:58:15 +0800 Subject: [PATCH] feat: optimize document and model usage --- README.md | 546 +++++++++++----------- agent/prompt/builder.py | 4 +- bridge/bridge.py | 3 - channel/web/web_channel.py | 47 +- channel/wechatcom/wechatcomapp_channel.py | 20 +- channel/wechatmp/wechatmp_channel.py | 53 ++- common/const.py | 191 +++++--- config.py | 2 +- docker/docker-compose.yml | 1 + models/bot_factory.py | 3 - requirements-optional.txt | 4 - requirements.txt | 4 + voice/ali/ali_voice.py | 6 +- voice/audio_convert.py | 18 +- voice/baidu/baidu_voice.py | 6 +- voice/xunfei/xunfei_voice.py | 10 +- 16 files changed, 514 insertions(+), 404 deletions(-) diff --git a/README.md b/README.md index a060142..a583764 100644 --- a/README.md +++ b/README.md @@ -14,7 +14,7 @@ - ✅ **复杂任务规划**:能够理解复杂任务并自主规划执行,持续思考和调用工具直到完成目标,支持通过工具操作访问文件、终端、浏览器、定时任务等系统资源 - ✅ **长期记忆:** 自动将对话记忆持久化至本地文件和数据库中,包括全局记忆和天级记忆,支持关键词及向量检索 -- ✅ **技能系统:** 内置Skills创造器、网络搜索、图像识别等多种技能,支持通过自然语言对话完成Skills开发 +- ✅ **技能系统:** 实现了Skills创建和运行的引擎,内置多种技能,并支持通过自然语言对话完成自定义Skills开发 - ✅ **多模态消息:** 支持对文本、图片、语音、文件等多类型消息进行解析、处理、生成、发送等操作 - ✅ **多模型接入:** 支持OpenAI, Claude, Gemini, DeepSeek, MiniMax、GLM、通义千问, Kimi等国内外主流模型厂商 - ✅ **多端部署:** 支持运行在本地计算机或服务器,可集成到网页、飞书、钉钉、微信公众号、企业微信应用中使用 @@ -22,9 +22,10 @@ ## 声明 -1. 本项目遵循 [MIT开源协议](/LICENSE),用于技术研究和学习,使用本项目时需遵守所在地法律法规、相关政策以及企业章程,禁止用于任何违法或侵犯他人权益的行为。任何个人、团队和企业,无论以何种方式使用该项目、对何对象提供服务,所产生的一切后果,本项目均不承担任何责任 +1. 本项目遵循 [MIT开源协议](/LICENSE),主要用于技术研究和学习,使用本项目时需遵守所在地法律法规、相关政策以及企业章程,禁止用于任何违法或侵犯他人权益的行为。任何个人、团队和企业,无论以何种方式使用该项目、对何对象提供服务,所产生的一切后果,本项目均不承担任何责任 2. 境内使用该项目时,推荐使用国内厂商的大模型服务,并进行必要的内容安全审核及过滤 3. 本项目当前主要接入协同办公平台,推荐使用飞书、钉钉、企微自建应用、网页、公众号等接入通道,其他通道持续扩展中,欢迎贡献代码或提交反馈 +4. 成本与安全:Agent模式下Token使用量高于普通对话模式,请根据效果及成本综合选择模型。Agent具有访问所在操作系统的能力,请谨慎选择项目部署环境。同时项目也会持续升级安全机制、并降低模型消耗成本 ## 演示 @@ -56,6 +57,8 @@ DEMO视频(对话模式):https://cdn.link-ai.tech/doc/cow_demo.mp4 # 🏷 更新日志 +>**2026.02.03:** 2.0.0版本,正式升级为超级Agent助理,支持多轮任务决策、具备长期记忆、实现多种系统工具、支持Skills框架,新增多种模型并优化了接入渠道。 + >**2025.05.23:** [1.7.6版本](https://github.com/zhayujie/chatgpt-on-wechat/releases/tag/1.7.6) 优化web网页channel、新增 [AgentMesh](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/plugins/agent/README.md)多智能体插件、百度语音合成优化、企微应用`access_token`获取优化、支持`claude-4-sonnet`和`claude-4-opus`模型 >**2025.04.11:** [1.7.5版本](https://github.com/zhayujie/chatgpt-on-wechat/releases/tag/1.7.5) 新增支持 [wechatferry](https://github.com/zhayujie/chatgpt-on-wechat/pull/2562) 协议、新增 deepseek 模型、新增支持腾讯云语音能力、新增支持 ModelScope 和 Gitee-AI API接口 @@ -70,7 +73,7 @@ DEMO视频(对话模式):https://cdn.link-ai.tech/doc/cow_demo.mp4 # 🚀 快速开始 -项目提供了一键安装、启动、管理程序的脚本,可以选择使用脚本快速运行,也可以根据详细指引一步步安装运行。 +项目提供了一键安装、配置、启动、管理程序的脚本,推荐使用脚本快速运行,也可以根据下文中的详细指引一步步安装运行。 在终端执行以下命令: @@ -78,22 +81,24 @@ DEMO视频(对话模式):https://cdn.link-ai.tech/doc/cow_demo.mp4 bash <(curl -sS https://cdn.link-ai.tech/code/cow/run.sh) ``` -- 脚本说明文档:[一键安装脚本](https://github.com/zhayujie/chatgpt-on-wechat/wiki/CowAgentQuickStart) +脚本使用说明:[一键运行脚本](https://github.com/zhayujie/chatgpt-on-wechat/wiki/CowAgentQuickStart) ## 一、准备 -### 1. 模型账号 +### 1. 模型API -项目默认使用ChatGPT模型,需前往 [OpenAI平台](https://platform.openai.com/api-keys) 创建API Key并填入项目配置文件中。同时支持其他国内外产商以及第三方自定义模型接口,详情参考:[模型说明](#模型说明)。 +项目支持国内外主流厂商的模型接口,可选模型及配置说明参考:[模型说明](#模型说明)。 -同时支持使用 **LinkAI平台** 接口,可聚合使用 OpenAI、Claude、DeepSeek、Kimi、Qwen 等多种常用模型,并支持知识库、工作流、联网搜索、MJ绘图、文档总结等能力。修改配置即可一键启用,参考 [接入文档](https://link-ai.tech/platform/link-app/wechat)。 +> 注:Agent模式下推荐使用以下模型,可根据效果及成本综合选择: Claude(claude-sonnet-4-5、claude-sonnet-4-0)、Gemini(gemini-3-flash-preview、gemini-3-pro-preview)、GLM(glm-4.7)、MiniMAx(MiniMax-M2.1)、Qwen(qwen3-max) + +同时支持使用 **LinkAI平台** 接口,可灵活切换 OpenAI、Claude、Gemini、DeepSeek、Qwen、Kimi 等多种常用模型,并支持知识库、工作流、插件等Agent能力,参考 [接口文档](https://docs.link-ai.tech/platform/api)。 ### 2.环境安装 -支持 Linux、MacOS、Windows 系统,同时需安装 `Python`,Python版本需要在3.7以上,推荐使用3.9版本。 +支持 Linux、MacOS、Windows 操作系统,可在个人计算机及服务器上运行,需安装 `Python`,Python版本需在3.7 ~ 3.12 之间,推荐使用3.9版本。 -> 注意:选择Docker部署则无需安装python环境和下载源码,可直接快进到下一节。 +> 注意:Agent模式推荐使用源码运行,若选择Docker部署则无需安装python环境和下载源码,可直接快进到下一节。 **(1) 克隆项目代码:** @@ -130,51 +135,35 @@ pip3 install -r requirements-optional.txt ```bash # config.json 文件内容示例 { - "channel_type": "web", # 接入渠道类型,默认为web,支持修改为:terminal, wechatmp, wechatmp_service, wechatcom_app, dingtalk, feishu - "model": "gpt-4.1-mini", # 模型名称, 支持 gpt-4o-mini, gpt-4.1, gpt-4o, deepseek-reasoner, wenxin, xunfei, glm-4, claude-3-7-sonnet-latest, moonshot等 - "open_ai_api_key": "YOUR API KEY", # 如果使用openAI模型则填入上面创建的 OpenAI API KEY - "open_ai_api_base": "https://api.openai.com/v1", # OpenAI接口代理地址,修改此项可接入第三方模型接口 - "proxy": "", # 代理客户端的ip和端口,国内环境开启代理的需要填写该项,如 "127.0.0.1:7890" - "single_chat_prefix": ["bot", "@bot"], # 私聊时文本需要包含该前缀才能触发机器人回复 - "single_chat_reply_prefix": "[bot] ", # 私聊时自动回复的前缀,用于区分真人 - "group_chat_prefix": ["@bot"], # 群聊时包含该前缀则会触发机器人回复 - "group_name_white_list": ["ChatGPT测试群", "ChatGPT测试群2"], # 开启自动回复的群名称列表 - "group_chat_in_one_session": ["ChatGPT测试群"], # 支持会话上下文共享的群名称 - "image_create_prefix": ["画", "看", "找"], # 开启图片回复的前缀 - "conversation_max_tokens": 1000, # 支持上下文记忆的最多字符数 + "channel_type": "web", # 接入渠道类型,默认为web,支持修改为:feishu,dingtalk,wechatcom_app,terminal,wechatmp,wechatmp_service + "model": "claude-sonnet-4-5", # 模型名称 + "claude_api_key": "", # Claude API Key + "claude_api_base": "https://api.anthropic.com/v1", # Claude API 地址,修改可接入三方代理平台 + "open_ai_api_key": "", # OpenAI API Key + "open_ai_api_base": "https://api.openai.com/v1", # OpenAI API 地址 + "gemini_api_key": "", # Gemini API Key + "gemini_api_base": "https://generativelanguage.googleapis.com", # Gemini API地址 + "zhipu_ai_api_key": "", # 智谱GLM API Key + "minimax_api_key": "", # MiniMax API Key + "dashscope_api_key": "", # 百炼(通义千问)API Key + "linkai_api_key": "", # LinkAI API Key + "proxy": "", # 代理客户端的ip和端口,国内环境需要开启代理的可填写该项,如 "127.0.0.1:7890" "speech_recognition": false, # 是否开启语音识别 "group_speech_recognition": false, # 是否开启群组语音识别 "voice_reply_voice": false, # 是否使用语音回复语音 - "character_desc": "你是基于大语言模型的AI智能助手,旨在回答并解决人们的任何问题,并且可以使用多种语言与人交流。", # 系统提示词 - # 订阅欢迎语,公众号和企业微信channel中使用,当被订阅时会自动回复以下内容 - "subscribe_msg": "感谢您的关注!\n这里是AI智能助手,可以自由对话。\n支持语音对话。\n支持图片输入。\n支持图片输出,画字开头的消息将按要求创作图片。\n支持tool、角色扮演和文字冒险等丰富的插件。\n输入{trigger_prefix}#help 查看详细指令。", - "use_linkai": false, # 是否使用LinkAI接口,默认关闭,设置为true后可对接LinkAI平台的智能体 - "linkai_api_key": "", # LinkAI Api Key - "linkai_app_code": "" # LinkAI 应用或工作流的code + "use_linkai": false, # 是否使用LinkAI接口,默认关闭,设置为true后可对接LinkAI平台接口 + "agent": true, # 是否启用Agent模式,启用后拥有多轮工具决策、长期记忆、Skills能力等 + "agent_workspace": "~/cow", # Agent的工作空间路径,用于存储memory、skills、系统设定等 + "agent_max_context_tokens": 40000, # Agent模式下最大上下文tokens,超出将自动丢弃最早的上下文 + "agent_max_context_turns": 30, # Agent模式下最大上下文记忆轮次,每轮包括一次用户提问和AI回复 + "agent_max_steps": 15 # Agent模式下单次任务的最大决策步数,超出后将停止继续调用工具 } ``` -**详细配置说明:** +**配置补充说明:**
-1. 单聊配置 - -+ 个人聊天中,需要以 "bot"或"@bot" 为开头的内容触发机器人,对应配置项 `single_chat_prefix` (如果不需要以前缀触发可以填写 `"single_chat_prefix": [""]`) -+ 机器人回复的内容会以 "[bot] " 作为前缀, 以区分真人,对应的配置项为 `single_chat_reply_prefix` (如果不需要前缀可以填写 `"single_chat_reply_prefix": ""`) -
- - -
-2. 群聊配置 - -+ 群组聊天中,群名称需配置在 `group_name_white_list ` 中才能开启群聊自动回复。如果想对所有群聊生效,可以直接填写 `"group_name_white_list": ["ALL_GROUP"]` -+ 默认只要被人 @ 就会触发机器人自动回复;另外群聊天中只要检测到以 "@bot" 开头的内容,同样会自动回复(方便自己触发),这对应配置项 `group_chat_prefix` -+ 可选配置: `group_name_keyword_white_list`配置项支持模糊匹配群名称,`group_chat_keyword`配置项则支持模糊匹配群消息内容,用法与上述两个配置项相同。(Contributed by [evolay](https://github.com/evolay)) -+ `group_chat_in_one_session`:使群聊共享一个会话上下文,配置 `["ALL_GROUP"]` 则作用于所有群聊 -
- -
-3. 语音配置 +1. 语音配置 + 添加 `"speech_recognition": true` 将开启语音识别,默认使用openai的whisper模型识别为文字,同时以文字回复,该参数仅支持私聊 (注意由于语音消息无法匹配前缀,一旦开启将对所有语音自动回复,支持语音触发画图); + 添加 `"group_speech_recognition": true` 将开启群组语音识别,默认使用openai的whisper模型识别为文字,同时以文字回复,参数仅支持群聊 (会匹配group_chat_prefix和group_chat_keyword, 支持语音触发画图); @@ -182,30 +171,22 @@ pip3 install -r requirements-optional.txt
-4. 其他配置 +2. 其他配置 -+ `model`: 模型名称,目前支持 `gpt-4o-mini`, `gpt-4.1`, `gpt-4o`, `gpt-3.5-turbo`, `wenxin` , `claude` , `gemini`, `glm-4`, `xunfei`, `moonshot`等,全部模型名称参考[common/const.py](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/common/const.py)文件 -+ `temperature`,`frequency_penalty`,`presence_penalty`: Chat API接口参数,详情参考[OpenAI官方文档。](https://platform.openai.com/docs/api-reference/chat) -+ `proxy`:由于目前 `openai` 接口国内无法访问,需配置代理客户端的地址,详情参考 [#351](https://github.com/zhayujie/chatgpt-on-wechat/issues/351) -+ 对于图像生成,在满足个人或群组触发条件外,还需要额外的关键词前缀来触发,对应配置 `image_create_prefix ` -+ 关于OpenAI对话及图片接口的参数配置(内容自由度、回复字数限制、图片大小等),可以参考 [对话接口](https://beta.openai.com/docs/api-reference/completions) 和 [图像接口](https://beta.openai.com/docs/api-reference/completions) 文档,在[`config.py`](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/config.py)中检查哪些参数在本项目中是可配置的。 -+ `conversation_max_tokens`:表示能够记忆的上下文最大字数(一问一答为一组对话,如果累积的对话字数超出限制,就会优先移除最早的一组对话) -+ `rate_limit_chatgpt`,`rate_limit_dalle`:每分钟最高问答速率、画图速率,超速后排队按序处理。 -+ `clear_memory_commands`: 对话内指令,主动清空前文记忆,字符串数组可自定义指令别名。 -+ `hot_reload`: 程序退出后,暂存等于状态,默认关闭。 -+ `character_desc` 配置中保存着你对机器人说的一段话,他会记住这段话并作为他的设定,你可以为他定制任何人格 (关于会话上下文的更多内容参考该 [issue](https://github.com/zhayujie/chatgpt-on-wechat/issues/43)) ++ `model`: 模型名称,Agent模式下推荐使用 `claude-sonnet-4-5`、`claude-sonnet-4-0`、`gemini-3-flash-preview`、`gemini-3-pro-preview`、`glm-4.7`、`MiniMax-M2.1`、`qwen3-max`,全部模型名称参考[common/const.py](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/common/const.py)文件 ++ `character_desc`:普通对话模式下的机器人系统提示词。在Agent模式下该配置不生效,由工作空间中的文件内容构成。 + `subscribe_msg`:订阅消息,公众号和企业微信channel中请填写,当被订阅时会自动回复, 可使用特殊占位符。目前支持的占位符有{trigger_prefix},在程序中它会自动替换成bot的触发词。
5. LinkAI配置 -+ `use_linkai`: 是否使用LinkAI接口,默认关闭,设置为true后可对接LinkAI平台的Agent,使用知识库、工作流、联网搜索、`Midjourney` 绘画等能力, 参考 [文档](https://link-ai.tech/platform/link-app/wechat) ++ `use_linkai`: 是否使用LinkAI接口,默认关闭,设置为true后可对接LinkAI平台,使用知识库、工作流、插件等能力, 参考[接口文档](https://docs.link-ai.tech/platform/api/chat) + `linkai_api_key`: LinkAI Api Key,可在 [控制台](https://link-ai.tech/console/interface) 创建 -+ `linkai_app_code`: LinkAI 应用或工作流的code,选填 ++ `linkai_app_code`: LinkAI 应用或工作流的code,选填,普通对话模式中使用。
-注:完整配置项说明可在 [`config.py`](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/config.py) 文件中查看。 +注:全部配置项说明可在 [`config.py`](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/config.py) 文件中查看。 ## 三、运行 @@ -217,9 +198,10 @@ pip3 install -r requirements-optional.txt python3 app.py # windows环境下该命令通常为 python app.py ``` -运行后默认会启动一个web服务,可以通过访问 `http://localhost:9899/chat` 在网页端对话。如果需要接入其他应用通道只需修改 `config.json` 配置文件中的 `channel_type` 参数,详情参考:[通道说明](#通道说明)。 +运行后默认会启动web服务,可通过访问 `http://localhost:9899/chat` 在网页端对话。 + +如果需要接入其他应用通道只需修改 `config.json` 配置文件中的 `channel_type` 参数,详情参考:[通道说明](#通道说明)。 -向机器人发送 `#help` 消息可以查看可用指令及插件的说明。 ### 2.服务器部署 @@ -236,7 +218,7 @@ nohup python3 app.py & tail -f nohup.out ### 3.Docker部署 -使用docker部署无需下载源码和安装依赖,只需要获取 `docker-compose.yml` 配置文件并启动容器即可。 +使用docker部署无需下载源码和安装依赖,只需要获取 `docker-compose.yml` 配置文件并启动容器即可。Agent模式下更推荐使用源码进行部署,以获得更多系统访问能力。 > 前提是需要安装好 `docker` 及 `docker-compose`,安装成功后执行 `docker -v` 和 `docker-compose version` (或 `docker compose version`) 可查看到版本号。安装地址为 [docker官网](https://docs.docker.com/engine/install/) 。 @@ -276,8 +258,7 @@ volumes: ## 模型说明 -以下对所有可支持的模型的配置和使用方法进行说明,模型接口实现在项目的 `bot/` 目录下。 ->部分模型厂商接入有官方sdk和OpenAI兼容两种方式,建议使用OpenAI兼容的方式。 +以下对所有可支持的模型的配置和使用方法进行说明,模型接口实现在项目的 `models/` 目录下。
OpenAI @@ -295,7 +276,7 @@ volumes: } ``` - - `model`: 与OpenAI接口的 [model参数](https://platform.openai.com/docs/models) 一致,支持包括 o系列、gpt-4系列、gpt-3.5系列等模型 + - `model`: 与OpenAI接口的 [model参数](https://platform.openai.com/docs/models) 一致,支持包括 o系列、gpt-5.2、gpt-5.1、gpt-4.1等系列模型 - `open_ai_api_base`: 如果需要接入第三方代理接口,可通过修改该参数进行接入 - `bot_type`: 使用OpenAI相关模型时无需填写。当使用第三方代理接口接入Claude等非OpenAI官方模型时,该参数设为 `chatGPT`
@@ -309,18 +290,47 @@ volumes: ```json { - "use_linkai": true, - "linkai_api_key": "YOUR API KEY", - "linkai_app_code": "YOUR APP CODE" + "use_linkai": true, + "linkai_api_key": "YOUR API KEY", + "linkai_app_code": "YOUR APP CODE" } ``` -+ `use_linkai`: 是否使用LinkAI接口,默认关闭,设置为true后可对接LinkAI平台的智能体,使用知识库、工作流、数据库、联网搜索、MCP工具等丰富的Agent能力, 参考 [文档](https://link-ai.tech/platform/link-app/wechat) ++ `use_linkai`: 是否使用LinkAI接口,默认关闭,设置为true后可对接LinkAI平台的智能体,使用知识库、工作流、数据库、MCP插件等丰富的Agent能力 + `linkai_api_key`: LinkAI平台的API Key,可在 [控制台](https://link-ai.tech/console/interface) 中创建 -+ `linkai_app_code`: LinkAI智能体 (应用或工作流) 的code,选填。智能体创建可参考 [说明文档](https://docs.link-ai.tech/platform/quick-start) ++ `linkai_app_code`: LinkAI智能体 (应用或工作流) 的code,选填,普通对话模式可用。智能体创建可参考 [说明文档](https://docs.link-ai.tech/platform/quick-start) + `model`: model字段填写空则直接使用智能体的模型,可在平台中灵活切换,[模型列表](https://link-ai.tech/console/models)中的全部模型均可使用 +
+Claude + +1. API Key创建:在 [Claude控制台](https://console.anthropic.com/settings/keys) 创建API Key + +2. 填写配置 + +```json +{ + "model": "claude-sonnet-4-5", + "claude_api_key": "YOUR_API_KEY" +} +``` + - `model`: 参考 [官方模型ID](https://docs.anthropic.com/en/docs/about-claude/models/overview#model-aliases) ,支持 `claude-sonnet-4-5、claude-sonnet-4-0、claude-opus-4-0、claude-3-5-sonnet-latest` 等 +
+ +
+Gemini + +API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn) 创建API Key ,配置如下 +```json +{ + "model": "gemini-3-flash-preview", + "gemini_api_key": "" +} +``` + - `model`: 参考[官方文档-模型列表](https://ai.google.dev/gemini-api/docs/models?hl=zh-cn),支持 `gemini-3-flash-preview、gemini-3-pro-preview、gemini-2.5-pro、gemini-2.0-flash` 等 +
+
DeepSeek @@ -330,23 +340,140 @@ volumes: ```json { - "bot_type": "chatGPT", - "model": "deepseek-chat", - "open_ai_api_key": "sk-xxxxxxxxxxx", - "open_ai_api_base": "https://api.deepseek.com/v1" + "model": "deepseek-chat", + "open_ai_api_key": "sk-xxxxxxxxxxx", + "open_ai_api_base": "https://api.deepseek.com/v1", + "bot_type": "chatGPT" + } ``` - `bot_type`: OpenAI兼容方式 - - `model`: 可填 `deepseek-chat、deepseek-reasoner`,分别对应的是 V3 和 R1 模型 + - `model`: 可填 `deepseek-chat、deepseek-reasoner`,分别对应的是 DeepSeek-V3 和 DeepSeek-R1 模型 - `open_ai_api_key`: DeepSeek平台的 API Key - `open_ai_api_base`: DeepSeek平台 BASE URL
+
+通义千问 (Qwen) + +方式一:官方SDK接入,配置如下(推荐): + +```json +{ + "model": "qwen3-max", + "dashscope_api_key": "sk-qVxxxxG" +} +``` + - `model`: 可填写 `qwen3-max、qwen-max、qwen-plus、qwen-turbo、qwen-long、qwq-plus` 等 + - `dashscope_api_key`: 通义千问的 API-KEY,参考 [官方文档](https://bailian.console.aliyun.com/?tab=api#/api) ,在 [控制台](https://bailian.console.aliyun.com/?tab=model#/api-key) 创建 + +方式二:OpenAI兼容方式接入,配置如下: +```json +{ + "bot_type": "chatGPT", + "model": "qwen3-max", + "open_ai_api_base": "https://dashscope.aliyuncs.com/compatible-mode/v1", + "open_ai_api_key": "sk-qVxxxxG" +} +``` +- `bot_type`: OpenAI兼容方式 +- `model`: 支持官方所有模型,参考[模型列表](https://help.aliyun.com/zh/model-studio/models?spm=a2c4g.11186623.0.0.78d84823Kth5on#9f8890ce29g5u) +- `open_ai_api_base`: 通义千问API的 BASE URL +- `open_ai_api_key`: 通义千问的 API-KEY +
+ +
+MiniMax + +方式一:官方接入,配置如下(推荐): + +```json +{ + "model": "MiniMax-M2.1", + "minimax_api_key": "" +} +``` + - `model`: 可填写 `MiniMax-M2.1、MiniMax-M2.1-lightning、MiniMax-M2、abab6.5-chat` 等 + - `minimax_api_key`:MiniMax平台的API-KEY,在 [控制台](https://platform.minimaxi.com/user-center/basic-information/interface-key) 创建 + +方式二:OpenAI兼容方式接入,配置如下: +```json +{ + "bot_type": "chatGPT", + "model": "MiniMax-M2.1", + "open_ai_api_base": "https://api.minimaxi.com/v1", + "open_ai_api_key": "" +} +``` +- `bot_type`: OpenAI兼容方式 +- `model`: 可填 `MiniMax-M2.1、MiniMax-M2.1-lightning、MiniMax-M2`,参考[API文档](https://platform.minimaxi.com/document/%E5%AF%B9%E8%AF%9D?key=66701d281d57f38758d581d0#QklxsNSbaf6kM4j6wjO5eEek) +- `open_ai_api_base`: MiniMax平台API的 BASE URL +- `open_ai_api_key`: MiniMax平台的API-KEY +
+ +
+智谱AI (GLM) + +方式一:官方接入,配置如下(推荐): + +```json +{ + "model": "glm-4.7", + "zhipu_ai_api_key": "" +} +``` + - `model`: 可填 `glm-4.7、glm-4-plus、glm-4-flash、glm-4-air、glm-4-airx、glm-4-long` 等, 参考 [glm-4系列模型编码](https://bigmodel.cn/dev/api/normal-model/glm-4) + - `zhipu_ai_api_key`: 智谱AI平台的 API KEY,在 [控制台](https://www.bigmodel.cn/usercenter/proj-mgmt/apikeys) 创建 + +方式二:OpenAI兼容方式接入,配置如下: +```json +{ + "bot_type": "chatGPT", + "model": "glm-4.7", + "open_ai_api_base": "https://open.bigmodel.cn/api/paas/v4", + "open_ai_api_key": "" +} +``` +- `bot_type`: OpenAI兼容方式 +- `model`: 可填 `glm-4.7、glm-4.6、glm-4-plus、glm-4-flash、glm-4-air、glm-4-airx、glm-4-long` 等 +- `open_ai_api_base`: 智谱AI平台的 BASE URL +- `open_ai_api_key`: 智谱AI平台的 API KEY +
+ +
+Kimi (Moonshot) + +方式一:官方接入,配置如下: + +```json +{ + "model": "moonshot-v1-128k", + "moonshot_api_key": "" +} +``` + - `model`: 可填写 `moonshot-v1-8k、moonshot-v1-32k、moonshot-v1-128k` + - `moonshot_api_key`: Moonshot的API-KEY,在 [控制台](https://platform.moonshot.cn/console/api-keys) 创建 + +方式二:OpenAI兼容方式接入,配置如下: +```json +{ + "bot_type": "chatGPT", + "model": "moonshot-v1-128k", + "open_ai_api_base": "https://api.moonshot.cn/v1", + "open_ai_api_key": "" +} +``` +- `bot_type`: OpenAI兼容方式 +- `model`: 可填写 `moonshot-v1-8k、moonshot-v1-32k、moonshot-v1-128k` +- `open_ai_api_base`: Moonshot的 BASE URL +- `open_ai_api_key`: Moonshot的 API-KEY +
+
Azure -1. API Key创建:在 [DeepSeek平台](https://platform.deepseek.com/api_keys) 创建API Key +1. API Key创建:在 [Azure平台](https://oai.azure.com/) 创建API Key 2. 填写配置 @@ -354,9 +481,9 @@ volumes: { "model": "", "use_azure_chatgpt": true, - "open_ai_api_key": "e7ffc5dd84f14521a53f14a40231ea78", - "open_ai_api_base": "https://linkai-240917.openai.azure.com/", - "azure_deployment_id": "gpt-4.1", + "open_ai_api_key": "", + "open_ai_api_base": "", + "azure_deployment_id": "", "azure_api_version": "2025-01-01-preview" } ``` @@ -369,100 +496,13 @@ volumes: - `azure_api_version`: api版本以及以上参数可以在部署的 [模型配置](https://oai.azure.com/resource/deployments) 界面查看
-
-Claude - -1. API Key创建:在 [Claude控制台](https://console.anthropic.com/settings/keys) 创建API Key - -2. 填写配置 - -```json -{ - "model": "claude-sonnet-4-0", - "claude_api_key": "YOUR_API_KEY" -} -``` - - `model`: 参考 [官方模型ID](https://docs.anthropic.com/en/docs/about-claude/models/overview#model-aliases) ,例如`claude-opus-4-0`、`claude-3-7-sonnet-latest`等 -
- -
-通义千问 - -方式一:官方SDK接入,配置如下: - -```json -{ - "model": "qwen-turbo", - "dashscope_api_key": "sk-qVxxxxG" -} -``` - - `model`: 可填写`qwen-turbo、qwen-plus、qwen-max` - - `dashscope_api_key`: 通义千问的 API-KEY,参考 [官方文档](https://bailian.console.aliyun.com/?tab=api#/api) ,在 [控制台](https://bailian.console.aliyun.com/?tab=model#/api-key) 创建 - -方式二:OpenAI兼容方式接入,配置如下: -```json -{ - "bot_type": "chatGPT", - "model": "qwen-turbo", - "open_ai_api_base": "https://dashscope.aliyuncs.com/compatible-mode/v1", - "open_ai_api_key": "sk-qVxxxxG" -} -``` -- `bot_type`: OpenAI兼容方式 -- `model`: 支持官方所有模型,参考[模型列表](https://help.aliyun.com/zh/model-studio/models?spm=a2c4g.11186623.0.0.78d84823Kth5on#9f8890ce29g5u) -- `open_ai_api_base`: 通义千问API的 BASE URL -- `open_ai_api_key`: 通义千问的 API-KEY,参考 [官方文档](https://bailian.console.aliyun.com/?tab=api#/api) ,在 [控制台](https://bailian.console.aliyun.com/?tab=model#/api-key) 创建 -
- -
-Gemini - -API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn) 创建API Key ,配置如下 -```json -{ - "model": "gemini-2.5-pro", - "gemini_api_key": "" -} -``` - - `model`: 参考[官方文档-模型列表](https://ai.google.dev/gemini-api/docs/models?hl=zh-cn) -
- -
-Moonshot - -方式一:官方接入,配置如下: - -```json -{ - "model": "moonshot-v1-8k", - "moonshot_api_key": "moonshot-v1-8k" -} -``` - - `model`: 可填写`moonshot-v1-8k、 moonshot-v1-32k、 moonshot-v1-128k` - - `moonshot_api_key`: Moonshot的API-KEY,在 [控制台](https://platform.moonshot.cn/console/api-keys) 创建 - -方式二:OpenAI兼容方式接入,配置如下: -```json -{ - "bot_type": "chatGPT", - "model": "moonshot-v1-8k", - "open_ai_api_base": "https://api.moonshot.cn/v1", - "open_ai_api_key": "" -} -``` -- `bot_type`: OpenAI兼容方式 -- `model`: 可填写`moonshot-v1-8k、 moonshot-v1-32k、 moonshot-v1-128k` -- `open_ai_api_base`: Moonshot的 BASE URL -- `open_ai_api_key`: Moonshot的 API-KEY,在 [控制台](https://platform.moonshot.cn/console/api-keys) 创建 -
-
百度文心 方式一:官方SDK接入,配置如下: ```json { - "model": "wenxin", + "model": "wenxin-4", "baidu_wenxin_api_key": "IajztZ0bDxgnP9bEykU7lBer", "baidu_wenxin_secret_key": "EDPZn6L24uAS9d8RWFfotK47dPvkjD6G" } @@ -475,7 +515,7 @@ API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn) ```json { "bot_type": "chatGPT", - "model": "qwen-turbo", + "model": "ERNIE-4.0-Turbo-8K", "open_ai_api_base": "https://qianfan.baidubce.com/v2", "open_ai_api_key": "bce-v3/ALTxxxxxxd2b" } @@ -504,7 +544,7 @@ API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn) } ``` - `model`: 填 `xunfei` - - `xunfei_domain`: 可填写 `4.0Ultra、 generalv3.5、 max-32k、 generalv3、 pro-128k、 lite` + - `xunfei_domain`: 可填写 `4.0Ultra、generalv3.5、max-32k、generalv3、pro-128k、lite` - `xunfei_spark_url`: 填写参考 [官方文档-请求地址](https://www.xfyun.cn/doc/spark/Web.html#_1-1-%E8%AF%B7%E6%B1%82%E5%9C%B0%E5%9D%80) 的说明 方式二:OpenAI兼容方式接入,配置如下: @@ -517,71 +557,11 @@ API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn) } ``` - `bot_type`: OpenAI兼容方式 -- `model`: 可填写 `4.0Ultra、 generalv3.5、 max-32k、 generalv3、 pro-128k、 lite` +- `model`: 可填写 `4.0Ultra、generalv3.5、max-32k、generalv3、pro-128k、lite` - `open_ai_api_base`: 讯飞星火平台的 BASE URL - `open_ai_api_key`: 讯飞星火平台的[APIPassword](https://console.xfyun.cn/services/bm3) ,因模型而已
-
-智谱AI - -方式一:官方接入,配置如下: - -```json -{ - "model": "glm-4-plus", - "zhipu_ai_api_key": "" -} -``` - - `model`: 可填 `glm-4-plus、glm-4-air-250414、glm-4-airx、glm-4-long 、glm-4-flashx 、glm-4-flash-250414`, 参考 [glm-4系列模型编码](https://bigmodel.cn/dev/api/normal-model/glm-4) - - `zhipu_ai_api_key`: 智谱AI平台的 API KEY,在 [控制台](https://www.bigmodel.cn/usercenter/proj-mgmt/apikeys) 创建 - -方式二:OpenAI兼容方式接入,配置如下: -```json -{ - "bot_type": "chatGPT", - "model": "glm-4-plus", - "open_ai_api_base": "https://open.bigmodel.cn/api/paas/v4", - "open_ai_api_key": "" -} -``` -- `bot_type`: OpenAI兼容方式 -- `model`: 可填 `glm-4-plus、glm-4-air-250414、glm-4-airx、glm-4-long 、glm-4-flashx 、glm-4-flash-250414`, 参考 [glm-4系列模型编码](https://bigmodel.cn/dev/api/normal-model/glm-4) -- `open_ai_api_base`: 智谱AI平台的 BASE URL -- `open_ai_api_key`: 智谱AI平台的 API KEY,在 [控制台](https://www.bigmodel.cn/usercenter/proj-mgmt/apikeys) 创建 -
- -
-MiniMax - -方式一:官方接入,配置如下: - -```json -{ - "model": "abab6.5-chat", - "Minimax_api_key": "", - "Minimax_group_id": "" -} -``` - - `model`: 可填写`abab6.5-chat` - - `Minimax_api_key`:MiniMax平台的API-KEY,在 [控制台](https://platform.minimaxi.com/user-center/basic-information/interface-key) 创建 - - `Minimax_group_id`: 在 [账户信息](https://platform.minimaxi.com/user-center/basic-information) 右上角获取 - -方式二:OpenAI兼容方式接入,配置如下: -```json -{ - "bot_type": "chatGPT", - "model": "MiniMax-M1", - "open_ai_api_base": "https://api.minimaxi.com/v1", - "open_ai_api_key": "" -} -``` -- `bot_type`: OpenAI兼容方式 -- `model`: 可填`MiniMax-M1、MiniMax-Text-01`,参考[API文档](https://platform.minimaxi.com/document/%E5%AF%B9%E8%AF%9D?key=66701d281d57f38758d581d0#QklxsNSbaf6kM4j6wjO5eEek) -- `open_ai_api_base`: MiniMax平台API的 BASE URL -- `open_ai_api_key`: MiniMax平台的API-KEY,在 [控制台](https://platform.minimaxi.com/user-center/basic-information/interface-key) 创建 -
-
ModelScope @@ -608,9 +588,9 @@ API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn) 以下对可接入通道的配置方式进行说明,应用通道代码在项目的 `channel/` 目录下。
-Web +1. Web -项目启动后默认运行web通道,配置如下: +项目启动后默认运行Web通道,配置如下: ```json { @@ -618,49 +598,65 @@ API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn) "web_port": 9899 } ``` + - `web_port`: 默认为 9899,可按需更改,需要服务器防火墙和安全组放行该端口 -- 如本地运行,启动后请访问 `http://localhost:port/chat` ;如服务器运行,请访问 `http://ip:port/chat` +- 如本地运行,启动后请访问 `http://localhost:9899/chat` ;如服务器运行,请访问 `http://ip:9899/chat` > 注:请将上述 url 中的 ip 或者 port 替换为实际的值
-Terminal +2. Feishu - 飞书 -修改 `config.json` 中的 `channel_type` 字段: +飞书支持两种事件接收模式:WebSocket 长连接(推荐)和 Webhook。 + +**方式一:WebSocket 模式(推荐,无需公网 IP)** ```json { - "channel_type": "terminal" + "channel_type": "feishu", + "feishu_app_id": "APP_ID", + "feishu_app_secret": "APP_SECRET", + "feishu_event_mode": "websocket" } ``` -运行后可在终端与机器人进行对话。 +**方式二:Webhook 模式(需要公网 IP)** + +```json +{ + "channel_type": "feishu", + "feishu_app_id": "APP_ID", + "feishu_app_secret": "APP_SECRET", + "feishu_token": "VERIFICATION_TOKEN", + "feishu_event_mode": "webhook", + "feishu_port": 9891 +} +``` + +- `feishu_event_mode`: 事件接收模式,`websocket`(推荐)或 `webhook` +- WebSocket 模式需安装依赖:`pip3 install lark-oapi` + +详细步骤和参数说明参考 [飞书接入](https://docs.link-ai.tech/cow/multi-platform/feishu)
-微信公众号 +3. DingTalk - 钉钉 -本项目支持订阅号和服务号两种公众号,通过服务号(`wechatmp_service`)体验更佳。将下列配置加入 `config.json`: +钉钉需要在开放平台创建智能机器人应用,将以下配置填入 `config.json`: ```json { - "channel_type": "wechatmp", - "wechatmp_token": "TOKEN", - "wechatmp_port": 80, - "wechatmp_app_id": "APPID", - "wechatmp_app_secret": "APPSECRET", - "wechatmp_aes_key": "" + "channel_type": "dingtalk", + "dingtalk_client_id": "CLIENT_ID", + "dingtalk_client_secret": "CLIENT_SECRET" } ``` -- `channel_type`: 个人订阅号为`wechatmp`,企业服务号为`wechatmp_service` - -详细步骤和参数说明参考 [微信公众号接入](https://docs.link-ai.tech/cow/multi-platform/wechat-mp) - +详细步骤和参数说明参考 [钉钉接入](https://docs.link-ai.tech/cow/multi-platform/dingtalk)
-企业微信应用 +4. WeCom App - 企业微信应用 企业微信自建应用接入需在后台创建应用并启用消息回调,配置示例: @@ -680,35 +676,53 @@ API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn)
-钉钉 +5. WeChat MP - 微信公众号 -钉钉需要在开放平台创建智能机器人应用,将以下配置填入 `config.json`: +本项目支持订阅号和服务号两种公众号,通过服务号(`wechatmp_service`)体验更佳。 + +**个人订阅号(wechatmp)** ```json { - "channel_type": "dingtalk", - "dingtalk_client_id": "CLIENT_ID", - "dingtalk_client_secret": "CLIENT_SECRET" + "channel_type": "wechatmp", + "wechatmp_token": "TOKEN", + "wechatmp_port": 80, + "wechatmp_app_id": "APPID", + "wechatmp_app_secret": "APPSECRET", + "wechatmp_aes_key": "" } ``` -详细步骤和参数说明参考 [钉钉接入](https://docs.link-ai.tech/cow/multi-platform/dingtalk) + +**企业服务号(wechatmp_service)** + +```json +{ + "channel_type": "wechatmp_service", + "wechatmp_token": "TOKEN", + "wechatmp_port": 80, + "wechatmp_app_id": "APPID", + "wechatmp_app_secret": "APPSECRET", + "wechatmp_aes_key": "" +} +``` + +详细步骤和参数说明参考 [微信公众号接入](https://docs.link-ai.tech/cow/multi-platform/wechat-mp) +
-飞书 +6. Terminal - 终端 -通过自建应用接入AI相关能力到飞书应用中,默认已是飞书的企业用户,且具有企业管理权限,将以下配置填入 `config.json`:: +修改 `config.json` 中的 `channel_type` 字段: ```json { - "channel_type": "feishu", - "feishu_app_id": "APP_ID", - "feishu_app_secret": "APP_SECRET", - "feishu_token": "VERIFICATION_TOKEN", - "feishu_port": 80 + "channel_type": "terminal" } ``` -详细步骤和参数说明参考 [飞书接入](https://docs.link-ai.tech/cow/multi-platform/feishu) + +运行后可在终端与机器人进行对话。 +

@@ -728,7 +742,7 @@ FAQs: # 🛠️ 开发 -欢迎接入更多应用通道,参考 [Terminal代码](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/channel/terminal/terminal_channel.py) 新增自定义通道,实现接收和发送消息逻辑即可完成接入。 同时欢迎贡献新的插件,参考 [插件开发文档](https://github.com/zhayujie/chatgpt-on-wechat/tree/master/plugins)。 +欢迎接入更多应用通道,参考 [飞书通道](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/channel/feishu/feishu_channel.py) 新增自定义通道,实现接收和发送消息逻辑即可完成接入。 同时欢迎贡献新的Skills,参考 [Skill创造器说明](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/skills/skill-creator/SKILL.md)。 # ✉ 联系 diff --git a/agent/prompt/builder.py b/agent/prompt/builder.py index 5eed133..1a01520 100644 --- a/agent/prompt/builder.py +++ b/agent/prompt/builder.py @@ -397,8 +397,8 @@ def _build_workspace_section(workspace_dir: str, language: str, is_first_convers "", "**交流规范**:", "", - "- 在对话中,非必要不输出工作空间技术细节(如 SOUL.md、USER.md等文件名称,工具名称,配置等),除非用户明确询问", - "- 例如用自然表达如「我已记住」而非「已更新 MEMORY.md」", + "- 在对话中,不要直接输出工作空间中的技术细节,特别是不要输出 SOUL.md、USER.md、MEMORY.md 等文件名称", + "- 例如用自然表达例如「我已记住」而不是「已更新 MEMORY.md」", "", ] diff --git a/bridge/bridge.py b/bridge/bridge.py index 43616d2..1c42856 100644 --- a/bridge/bridge.py +++ b/bridge/bridge.py @@ -46,9 +46,6 @@ class Bridge(object): if model_type and model_type.startswith("claude"): self.btype["chat"] = const.CLAUDEAPI - if model_type in ["claude"]: - self.btype["chat"] = const.CLAUDEAI - if model_type in [const.MOONSHOT, "moonshot-v1-8k", "moonshot-v1-32k", "moonshot-v1-128k"]: self.btype["chat"] = const.MOONSHOT diff --git a/channel/web/web_channel.py b/channel/web/web_channel.py index 49b32ae..88c04fd 100644 --- a/channel/web/web_channel.py +++ b/channel/web/web_channel.py @@ -3,6 +3,7 @@ import time import web import json import uuid +import io from queue import Queue, Empty from bridge.context import * from bridge.reply import Reply, ReplyType @@ -197,46 +198,50 @@ class WebChannel(ChatChannel): def startup(self): port = conf().get("web_port", 9899) - logger.info("""[WebChannel] 当前channel为web,可修改 config.json 配置文件中的 channel_type 字段进行切换。全部可用类型为: - 1. web: 网页 - 2. terminal: 终端 - 3. feishu: 飞书 - 4. dingtalk: 钉钉 - 5. wechatcom_app: 企微自建应用 - 6. wechatmp: 个人公众号 - 7. wechatmp_service: 企业公众号""") - logger.info(f"✅ Web对话网页已运行, 请使用浏览器访问 http://localhost:{port}/chat (本地运行) 或 http://ip:{port}/chat (服务器运行)") + + # 打印可用渠道类型提示 + logger.info("[WebChannel] 当前channel为web,可修改 config.json 配置文件中的 channel_type 字段进行切换。全部可用类型为:") + logger.info("[WebChannel] 1. web - 网页") + logger.info("[WebChannel] 2. terminal - 终端") + logger.info("[WebChannel] 3. feishu - 飞书") + logger.info("[WebChannel] 4. dingtalk - 钉钉") + logger.info("[WebChannel] 5. wechatcom_app - 企微自建应用") + logger.info("[WebChannel] 6. wechatmp - 个人公众号") + logger.info("[WebChannel] 7. wechatmp_service - 企业公众号") + logger.info(f"[WebChannel] 🌐 本地访问: http://localhost:{port}/chat") + logger.info(f"[WebChannel] 🌍 服务器访问: http://YOUR_IP:{port}/chat (请将YOUR_IP替换为服务器IP)") + logger.info("[WebChannel] ✅ Web对话网页已运行") # 确保静态文件目录存在 static_dir = os.path.join(os.path.dirname(__file__), 'static') if not os.path.exists(static_dir): os.makedirs(static_dir) - logger.info(f"Created static directory: {static_dir}") + logger.debug(f"[WebChannel] Created static directory: {static_dir}") urls = ( - '/', 'RootHandler', # 添加根路径处理器 + '/', 'RootHandler', '/message', 'MessageHandler', - '/poll', 'PollHandler', # 添加轮询处理器 + '/poll', 'PollHandler', '/chat', 'ChatHandler', - '/config', 'ConfigHandler', # 添加配置处理器 - '/assets/(.*)', 'AssetsHandler', # 匹配 /assets/任何路径 + '/config', 'ConfigHandler', + '/assets/(.*)', 'AssetsHandler', ) app = web.application(urls, globals(), autoreload=False) # 完全禁用web.py的HTTP日志输出 - # 创建一个空的日志处理函数 - def null_log_function(status, environ): - pass - - # 替换web.py的日志函数 web.httpserver.LogMiddleware.log = lambda self, status, environ: None # 配置web.py的日志级别为ERROR logging.getLogger("web").setLevel(logging.ERROR) logging.getLogger("web.httpserver").setLevel(logging.ERROR) - # 启动服务器 - web.httpserver.runsimple(app.wsgifunc(), ("0.0.0.0", port)) + # 抑制 web.py 默认的服务器启动消息 + old_stdout = sys.stdout + sys.stdout = io.StringIO() + try: + web.httpserver.runsimple(app.wsgifunc(), ("0.0.0.0", port)) + finally: + sys.stdout = old_stdout class RootHandler: diff --git a/channel/wechatcom/wechatcomapp_channel.py b/channel/wechatcom/wechatcomapp_channel.py index 41c824c..262702a 100644 --- a/channel/wechatcom/wechatcomapp_channel.py +++ b/channel/wechatcom/wechatcomapp_channel.py @@ -1,6 +1,7 @@ # -*- coding=utf-8 -*- import io import os +import sys import time import requests @@ -35,9 +36,8 @@ class WechatComAppChannel(ChatChannel): self.agent_id = conf().get("wechatcomapp_agent_id") self.token = conf().get("wechatcomapp_token") self.aes_key = conf().get("wechatcomapp_aes_key") - print(self.corp_id, self.secret, self.agent_id, self.token, self.aes_key) logger.info( - "[wechatcom] init: corp_id: {}, secret: {}, agent_id: {}, token: {}, aes_key: {}".format(self.corp_id, self.secret, self.agent_id, self.token, self.aes_key) + "[wechatcom] Initializing WeCom app channel, corp_id: {}, agent_id: {}".format(self.corp_id, self.agent_id) ) self.crypto = WeChatCrypto(self.token, self.aes_key, self.corp_id) self.client = WechatComAppClient(self.corp_id, self.secret) @@ -47,7 +47,17 @@ class WechatComAppChannel(ChatChannel): urls = ("/wxcomapp/?", "channel.wechatcom.wechatcomapp_channel.Query") app = web.application(urls, globals(), autoreload=False) port = conf().get("wechatcomapp_port", 9898) - web.httpserver.runsimple(app.wsgifunc(), ("0.0.0.0", port)) + logger.info("[wechatcom] ✅ WeCom app channel started successfully") + logger.info("[wechatcom] 📡 Listening on http://0.0.0.0:{}/wxcomapp/".format(port)) + logger.info("[wechatcom] 🤖 Ready to receive messages") + + # Suppress web.py's default server startup message + old_stdout = sys.stdout + sys.stdout = io.StringIO() + try: + web.httpserver.runsimple(app.wsgifunc(), ("0.0.0.0", port)) + finally: + sys.stdout = old_stdout def send(self, reply: Reply, context: Context): receiver = context["receiver"] @@ -74,6 +84,10 @@ class WechatComAppChannel(ChatChannel): response = self.client.media.upload("voice", open(path, "rb")) logger.debug("[wechatcom] upload voice response: {}".format(response)) media_ids.append(response["media_id"]) + except ImportError as e: + logger.error("[wechatcom] voice conversion failed: {}".format(e)) + logger.error("[wechatcom] please install pydub: pip install pydub") + return except WeChatClientException as e: logger.error("[wechatcom] upload voice failed: {}".format(e)) return diff --git a/channel/wechatmp/wechatmp_channel.py b/channel/wechatmp/wechatmp_channel.py index 5fc7b8c..e0a07dd 100644 --- a/channel/wechatmp/wechatmp_channel.py +++ b/channel/wechatmp/wechatmp_channel.py @@ -21,7 +21,11 @@ from common.log import logger from common.singleton import singleton from common.utils import split_string_by_utf8_length, remove_markdown_symbol from config import conf -from voice.audio_convert import any_to_mp3, split_audio + +try: + from voice.audio_convert import any_to_mp3, split_audio +except ImportError as e: + logger.debug("import voice.audio_convert failed, voice features will not be supported: {}".format(e)) # If using SSL, uncomment the following lines, and modify the certificate path. # from cheroot.server import HTTPServer @@ -85,26 +89,31 @@ class WechatMPChannel(ChatChannel): logger.info("[wechatmp] text cached, receiver {}\n{}".format(receiver, reply_text)) self.cache_dict[receiver].append(("text", reply_text)) elif reply.type == ReplyType.VOICE: - voice_file_path = reply.content - duration, files = split_audio(voice_file_path, 60 * 1000) - if len(files) > 1: - logger.info("[wechatmp] voice too long {}s > 60s , split into {} parts".format(duration / 1000.0, len(files))) + try: + voice_file_path = reply.content + duration, files = split_audio(voice_file_path, 60 * 1000) + if len(files) > 1: + logger.info("[wechatmp] voice too long {}s > 60s , split into {} parts".format(duration / 1000.0, len(files))) - for path in files: - # support: <2M, <60s, mp3/wma/wav/amr - try: - with open(path, "rb") as f: - response = self.client.material.add("voice", f) - logger.debug("[wechatmp] upload voice response: {}".format(response)) - f_size = os.fstat(f.fileno()).st_size - time.sleep(1.0 + 2 * f_size / 1024 / 1024) - # todo check media_id - except WeChatClientException as e: - logger.error("[wechatmp] upload voice failed: {}".format(e)) - return - media_id = response["media_id"] - logger.info("[wechatmp] voice uploaded, receiver {}, media_id {}".format(receiver, media_id)) - self.cache_dict[receiver].append(("voice", media_id)) + for path in files: + # support: <2M, <60s, mp3/wma/wav/amr + try: + with open(path, "rb") as f: + response = self.client.material.add("voice", f) + logger.debug("[wechatmp] upload voice response: {}".format(response)) + f_size = os.fstat(f.fileno()).st_size + time.sleep(1.0 + 2 * f_size / 1024 / 1024) + # todo check media_id + except WeChatClientException as e: + logger.error("[wechatmp] upload voice failed: {}".format(e)) + return + media_id = response["media_id"] + logger.info("[wechatmp] voice uploaded, receiver {}, media_id {}".format(receiver, media_id)) + self.cache_dict[receiver].append(("voice", media_id)) + except ImportError as e: + logger.error("[wechatmp] voice conversion failed: {}".format(e)) + logger.error("[wechatmp] please install pydub: pip install pydub") + return elif reply.type == ReplyType.IMAGE_URL: # 从网络下载图片 img_url = reply.content @@ -213,6 +222,10 @@ class WechatMPChannel(ChatChannel): logger.debug("[wechatcom] upload voice response: {}".format(response)) media_ids.append(response["media_id"]) os.remove(path) + except ImportError as e: + logger.error("[wechatmp] voice conversion failed: {}".format(e)) + logger.error("[wechatmp] please install pydub: pip install pydub") + return except WeChatClientException as e: logger.error("[wechatmp] upload voice failed: {}".format(e)) return diff --git a/common/const.py b/common/const.py index 16c450e..0e134db 100644 --- a/common/const.py +++ b/common/const.py @@ -1,77 +1,93 @@ -# bot_type +# 厂商类型 OPEN_AI = "openAI" CHATGPT = "chatGPT" -BAIDU = "baidu" # 百度文心一言模型 +BAIDU = "baidu" XUNFEI = "xunfei" CHATGPTONAZURE = "chatGPTOnAzure" LINKAI = "linkai" -CLAUDEAI = "claude" # 使用cookie的历史模型 -CLAUDEAPI= "claudeAPI" # 通过Claude api调用模型 -QWEN = "qwen" # 旧版通义模型 -QWEN_DASHSCOPE = "dashscope" # 通义新版sdk和api key - - -GEMINI = "gemini" # gemini-1.0-pro +CLAUDEAPI= "claudeAPI" +QWEN = "qwen" # 旧版千问接入 +QWEN_DASHSCOPE = "dashscope" # 新版千问接入(百炼) +GEMINI = "gemini" ZHIPU_AI = "glm-4" MOONSHOT = "moonshot" MiniMax = "minimax" MODELSCOPE = "modelscope" -# model +# 模型列表 +# Claude (Anthropic) CLAUDE3 = "claude-3-opus-20240229" -GPT35 = "gpt-3.5-turbo" -GPT35_0125 = "gpt-3.5-turbo-0125" -GPT35_1106 = "gpt-3.5-turbo-1106" - -GPT_4o = "gpt-4o" -GPT_4O_0806 = "gpt-4o-2024-08-06" -GPT4_TURBO = "gpt-4-turbo" -GPT4_TURBO_PREVIEW = "gpt-4-turbo-preview" -GPT4_TURBO_04_09 = "gpt-4-turbo-2024-04-09" -GPT4_TURBO_01_25 = "gpt-4-0125-preview" -GPT4_TURBO_11_06 = "gpt-4-1106-preview" -GPT4_VISION_PREVIEW = "gpt-4-vision-preview" - -GPT4 = "gpt-4" -GPT_4o_MINI = "gpt-4o-mini" -GPT4_32k = "gpt-4-32k" -GPT4_06_13 = "gpt-4-0613" -GPT4_32k_06_13 = "gpt-4-32k-0613" -GPT_41 = "gpt-4.1" -GPT_41_MINI = "gpt-4.1-mini" -GPT_41_NANO = "gpt-4.1-nano" - -GPT_5 = "gpt-5" -GPT_5_MINI = "gpt-5-mini" -GPT_5_NANO = "gpt-5-nano" - -O1 = "o1-preview" -O1_MINI = "o1-mini" - -WHISPER_1 = "whisper-1" -TTS_1 = "tts-1" -TTS_1_HD = "tts-1-hd" - -WEN_XIN = "wenxin" -WEN_XIN_4 = "wenxin-4" - -QWEN_TURBO = "qwen-turbo" -QWEN_PLUS = "qwen-plus" -QWEN_MAX = "qwen-max" - -LINKAI_35 = "linkai-3.5" -LINKAI_4_TURBO = "linkai-4-turbo" -LINKAI_4o = "linkai-4o" +CLAUDE_3_OPUS = "claude-3-opus-latest" +CLAUDE_3_OPUS_0229 = "claude-3-opus-20240229" +CLAUDE_3_SONNET = "claude-3-sonnet-20240229" +CLAUDE_3_HAIKU = "claude-3-haiku-20240307" +CLAUDE_35_SONNET = "claude-3-5-sonnet-latest" # 带 latest 标签的模型名称,会不断更新指向最新发布的模型 +CLAUDE_35_SONNET_1022 = "claude-3-5-sonnet-20241022" # 带具体日期的模型名称,会固定为该日期发布的模型 +CLAUDE_35_SONNET_0620 = "claude-3-5-sonnet-20240620" +CLAUDE_4_OPUS = "claude-opus-4-0" +CLAUDE_4_SONNET = "claude-sonnet-4-0" # Claude Sonnet 4.0 - Agent推荐模型 +CLAUDE_4_5_SONNET = "claude-sonnet-4-5" # Claude Sonnet 4.5 - Agent推荐模型 +# Gemini (Google) GEMINI_PRO = "gemini-1.0-pro" GEMINI_15_flash = "gemini-1.5-flash" GEMINI_15_PRO = "gemini-1.5-pro" GEMINI_20_flash_exp = "gemini-2.0-flash-exp" # exp结尾为实验模型,会逐步不再支持 GEMINI_20_FLASH = "gemini-2.0-flash" # 正式版模型 -GEMINI_25_FLASH_PRE = "gemini-2.5-flash-preview-05-20" # preview为预览版模型 ,主要是新能力体验 +GEMINI_25_FLASH_PRE = "gemini-2.5-flash-preview-05-20" # preview为预览版模型,主要是新能力体验 GEMINI_25_PRO_PRE = "gemini-2.5-pro-preview-05-06" +GEMINI_3_FLASH_PRE = "gemini-3-flash-preview" # Gemini 3 Flash Preview - Agent推荐模型 +GEMINI_3_PRO_PRE = "gemini-3-pro-preview" # Gemini 3 Pro Preview - Agent推荐模型 +# OpenAI +GPT35 = "gpt-3.5-turbo" +GPT35_0125 = "gpt-3.5-turbo-0125" +GPT35_1106 = "gpt-3.5-turbo-1106" +GPT4 = "gpt-4" +GPT4_06_13 = "gpt-4-0613" +GPT4_32k = "gpt-4-32k" +GPT4_32k_06_13 = "gpt-4-32k-0613" +GPT4_TURBO = "gpt-4-turbo" +GPT4_TURBO_PREVIEW = "gpt-4-turbo-preview" +GPT4_TURBO_01_25 = "gpt-4-0125-preview" +GPT4_TURBO_11_06 = "gpt-4-1106-preview" +GPT4_TURBO_04_09 = "gpt-4-turbo-2024-04-09" +GPT4_VISION_PREVIEW = "gpt-4-vision-preview" +GPT_4o = "gpt-4o" +GPT_4O_0806 = "gpt-4o-2024-08-06" +GPT_4o_MINI = "gpt-4o-mini" +GPT_41 = "gpt-4.1" +GPT_41_MINI = "gpt-4.1-mini" +GPT_41_NANO = "gpt-4.1-nano" +GPT_5 = "gpt-5" +GPT_5_MINI = "gpt-5-mini" +GPT_5_NANO = "gpt-5-nano" +O1 = "o1-preview" +O1_MINI = "o1-mini" +WHISPER_1 = "whisper-1" +TTS_1 = "tts-1" +TTS_1_HD = "tts-1-hd" +# DeepSeek +DEEPSEEK_CHAT = "deepseek-chat" # DeepSeek-V3对话模型 +DEEPSEEK_REASONER = "deepseek-reasoner" # DeepSeek-R1模型 + +# Qwen (通义千问 - 阿里云) +QWEN = "qwen" +QWEN_TURBO = "qwen-turbo" +QWEN_PLUS = "qwen-plus" +QWEN_MAX = "qwen-max" +QWEN_LONG = "qwen-long" +QWEN3_MAX = "qwen3-max" # Qwen3 Max - Agent推荐模型 +QWQ_PLUS = "qwq-plus" + +# MiniMax +MINIMAX_M2_1 = "MiniMax-M2.1" # MiniMax M2.1 - Agent推荐模型 +MINIMAX_M2_1_LIGHTNING = "MiniMax-M2.1-lightning" # MiniMax M2.1 极速版 +MINIMAX_M2 = "MiniMax-M2" # MiniMax M2 +MINIMAX_ABAB6_5 = "abab6.5-chat" # MiniMax abab6.5 + +# GLM (智谱AI) GLM_4 = "glm-4" GLM_4_PLUS = "glm-4-plus" GLM_4_flash = "glm-4-flash" @@ -80,20 +96,19 @@ GLM_4_ALLTOOLS = "glm-4-alltools" GLM_4_0520 = "glm-4-0520" GLM_4_AIR = "glm-4-air" GLM_4_AIRX = "glm-4-airx" +GLM_4_7 = "glm-4.7" # 智谱 GLM-4.7 - Agent推荐模型 +# Kimi (Moonshot) +MOONSHOT = "moonshot" -CLAUDE_3_OPUS = "claude-3-opus-latest" -CLAUDE_3_OPUS_0229 = "claude-3-opus-20240229" -CLAUDE_35_SONNET = "claude-3-5-sonnet-latest" # 带 latest 标签的模型名称,会不断更新指向最新发布的模型 -CLAUDE_35_SONNET_1022 = "claude-3-5-sonnet-20241022" # 带具体日期的模型名称,会固定为该日期发布的模型 -CLAUDE_35_SONNET_0620 = "claude-3-5-sonnet-20240620" -CLAUDE_3_SONNET = "claude-3-sonnet-20240229" -CLAUDE_3_HAIKU = "claude-3-haiku-20240307" -CLAUDE_4_SONNET = "claude-sonnet-4-0" -CLAUDE_4_OPUS = "claude-opus-4-0" - -DEEPSEEK_CHAT = "deepseek-chat" # DeepSeek-V3对话模型 -DEEPSEEK_REASONER = "deepseek-reasoner" # DeepSeek-R1模型 +# 其他模型 +WEN_XIN = "wenxin" +WEN_XIN_4 = "wenxin-4" +XUNFEI = "xunfei" +LINKAI_35 = "linkai-3.5" +LINKAI_4_TURBO = "linkai-4-turbo" +LINKAI_4o = "linkai-4o" +MODELSCOPE = "modelscope" GITEE_AI_MODEL_LIST = ["Yi-34B-Chat", "InternVL2-8B", "deepseek-coder-33B-instruct", "InternVL2.5-26B", "Qwen2-VL-72B", "Qwen2.5-32B-Instruct", "glm-4-9b-chat", "codegeex4-all-9b", "Qwen2.5-Coder-32B-Instruct", "Qwen2.5-72B-Instruct", "Qwen2.5-7B-Instruct", "Qwen2-72B-Instruct", "Qwen2-7B-Instruct", "code-raccoon-v1", "Qwen2.5-14B-Instruct"] @@ -104,19 +119,43 @@ MODELSCOPE_MODEL_LIST = ["LLM-Research/c4ai-command-r-plus-08-2024","mistralai/M "deepseek-ai/DeepSeek-R1-Distill-Qwen-14B","deepseek-ai/DeepSeek-R1-Distill-Qwen-7B","deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B","deepseek-ai/DeepSeek-R1","deepseek-ai/DeepSeek-V3","Qwen/QwQ-32B"] MODEL_LIST = [ + # Claude + CLAUDE3, CLAUDE_4_OPUS, CLAUDE_4_5_SONNET, CLAUDE_4_SONNET, CLAUDE_3_OPUS, CLAUDE_3_OPUS_0229, + CLAUDE_35_SONNET, CLAUDE_35_SONNET_1022, CLAUDE_35_SONNET_0620, CLAUDE_3_SONNET, CLAUDE_3_HAIKU, + "claude", "claude-3-haiku", "claude-3-sonnet", "claude-3-opus", "claude-3.5-sonnet", + + # Gemini + GEMINI_3_PRO_PRE, GEMINI_3_FLASH_PRE, GEMINI_25_PRO_PRE, GEMINI_25_FLASH_PRE, + GEMINI_20_FLASH, GEMINI_20_flash_exp, GEMINI_15_PRO, GEMINI_15_flash, GEMINI_PRO, GEMINI, + + # OpenAI GPT35, GPT35_0125, GPT35_1106, "gpt-3.5-turbo-16k", - GPT_41, GPT_41_MINI, GPT_41_NANO, O1, O1_MINI, GPT_4o, GPT_4O_0806, GPT_4o_MINI, GPT4_TURBO, GPT4_TURBO_PREVIEW, GPT4_TURBO_01_25, GPT4_TURBO_11_06, GPT4, GPT4_32k, GPT4_06_13, GPT4_32k_06_13, + GPT4, GPT4_06_13, GPT4_32k, GPT4_32k_06_13, + GPT4_TURBO, GPT4_TURBO_PREVIEW, GPT4_TURBO_01_25, GPT4_TURBO_11_06, GPT4_TURBO_04_09, + GPT_4o, GPT_4O_0806, GPT_4o_MINI, + GPT_41, GPT_41_MINI, GPT_41_NANO, GPT_5, GPT_5_MINI, GPT_5_NANO, - WEN_XIN, WEN_XIN_4, - XUNFEI, - ZHIPU_AI, GLM_4, GLM_4_PLUS, GLM_4_flash, GLM_4_LONG, GLM_4_ALLTOOLS, GLM_4_0520, GLM_4_AIR, GLM_4_AIRX, - MOONSHOT, MiniMax, - GEMINI_25_PRO_PRE, GEMINI_25_FLASH_PRE, GEMINI_20_FLASH, GEMINI, GEMINI_PRO, GEMINI_15_flash, GEMINI_15_PRO, GEMINI_20_flash_exp, - CLAUDE_4_OPUS, CLAUDE_4_SONNET, CLAUDE_3_OPUS, CLAUDE_3_OPUS_0229, CLAUDE_35_SONNET, CLAUDE_35_SONNET_1022, CLAUDE_35_SONNET_0620, CLAUDE_3_SONNET, CLAUDE_3_HAIKU, "claude", "claude-3-haiku", "claude-3-sonnet", "claude-3-opus", "claude-3.5-sonnet", - "moonshot-v1-8k", "moonshot-v1-32k", "moonshot-v1-128k", - QWEN, QWEN_TURBO, QWEN_PLUS, QWEN_MAX, - LINKAI_35, LINKAI_4_TURBO, LINKAI_4o, + O1, O1_MINI, + + # DeepSeek DEEPSEEK_CHAT, DEEPSEEK_REASONER, + + # Qwen + QWEN, QWEN_TURBO, QWEN_PLUS, QWEN_MAX, QWEN_LONG, QWEN3_MAX, + + # MiniMax + MiniMax, MINIMAX_M2_1, MINIMAX_M2_1_LIGHTNING, MINIMAX_M2, MINIMAX_ABAB6_5, + + # GLM + ZHIPU_AI, GLM_4, GLM_4_PLUS, GLM_4_flash, GLM_4_LONG, GLM_4_ALLTOOLS, + GLM_4_0520, GLM_4_AIR, GLM_4_AIRX, GLM_4_7, + + # Kimi + MOONSHOT, "moonshot-v1-8k", "moonshot-v1-32k", "moonshot-v1-128k", + + # 其他模型 + WEN_XIN, WEN_XIN_4, XUNFEI, + LINKAI_35, LINKAI_4_TURBO, LINKAI_4o, MODELSCOPE ] diff --git a/config.py b/config.py index ce8fb91..666a7ff 100644 --- a/config.py +++ b/config.py @@ -189,7 +189,7 @@ available_setting = { "web_port": 9899, "agent": True, # 是否开启Agent模式 "agent_workspace": "~/cow", # agent工作空间路径,用于存储skills、memory等 - "agent_max_context_tokens": 40000, # Agent模式下最大上下文tokens + "agent_max_context_tokens": 50000, # Agent模式下最大上下文tokens "agent_max_context_turns": 30, # Agent模式下最大上下文记忆轮次 "agent_max_steps": 15, # Agent模式下单次运行最大决策步数 } diff --git a/docker/docker-compose.yml b/docker/docker-compose.yml index d99ff41..8944d70 100644 --- a/docker/docker-compose.yml +++ b/docker/docker-compose.yml @@ -21,5 +21,6 @@ services: EXPIRES_IN_SECONDS: 3600 USE_GLOBAL_PLUGIN_CONFIG: 'True' USE_LINKAI: 'False' + AGENT: 'True' LINKAI_API_KEY: '' LINKAI_APP_CODE: '' diff --git a/models/bot_factory.py b/models/bot_factory.py index 2fb56dd..3027d47 100644 --- a/models/bot_factory.py +++ b/models/bot_factory.py @@ -40,9 +40,6 @@ def create_bot(bot_type): from models.linkai.link_ai_bot import LinkAIBot return LinkAIBot() - elif bot_type == const.CLAUDEAI: - from models.claude.claude_ai_bot import ClaudeAIBot - return ClaudeAIBot() elif bot_type == const.CLAUDEAPI: from models.claudeapi.claude_api_bot import ClaudeAPIBot return ClaudeAPIBot() diff --git a/requirements-optional.txt b/requirements-optional.txt index 78984b0..5208c7b 100644 --- a/requirements-optional.txt +++ b/requirements-optional.txt @@ -12,10 +12,6 @@ numpy<=1.24.2 langid # language detect elevenlabs==1.0.3 # elevenlabs TTS -# wechatcom & wechatmp -web.py -wechatpy - #install plugin dulwich diff --git a/requirements.txt b/requirements.txt index 7f93bbe..4f0d205 100644 --- a/requirements.txt +++ b/requirements.txt @@ -13,6 +13,10 @@ python-dotenv>=1.0.0 PyYAML>=6.0 croniter>=2.0.0 +# wechatcom & wechatmp +web.py +wechatpy + # zhipuai zai-sdk # tongyi qwen sdk diff --git a/voice/ali/ali_voice.py b/voice/ali/ali_voice.py index 43ea0b4..91f9143 100644 --- a/voice/ali/ali_voice.py +++ b/voice/ali/ali_voice.py @@ -15,11 +15,15 @@ import time from bridge.reply import Reply, ReplyType from common.log import logger -from voice.audio_convert import get_pcm_from_wav from voice.voice import Voice from voice.ali.ali_api import AliyunTokenGenerator, speech_to_text_aliyun, text_to_speech_aliyun from config import conf +try: + from voice.audio_convert import get_pcm_from_wav +except ImportError as e: + logger.debug("import voice.audio_convert failed: {}".format(e)) + class AliVoice(Voice): def __init__(self): diff --git a/voice/audio_convert.py b/voice/audio_convert.py index 4263678..9dd9641 100644 --- a/voice/audio_convert.py +++ b/voice/audio_convert.py @@ -8,7 +8,13 @@ try: except ImportError: logger.debug("import pysilk failed, wechaty voice message will not be supported.") -from pydub import AudioSegment +try: + from pydub import AudioSegment + _pydub_available = True +except ImportError: + logger.debug("import pydub failed, voice conversion features will not be supported.") + AudioSegment = None + _pydub_available = False sil_supports = [8000, 12000, 16000, 24000, 32000, 44100, 48000] # slk转wav时,支持的采样率 @@ -44,6 +50,8 @@ def any_to_mp3(any_path, mp3_path): """ 把任意格式转成mp3文件 """ + if not _pydub_available: + raise ImportError("pydub is required for audio conversion. Please install it with: pip install pydub") if any_path.endswith(".mp3"): shutil.copy2(any_path, mp3_path) return @@ -58,6 +66,8 @@ def any_to_wav(any_path, wav_path): """ 把任意格式转成wav文件 """ + if not _pydub_available: + raise ImportError("pydub is required for audio conversion. Please install it with: pip install pydub") if any_path.endswith(".wav"): shutil.copy2(any_path, wav_path) return @@ -73,6 +83,8 @@ def any_to_sil(any_path, sil_path): """ 把任意格式转成sil文件 """ + if not _pydub_available: + raise ImportError("pydub is required for audio conversion. Please install it with: pip install pydub") if any_path.endswith(".sil") or any_path.endswith(".silk") or any_path.endswith(".slk"): shutil.copy2(any_path, sil_path) return 10000 @@ -92,6 +104,8 @@ def any_to_amr(any_path, amr_path): """ 把任意格式转成amr文件 """ + if not _pydub_available: + raise ImportError("pydub is required for audio conversion. Please install it with: pip install pydub") if any_path.endswith(".amr"): shutil.copy2(any_path, amr_path) return @@ -116,6 +130,8 @@ def split_audio(file_path, max_segment_length_ms=60000): """ 分割音频文件 """ + if not _pydub_available: + raise ImportError("pydub is required for audio conversion. Please install it with: pip install pydub") audio = AudioSegment.from_file(file_path) audio_length_ms = len(audio) if audio_length_ms <= max_segment_length_ms: diff --git a/voice/baidu/baidu_voice.py b/voice/baidu/baidu_voice.py index 2c4bc4b..8ded4cf 100644 --- a/voice/baidu/baidu_voice.py +++ b/voice/baidu/baidu_voice.py @@ -13,9 +13,13 @@ from bridge.reply import Reply, ReplyType from common.log import logger from common.tmp_dir import TmpDir from config import conf -from voice.audio_convert import get_pcm_from_wav from voice.voice import Voice +try: + from voice.audio_convert import get_pcm_from_wav +except ImportError as e: + logger.debug("import voice.audio_convert failed: {}".format(e)) + class BaiduVoice(Voice): def __init__(self): try: diff --git a/voice/xunfei/xunfei_voice.py b/voice/xunfei/xunfei_voice.py index 7b503f7..6ce54e7 100644 --- a/voice/xunfei/xunfei_voice.py +++ b/voice/xunfei/xunfei_voice.py @@ -28,9 +28,15 @@ from config import conf from voice.voice import Voice from .xunfei_asr import xunfei_asr from .xunfei_tts import xunfei_tts -from voice.audio_convert import any_to_mp3 import shutil -from pydub import AudioSegment + +try: + from voice.audio_convert import any_to_mp3 + from pydub import AudioSegment + _audio_available = True +except ImportError as e: + logger.debug("import audio libraries failed: {}".format(e)) + _audio_available = False class XunfeiVoice(Voice):