diff --git a/README.md b/README.md
index a060142..a583764 100644
--- a/README.md
+++ b/README.md
@@ -14,7 +14,7 @@
- ✅ **复杂任务规划**:能够理解复杂任务并自主规划执行,持续思考和调用工具直到完成目标,支持通过工具操作访问文件、终端、浏览器、定时任务等系统资源
- ✅ **长期记忆:** 自动将对话记忆持久化至本地文件和数据库中,包括全局记忆和天级记忆,支持关键词及向量检索
-- ✅ **技能系统:** 内置Skills创造器、网络搜索、图像识别等多种技能,支持通过自然语言对话完成Skills开发
+- ✅ **技能系统:** 实现了Skills创建和运行的引擎,内置多种技能,并支持通过自然语言对话完成自定义Skills开发
- ✅ **多模态消息:** 支持对文本、图片、语音、文件等多类型消息进行解析、处理、生成、发送等操作
- ✅ **多模型接入:** 支持OpenAI, Claude, Gemini, DeepSeek, MiniMax、GLM、通义千问, Kimi等国内外主流模型厂商
- ✅ **多端部署:** 支持运行在本地计算机或服务器,可集成到网页、飞书、钉钉、微信公众号、企业微信应用中使用
@@ -22,9 +22,10 @@
## 声明
-1. 本项目遵循 [MIT开源协议](/LICENSE),用于技术研究和学习,使用本项目时需遵守所在地法律法规、相关政策以及企业章程,禁止用于任何违法或侵犯他人权益的行为。任何个人、团队和企业,无论以何种方式使用该项目、对何对象提供服务,所产生的一切后果,本项目均不承担任何责任
+1. 本项目遵循 [MIT开源协议](/LICENSE),主要用于技术研究和学习,使用本项目时需遵守所在地法律法规、相关政策以及企业章程,禁止用于任何违法或侵犯他人权益的行为。任何个人、团队和企业,无论以何种方式使用该项目、对何对象提供服务,所产生的一切后果,本项目均不承担任何责任
2. 境内使用该项目时,推荐使用国内厂商的大模型服务,并进行必要的内容安全审核及过滤
3. 本项目当前主要接入协同办公平台,推荐使用飞书、钉钉、企微自建应用、网页、公众号等接入通道,其他通道持续扩展中,欢迎贡献代码或提交反馈
+4. 成本与安全:Agent模式下Token使用量高于普通对话模式,请根据效果及成本综合选择模型。Agent具有访问所在操作系统的能力,请谨慎选择项目部署环境。同时项目也会持续升级安全机制、并降低模型消耗成本
## 演示
@@ -56,6 +57,8 @@ DEMO视频(对话模式):https://cdn.link-ai.tech/doc/cow_demo.mp4
# 🏷 更新日志
+>**2026.02.03:** 2.0.0版本,正式升级为超级Agent助理,支持多轮任务决策、具备长期记忆、实现多种系统工具、支持Skills框架,新增多种模型并优化了接入渠道。
+
>**2025.05.23:** [1.7.6版本](https://github.com/zhayujie/chatgpt-on-wechat/releases/tag/1.7.6) 优化web网页channel、新增 [AgentMesh](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/plugins/agent/README.md)多智能体插件、百度语音合成优化、企微应用`access_token`获取优化、支持`claude-4-sonnet`和`claude-4-opus`模型
>**2025.04.11:** [1.7.5版本](https://github.com/zhayujie/chatgpt-on-wechat/releases/tag/1.7.5) 新增支持 [wechatferry](https://github.com/zhayujie/chatgpt-on-wechat/pull/2562) 协议、新增 deepseek 模型、新增支持腾讯云语音能力、新增支持 ModelScope 和 Gitee-AI API接口
@@ -70,7 +73,7 @@ DEMO视频(对话模式):https://cdn.link-ai.tech/doc/cow_demo.mp4
# 🚀 快速开始
-项目提供了一键安装、启动、管理程序的脚本,可以选择使用脚本快速运行,也可以根据详细指引一步步安装运行。
+项目提供了一键安装、配置、启动、管理程序的脚本,推荐使用脚本快速运行,也可以根据下文中的详细指引一步步安装运行。
在终端执行以下命令:
@@ -78,22 +81,24 @@ DEMO视频(对话模式):https://cdn.link-ai.tech/doc/cow_demo.mp4
bash <(curl -sS https://cdn.link-ai.tech/code/cow/run.sh)
```
-- 脚本说明文档:[一键安装脚本](https://github.com/zhayujie/chatgpt-on-wechat/wiki/CowAgentQuickStart)
+脚本使用说明:[一键运行脚本](https://github.com/zhayujie/chatgpt-on-wechat/wiki/CowAgentQuickStart)
## 一、准备
-### 1. 模型账号
+### 1. 模型API
-项目默认使用ChatGPT模型,需前往 [OpenAI平台](https://platform.openai.com/api-keys) 创建API Key并填入项目配置文件中。同时支持其他国内外产商以及第三方自定义模型接口,详情参考:[模型说明](#模型说明)。
+项目支持国内外主流厂商的模型接口,可选模型及配置说明参考:[模型说明](#模型说明)。
-同时支持使用 **LinkAI平台** 接口,可聚合使用 OpenAI、Claude、DeepSeek、Kimi、Qwen 等多种常用模型,并支持知识库、工作流、联网搜索、MJ绘图、文档总结等能力。修改配置即可一键启用,参考 [接入文档](https://link-ai.tech/platform/link-app/wechat)。
+> 注:Agent模式下推荐使用以下模型,可根据效果及成本综合选择: Claude(claude-sonnet-4-5、claude-sonnet-4-0)、Gemini(gemini-3-flash-preview、gemini-3-pro-preview)、GLM(glm-4.7)、MiniMAx(MiniMax-M2.1)、Qwen(qwen3-max)
+
+同时支持使用 **LinkAI平台** 接口,可灵活切换 OpenAI、Claude、Gemini、DeepSeek、Qwen、Kimi 等多种常用模型,并支持知识库、工作流、插件等Agent能力,参考 [接口文档](https://docs.link-ai.tech/platform/api)。
### 2.环境安装
-支持 Linux、MacOS、Windows 系统,同时需安装 `Python`,Python版本需要在3.7以上,推荐使用3.9版本。
+支持 Linux、MacOS、Windows 操作系统,可在个人计算机及服务器上运行,需安装 `Python`,Python版本需在3.7 ~ 3.12 之间,推荐使用3.9版本。
-> 注意:选择Docker部署则无需安装python环境和下载源码,可直接快进到下一节。
+> 注意:Agent模式推荐使用源码运行,若选择Docker部署则无需安装python环境和下载源码,可直接快进到下一节。
**(1) 克隆项目代码:**
@@ -130,51 +135,35 @@ pip3 install -r requirements-optional.txt
```bash
# config.json 文件内容示例
{
- "channel_type": "web", # 接入渠道类型,默认为web,支持修改为:terminal, wechatmp, wechatmp_service, wechatcom_app, dingtalk, feishu
- "model": "gpt-4.1-mini", # 模型名称, 支持 gpt-4o-mini, gpt-4.1, gpt-4o, deepseek-reasoner, wenxin, xunfei, glm-4, claude-3-7-sonnet-latest, moonshot等
- "open_ai_api_key": "YOUR API KEY", # 如果使用openAI模型则填入上面创建的 OpenAI API KEY
- "open_ai_api_base": "https://api.openai.com/v1", # OpenAI接口代理地址,修改此项可接入第三方模型接口
- "proxy": "", # 代理客户端的ip和端口,国内环境开启代理的需要填写该项,如 "127.0.0.1:7890"
- "single_chat_prefix": ["bot", "@bot"], # 私聊时文本需要包含该前缀才能触发机器人回复
- "single_chat_reply_prefix": "[bot] ", # 私聊时自动回复的前缀,用于区分真人
- "group_chat_prefix": ["@bot"], # 群聊时包含该前缀则会触发机器人回复
- "group_name_white_list": ["ChatGPT测试群", "ChatGPT测试群2"], # 开启自动回复的群名称列表
- "group_chat_in_one_session": ["ChatGPT测试群"], # 支持会话上下文共享的群名称
- "image_create_prefix": ["画", "看", "找"], # 开启图片回复的前缀
- "conversation_max_tokens": 1000, # 支持上下文记忆的最多字符数
+ "channel_type": "web", # 接入渠道类型,默认为web,支持修改为:feishu,dingtalk,wechatcom_app,terminal,wechatmp,wechatmp_service
+ "model": "claude-sonnet-4-5", # 模型名称
+ "claude_api_key": "", # Claude API Key
+ "claude_api_base": "https://api.anthropic.com/v1", # Claude API 地址,修改可接入三方代理平台
+ "open_ai_api_key": "", # OpenAI API Key
+ "open_ai_api_base": "https://api.openai.com/v1", # OpenAI API 地址
+ "gemini_api_key": "", # Gemini API Key
+ "gemini_api_base": "https://generativelanguage.googleapis.com", # Gemini API地址
+ "zhipu_ai_api_key": "", # 智谱GLM API Key
+ "minimax_api_key": "", # MiniMax API Key
+ "dashscope_api_key": "", # 百炼(通义千问)API Key
+ "linkai_api_key": "", # LinkAI API Key
+ "proxy": "", # 代理客户端的ip和端口,国内环境需要开启代理的可填写该项,如 "127.0.0.1:7890"
"speech_recognition": false, # 是否开启语音识别
"group_speech_recognition": false, # 是否开启群组语音识别
"voice_reply_voice": false, # 是否使用语音回复语音
- "character_desc": "你是基于大语言模型的AI智能助手,旨在回答并解决人们的任何问题,并且可以使用多种语言与人交流。", # 系统提示词
- # 订阅欢迎语,公众号和企业微信channel中使用,当被订阅时会自动回复以下内容
- "subscribe_msg": "感谢您的关注!\n这里是AI智能助手,可以自由对话。\n支持语音对话。\n支持图片输入。\n支持图片输出,画字开头的消息将按要求创作图片。\n支持tool、角色扮演和文字冒险等丰富的插件。\n输入{trigger_prefix}#help 查看详细指令。",
- "use_linkai": false, # 是否使用LinkAI接口,默认关闭,设置为true后可对接LinkAI平台的智能体
- "linkai_api_key": "", # LinkAI Api Key
- "linkai_app_code": "" # LinkAI 应用或工作流的code
+ "use_linkai": false, # 是否使用LinkAI接口,默认关闭,设置为true后可对接LinkAI平台接口
+ "agent": true, # 是否启用Agent模式,启用后拥有多轮工具决策、长期记忆、Skills能力等
+ "agent_workspace": "~/cow", # Agent的工作空间路径,用于存储memory、skills、系统设定等
+ "agent_max_context_tokens": 40000, # Agent模式下最大上下文tokens,超出将自动丢弃最早的上下文
+ "agent_max_context_turns": 30, # Agent模式下最大上下文记忆轮次,每轮包括一次用户提问和AI回复
+ "agent_max_steps": 15 # Agent模式下单次任务的最大决策步数,超出后将停止继续调用工具
}
```
-**详细配置说明:**
+**配置补充说明:**
-1. 单聊配置
-
-+ 个人聊天中,需要以 "bot"或"@bot" 为开头的内容触发机器人,对应配置项 `single_chat_prefix` (如果不需要以前缀触发可以填写 `"single_chat_prefix": [""]`)
-+ 机器人回复的内容会以 "[bot] " 作为前缀, 以区分真人,对应的配置项为 `single_chat_reply_prefix` (如果不需要前缀可以填写 `"single_chat_reply_prefix": ""`)
-
-
-
-
-2. 群聊配置
-
-+ 群组聊天中,群名称需配置在 `group_name_white_list ` 中才能开启群聊自动回复。如果想对所有群聊生效,可以直接填写 `"group_name_white_list": ["ALL_GROUP"]`
-+ 默认只要被人 @ 就会触发机器人自动回复;另外群聊天中只要检测到以 "@bot" 开头的内容,同样会自动回复(方便自己触发),这对应配置项 `group_chat_prefix`
-+ 可选配置: `group_name_keyword_white_list`配置项支持模糊匹配群名称,`group_chat_keyword`配置项则支持模糊匹配群消息内容,用法与上述两个配置项相同。(Contributed by [evolay](https://github.com/evolay))
-+ `group_chat_in_one_session`:使群聊共享一个会话上下文,配置 `["ALL_GROUP"]` 则作用于所有群聊
-
-
-
-3. 语音配置
+1. 语音配置
+ 添加 `"speech_recognition": true` 将开启语音识别,默认使用openai的whisper模型识别为文字,同时以文字回复,该参数仅支持私聊 (注意由于语音消息无法匹配前缀,一旦开启将对所有语音自动回复,支持语音触发画图);
+ 添加 `"group_speech_recognition": true` 将开启群组语音识别,默认使用openai的whisper模型识别为文字,同时以文字回复,参数仅支持群聊 (会匹配group_chat_prefix和group_chat_keyword, 支持语音触发画图);
@@ -182,30 +171,22 @@ pip3 install -r requirements-optional.txt
-4. 其他配置
+2. 其他配置
-+ `model`: 模型名称,目前支持 `gpt-4o-mini`, `gpt-4.1`, `gpt-4o`, `gpt-3.5-turbo`, `wenxin` , `claude` , `gemini`, `glm-4`, `xunfei`, `moonshot`等,全部模型名称参考[common/const.py](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/common/const.py)文件
-+ `temperature`,`frequency_penalty`,`presence_penalty`: Chat API接口参数,详情参考[OpenAI官方文档。](https://platform.openai.com/docs/api-reference/chat)
-+ `proxy`:由于目前 `openai` 接口国内无法访问,需配置代理客户端的地址,详情参考 [#351](https://github.com/zhayujie/chatgpt-on-wechat/issues/351)
-+ 对于图像生成,在满足个人或群组触发条件外,还需要额外的关键词前缀来触发,对应配置 `image_create_prefix `
-+ 关于OpenAI对话及图片接口的参数配置(内容自由度、回复字数限制、图片大小等),可以参考 [对话接口](https://beta.openai.com/docs/api-reference/completions) 和 [图像接口](https://beta.openai.com/docs/api-reference/completions) 文档,在[`config.py`](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/config.py)中检查哪些参数在本项目中是可配置的。
-+ `conversation_max_tokens`:表示能够记忆的上下文最大字数(一问一答为一组对话,如果累积的对话字数超出限制,就会优先移除最早的一组对话)
-+ `rate_limit_chatgpt`,`rate_limit_dalle`:每分钟最高问答速率、画图速率,超速后排队按序处理。
-+ `clear_memory_commands`: 对话内指令,主动清空前文记忆,字符串数组可自定义指令别名。
-+ `hot_reload`: 程序退出后,暂存等于状态,默认关闭。
-+ `character_desc` 配置中保存着你对机器人说的一段话,他会记住这段话并作为他的设定,你可以为他定制任何人格 (关于会话上下文的更多内容参考该 [issue](https://github.com/zhayujie/chatgpt-on-wechat/issues/43))
++ `model`: 模型名称,Agent模式下推荐使用 `claude-sonnet-4-5`、`claude-sonnet-4-0`、`gemini-3-flash-preview`、`gemini-3-pro-preview`、`glm-4.7`、`MiniMax-M2.1`、`qwen3-max`,全部模型名称参考[common/const.py](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/common/const.py)文件
++ `character_desc`:普通对话模式下的机器人系统提示词。在Agent模式下该配置不生效,由工作空间中的文件内容构成。
+ `subscribe_msg`:订阅消息,公众号和企业微信channel中请填写,当被订阅时会自动回复, 可使用特殊占位符。目前支持的占位符有{trigger_prefix},在程序中它会自动替换成bot的触发词。
5. LinkAI配置
-+ `use_linkai`: 是否使用LinkAI接口,默认关闭,设置为true后可对接LinkAI平台的Agent,使用知识库、工作流、联网搜索、`Midjourney` 绘画等能力, 参考 [文档](https://link-ai.tech/platform/link-app/wechat)
++ `use_linkai`: 是否使用LinkAI接口,默认关闭,设置为true后可对接LinkAI平台,使用知识库、工作流、插件等能力, 参考[接口文档](https://docs.link-ai.tech/platform/api/chat)
+ `linkai_api_key`: LinkAI Api Key,可在 [控制台](https://link-ai.tech/console/interface) 创建
-+ `linkai_app_code`: LinkAI 应用或工作流的code,选填
++ `linkai_app_code`: LinkAI 应用或工作流的code,选填,普通对话模式中使用。
-注:完整配置项说明可在 [`config.py`](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/config.py) 文件中查看。
+注:全部配置项说明可在 [`config.py`](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/config.py) 文件中查看。
## 三、运行
@@ -217,9 +198,10 @@ pip3 install -r requirements-optional.txt
python3 app.py # windows环境下该命令通常为 python app.py
```
-运行后默认会启动一个web服务,可以通过访问 `http://localhost:9899/chat` 在网页端对话。如果需要接入其他应用通道只需修改 `config.json` 配置文件中的 `channel_type` 参数,详情参考:[通道说明](#通道说明)。
+运行后默认会启动web服务,可通过访问 `http://localhost:9899/chat` 在网页端对话。
+
+如果需要接入其他应用通道只需修改 `config.json` 配置文件中的 `channel_type` 参数,详情参考:[通道说明](#通道说明)。
-向机器人发送 `#help` 消息可以查看可用指令及插件的说明。
### 2.服务器部署
@@ -236,7 +218,7 @@ nohup python3 app.py & tail -f nohup.out
### 3.Docker部署
-使用docker部署无需下载源码和安装依赖,只需要获取 `docker-compose.yml` 配置文件并启动容器即可。
+使用docker部署无需下载源码和安装依赖,只需要获取 `docker-compose.yml` 配置文件并启动容器即可。Agent模式下更推荐使用源码进行部署,以获得更多系统访问能力。
> 前提是需要安装好 `docker` 及 `docker-compose`,安装成功后执行 `docker -v` 和 `docker-compose version` (或 `docker compose version`) 可查看到版本号。安装地址为 [docker官网](https://docs.docker.com/engine/install/) 。
@@ -276,8 +258,7 @@ volumes:
## 模型说明
-以下对所有可支持的模型的配置和使用方法进行说明,模型接口实现在项目的 `bot/` 目录下。
->部分模型厂商接入有官方sdk和OpenAI兼容两种方式,建议使用OpenAI兼容的方式。
+以下对所有可支持的模型的配置和使用方法进行说明,模型接口实现在项目的 `models/` 目录下。
OpenAI
@@ -295,7 +276,7 @@ volumes:
}
```
- - `model`: 与OpenAI接口的 [model参数](https://platform.openai.com/docs/models) 一致,支持包括 o系列、gpt-4系列、gpt-3.5系列等模型
+ - `model`: 与OpenAI接口的 [model参数](https://platform.openai.com/docs/models) 一致,支持包括 o系列、gpt-5.2、gpt-5.1、gpt-4.1等系列模型
- `open_ai_api_base`: 如果需要接入第三方代理接口,可通过修改该参数进行接入
- `bot_type`: 使用OpenAI相关模型时无需填写。当使用第三方代理接口接入Claude等非OpenAI官方模型时,该参数设为 `chatGPT`
@@ -309,18 +290,47 @@ volumes:
```json
{
- "use_linkai": true,
- "linkai_api_key": "YOUR API KEY",
- "linkai_app_code": "YOUR APP CODE"
+ "use_linkai": true,
+ "linkai_api_key": "YOUR API KEY",
+ "linkai_app_code": "YOUR APP CODE"
}
```
-+ `use_linkai`: 是否使用LinkAI接口,默认关闭,设置为true后可对接LinkAI平台的智能体,使用知识库、工作流、数据库、联网搜索、MCP工具等丰富的Agent能力, 参考 [文档](https://link-ai.tech/platform/link-app/wechat)
++ `use_linkai`: 是否使用LinkAI接口,默认关闭,设置为true后可对接LinkAI平台的智能体,使用知识库、工作流、数据库、MCP插件等丰富的Agent能力
+ `linkai_api_key`: LinkAI平台的API Key,可在 [控制台](https://link-ai.tech/console/interface) 中创建
-+ `linkai_app_code`: LinkAI智能体 (应用或工作流) 的code,选填。智能体创建可参考 [说明文档](https://docs.link-ai.tech/platform/quick-start)
++ `linkai_app_code`: LinkAI智能体 (应用或工作流) 的code,选填,普通对话模式可用。智能体创建可参考 [说明文档](https://docs.link-ai.tech/platform/quick-start)
+ `model`: model字段填写空则直接使用智能体的模型,可在平台中灵活切换,[模型列表](https://link-ai.tech/console/models)中的全部模型均可使用
+
+Claude
+
+1. API Key创建:在 [Claude控制台](https://console.anthropic.com/settings/keys) 创建API Key
+
+2. 填写配置
+
+```json
+{
+ "model": "claude-sonnet-4-5",
+ "claude_api_key": "YOUR_API_KEY"
+}
+```
+ - `model`: 参考 [官方模型ID](https://docs.anthropic.com/en/docs/about-claude/models/overview#model-aliases) ,支持 `claude-sonnet-4-5、claude-sonnet-4-0、claude-opus-4-0、claude-3-5-sonnet-latest` 等
+
+
+
+Gemini
+
+API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn) 创建API Key ,配置如下
+```json
+{
+ "model": "gemini-3-flash-preview",
+ "gemini_api_key": ""
+}
+```
+ - `model`: 参考[官方文档-模型列表](https://ai.google.dev/gemini-api/docs/models?hl=zh-cn),支持 `gemini-3-flash-preview、gemini-3-pro-preview、gemini-2.5-pro、gemini-2.0-flash` 等
+
+
DeepSeek
@@ -330,23 +340,140 @@ volumes:
```json
{
- "bot_type": "chatGPT",
- "model": "deepseek-chat",
- "open_ai_api_key": "sk-xxxxxxxxxxx",
- "open_ai_api_base": "https://api.deepseek.com/v1"
+ "model": "deepseek-chat",
+ "open_ai_api_key": "sk-xxxxxxxxxxx",
+ "open_ai_api_base": "https://api.deepseek.com/v1",
+ "bot_type": "chatGPT"
+
}
```
- `bot_type`: OpenAI兼容方式
- - `model`: 可填 `deepseek-chat、deepseek-reasoner`,分别对应的是 V3 和 R1 模型
+ - `model`: 可填 `deepseek-chat、deepseek-reasoner`,分别对应的是 DeepSeek-V3 和 DeepSeek-R1 模型
- `open_ai_api_key`: DeepSeek平台的 API Key
- `open_ai_api_base`: DeepSeek平台 BASE URL
+
+通义千问 (Qwen)
+
+方式一:官方SDK接入,配置如下(推荐):
+
+```json
+{
+ "model": "qwen3-max",
+ "dashscope_api_key": "sk-qVxxxxG"
+}
+```
+ - `model`: 可填写 `qwen3-max、qwen-max、qwen-plus、qwen-turbo、qwen-long、qwq-plus` 等
+ - `dashscope_api_key`: 通义千问的 API-KEY,参考 [官方文档](https://bailian.console.aliyun.com/?tab=api#/api) ,在 [控制台](https://bailian.console.aliyun.com/?tab=model#/api-key) 创建
+
+方式二:OpenAI兼容方式接入,配置如下:
+```json
+{
+ "bot_type": "chatGPT",
+ "model": "qwen3-max",
+ "open_ai_api_base": "https://dashscope.aliyuncs.com/compatible-mode/v1",
+ "open_ai_api_key": "sk-qVxxxxG"
+}
+```
+- `bot_type`: OpenAI兼容方式
+- `model`: 支持官方所有模型,参考[模型列表](https://help.aliyun.com/zh/model-studio/models?spm=a2c4g.11186623.0.0.78d84823Kth5on#9f8890ce29g5u)
+- `open_ai_api_base`: 通义千问API的 BASE URL
+- `open_ai_api_key`: 通义千问的 API-KEY
+
+
+
+MiniMax
+
+方式一:官方接入,配置如下(推荐):
+
+```json
+{
+ "model": "MiniMax-M2.1",
+ "minimax_api_key": ""
+}
+```
+ - `model`: 可填写 `MiniMax-M2.1、MiniMax-M2.1-lightning、MiniMax-M2、abab6.5-chat` 等
+ - `minimax_api_key`:MiniMax平台的API-KEY,在 [控制台](https://platform.minimaxi.com/user-center/basic-information/interface-key) 创建
+
+方式二:OpenAI兼容方式接入,配置如下:
+```json
+{
+ "bot_type": "chatGPT",
+ "model": "MiniMax-M2.1",
+ "open_ai_api_base": "https://api.minimaxi.com/v1",
+ "open_ai_api_key": ""
+}
+```
+- `bot_type`: OpenAI兼容方式
+- `model`: 可填 `MiniMax-M2.1、MiniMax-M2.1-lightning、MiniMax-M2`,参考[API文档](https://platform.minimaxi.com/document/%E5%AF%B9%E8%AF%9D?key=66701d281d57f38758d581d0#QklxsNSbaf6kM4j6wjO5eEek)
+- `open_ai_api_base`: MiniMax平台API的 BASE URL
+- `open_ai_api_key`: MiniMax平台的API-KEY
+
+
+
+智谱AI (GLM)
+
+方式一:官方接入,配置如下(推荐):
+
+```json
+{
+ "model": "glm-4.7",
+ "zhipu_ai_api_key": ""
+}
+```
+ - `model`: 可填 `glm-4.7、glm-4-plus、glm-4-flash、glm-4-air、glm-4-airx、glm-4-long` 等, 参考 [glm-4系列模型编码](https://bigmodel.cn/dev/api/normal-model/glm-4)
+ - `zhipu_ai_api_key`: 智谱AI平台的 API KEY,在 [控制台](https://www.bigmodel.cn/usercenter/proj-mgmt/apikeys) 创建
+
+方式二:OpenAI兼容方式接入,配置如下:
+```json
+{
+ "bot_type": "chatGPT",
+ "model": "glm-4.7",
+ "open_ai_api_base": "https://open.bigmodel.cn/api/paas/v4",
+ "open_ai_api_key": ""
+}
+```
+- `bot_type`: OpenAI兼容方式
+- `model`: 可填 `glm-4.7、glm-4.6、glm-4-plus、glm-4-flash、glm-4-air、glm-4-airx、glm-4-long` 等
+- `open_ai_api_base`: 智谱AI平台的 BASE URL
+- `open_ai_api_key`: 智谱AI平台的 API KEY
+
+
+
+Kimi (Moonshot)
+
+方式一:官方接入,配置如下:
+
+```json
+{
+ "model": "moonshot-v1-128k",
+ "moonshot_api_key": ""
+}
+```
+ - `model`: 可填写 `moonshot-v1-8k、moonshot-v1-32k、moonshot-v1-128k`
+ - `moonshot_api_key`: Moonshot的API-KEY,在 [控制台](https://platform.moonshot.cn/console/api-keys) 创建
+
+方式二:OpenAI兼容方式接入,配置如下:
+```json
+{
+ "bot_type": "chatGPT",
+ "model": "moonshot-v1-128k",
+ "open_ai_api_base": "https://api.moonshot.cn/v1",
+ "open_ai_api_key": ""
+}
+```
+- `bot_type`: OpenAI兼容方式
+- `model`: 可填写 `moonshot-v1-8k、moonshot-v1-32k、moonshot-v1-128k`
+- `open_ai_api_base`: Moonshot的 BASE URL
+- `open_ai_api_key`: Moonshot的 API-KEY
+
+
Azure
-1. API Key创建:在 [DeepSeek平台](https://platform.deepseek.com/api_keys) 创建API Key
+1. API Key创建:在 [Azure平台](https://oai.azure.com/) 创建API Key
2. 填写配置
@@ -354,9 +481,9 @@ volumes:
{
"model": "",
"use_azure_chatgpt": true,
- "open_ai_api_key": "e7ffc5dd84f14521a53f14a40231ea78",
- "open_ai_api_base": "https://linkai-240917.openai.azure.com/",
- "azure_deployment_id": "gpt-4.1",
+ "open_ai_api_key": "",
+ "open_ai_api_base": "",
+ "azure_deployment_id": "",
"azure_api_version": "2025-01-01-preview"
}
```
@@ -369,100 +496,13 @@ volumes:
- `azure_api_version`: api版本以及以上参数可以在部署的 [模型配置](https://oai.azure.com/resource/deployments) 界面查看
-
-Claude
-
-1. API Key创建:在 [Claude控制台](https://console.anthropic.com/settings/keys) 创建API Key
-
-2. 填写配置
-
-```json
-{
- "model": "claude-sonnet-4-0",
- "claude_api_key": "YOUR_API_KEY"
-}
-```
- - `model`: 参考 [官方模型ID](https://docs.anthropic.com/en/docs/about-claude/models/overview#model-aliases) ,例如`claude-opus-4-0`、`claude-3-7-sonnet-latest`等
-
-
-
-通义千问
-
-方式一:官方SDK接入,配置如下:
-
-```json
-{
- "model": "qwen-turbo",
- "dashscope_api_key": "sk-qVxxxxG"
-}
-```
- - `model`: 可填写`qwen-turbo、qwen-plus、qwen-max`
- - `dashscope_api_key`: 通义千问的 API-KEY,参考 [官方文档](https://bailian.console.aliyun.com/?tab=api#/api) ,在 [控制台](https://bailian.console.aliyun.com/?tab=model#/api-key) 创建
-
-方式二:OpenAI兼容方式接入,配置如下:
-```json
-{
- "bot_type": "chatGPT",
- "model": "qwen-turbo",
- "open_ai_api_base": "https://dashscope.aliyuncs.com/compatible-mode/v1",
- "open_ai_api_key": "sk-qVxxxxG"
-}
-```
-- `bot_type`: OpenAI兼容方式
-- `model`: 支持官方所有模型,参考[模型列表](https://help.aliyun.com/zh/model-studio/models?spm=a2c4g.11186623.0.0.78d84823Kth5on#9f8890ce29g5u)
-- `open_ai_api_base`: 通义千问API的 BASE URL
-- `open_ai_api_key`: 通义千问的 API-KEY,参考 [官方文档](https://bailian.console.aliyun.com/?tab=api#/api) ,在 [控制台](https://bailian.console.aliyun.com/?tab=model#/api-key) 创建
-
-
-
-Gemini
-
-API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn) 创建API Key ,配置如下
-```json
-{
- "model": "gemini-2.5-pro",
- "gemini_api_key": ""
-}
-```
- - `model`: 参考[官方文档-模型列表](https://ai.google.dev/gemini-api/docs/models?hl=zh-cn)
-
-
-
-Moonshot
-
-方式一:官方接入,配置如下:
-
-```json
-{
- "model": "moonshot-v1-8k",
- "moonshot_api_key": "moonshot-v1-8k"
-}
-```
- - `model`: 可填写`moonshot-v1-8k、 moonshot-v1-32k、 moonshot-v1-128k`
- - `moonshot_api_key`: Moonshot的API-KEY,在 [控制台](https://platform.moonshot.cn/console/api-keys) 创建
-
-方式二:OpenAI兼容方式接入,配置如下:
-```json
-{
- "bot_type": "chatGPT",
- "model": "moonshot-v1-8k",
- "open_ai_api_base": "https://api.moonshot.cn/v1",
- "open_ai_api_key": ""
-}
-```
-- `bot_type`: OpenAI兼容方式
-- `model`: 可填写`moonshot-v1-8k、 moonshot-v1-32k、 moonshot-v1-128k`
-- `open_ai_api_base`: Moonshot的 BASE URL
-- `open_ai_api_key`: Moonshot的 API-KEY,在 [控制台](https://platform.moonshot.cn/console/api-keys) 创建
-
-
百度文心
方式一:官方SDK接入,配置如下:
```json
{
- "model": "wenxin",
+ "model": "wenxin-4",
"baidu_wenxin_api_key": "IajztZ0bDxgnP9bEykU7lBer",
"baidu_wenxin_secret_key": "EDPZn6L24uAS9d8RWFfotK47dPvkjD6G"
}
@@ -475,7 +515,7 @@ API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn)
```json
{
"bot_type": "chatGPT",
- "model": "qwen-turbo",
+ "model": "ERNIE-4.0-Turbo-8K",
"open_ai_api_base": "https://qianfan.baidubce.com/v2",
"open_ai_api_key": "bce-v3/ALTxxxxxxd2b"
}
@@ -504,7 +544,7 @@ API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn)
}
```
- `model`: 填 `xunfei`
- - `xunfei_domain`: 可填写 `4.0Ultra、 generalv3.5、 max-32k、 generalv3、 pro-128k、 lite`
+ - `xunfei_domain`: 可填写 `4.0Ultra、generalv3.5、max-32k、generalv3、pro-128k、lite`
- `xunfei_spark_url`: 填写参考 [官方文档-请求地址](https://www.xfyun.cn/doc/spark/Web.html#_1-1-%E8%AF%B7%E6%B1%82%E5%9C%B0%E5%9D%80) 的说明
方式二:OpenAI兼容方式接入,配置如下:
@@ -517,71 +557,11 @@ API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn)
}
```
- `bot_type`: OpenAI兼容方式
-- `model`: 可填写 `4.0Ultra、 generalv3.5、 max-32k、 generalv3、 pro-128k、 lite`
+- `model`: 可填写 `4.0Ultra、generalv3.5、max-32k、generalv3、pro-128k、lite`
- `open_ai_api_base`: 讯飞星火平台的 BASE URL
- `open_ai_api_key`: 讯飞星火平台的[APIPassword](https://console.xfyun.cn/services/bm3) ,因模型而已
-
-智谱AI
-
-方式一:官方接入,配置如下:
-
-```json
-{
- "model": "glm-4-plus",
- "zhipu_ai_api_key": ""
-}
-```
- - `model`: 可填 `glm-4-plus、glm-4-air-250414、glm-4-airx、glm-4-long 、glm-4-flashx 、glm-4-flash-250414`, 参考 [glm-4系列模型编码](https://bigmodel.cn/dev/api/normal-model/glm-4)
- - `zhipu_ai_api_key`: 智谱AI平台的 API KEY,在 [控制台](https://www.bigmodel.cn/usercenter/proj-mgmt/apikeys) 创建
-
-方式二:OpenAI兼容方式接入,配置如下:
-```json
-{
- "bot_type": "chatGPT",
- "model": "glm-4-plus",
- "open_ai_api_base": "https://open.bigmodel.cn/api/paas/v4",
- "open_ai_api_key": ""
-}
-```
-- `bot_type`: OpenAI兼容方式
-- `model`: 可填 `glm-4-plus、glm-4-air-250414、glm-4-airx、glm-4-long 、glm-4-flashx 、glm-4-flash-250414`, 参考 [glm-4系列模型编码](https://bigmodel.cn/dev/api/normal-model/glm-4)
-- `open_ai_api_base`: 智谱AI平台的 BASE URL
-- `open_ai_api_key`: 智谱AI平台的 API KEY,在 [控制台](https://www.bigmodel.cn/usercenter/proj-mgmt/apikeys) 创建
-
-
-
-MiniMax
-
-方式一:官方接入,配置如下:
-
-```json
-{
- "model": "abab6.5-chat",
- "Minimax_api_key": "",
- "Minimax_group_id": ""
-}
-```
- - `model`: 可填写`abab6.5-chat`
- - `Minimax_api_key`:MiniMax平台的API-KEY,在 [控制台](https://platform.minimaxi.com/user-center/basic-information/interface-key) 创建
- - `Minimax_group_id`: 在 [账户信息](https://platform.minimaxi.com/user-center/basic-information) 右上角获取
-
-方式二:OpenAI兼容方式接入,配置如下:
-```json
-{
- "bot_type": "chatGPT",
- "model": "MiniMax-M1",
- "open_ai_api_base": "https://api.minimaxi.com/v1",
- "open_ai_api_key": ""
-}
-```
-- `bot_type`: OpenAI兼容方式
-- `model`: 可填`MiniMax-M1、MiniMax-Text-01`,参考[API文档](https://platform.minimaxi.com/document/%E5%AF%B9%E8%AF%9D?key=66701d281d57f38758d581d0#QklxsNSbaf6kM4j6wjO5eEek)
-- `open_ai_api_base`: MiniMax平台API的 BASE URL
-- `open_ai_api_key`: MiniMax平台的API-KEY,在 [控制台](https://platform.minimaxi.com/user-center/basic-information/interface-key) 创建
-
-
ModelScope
@@ -608,9 +588,9 @@ API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn)
以下对可接入通道的配置方式进行说明,应用通道代码在项目的 `channel/` 目录下。
-Web
+1. Web
-项目启动后默认运行web通道,配置如下:
+项目启动后默认运行Web通道,配置如下:
```json
{
@@ -618,49 +598,65 @@ API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn)
"web_port": 9899
}
```
+
- `web_port`: 默认为 9899,可按需更改,需要服务器防火墙和安全组放行该端口
-- 如本地运行,启动后请访问 `http://localhost:port/chat` ;如服务器运行,请访问 `http://ip:port/chat`
+- 如本地运行,启动后请访问 `http://localhost:9899/chat` ;如服务器运行,请访问 `http://ip:9899/chat`
> 注:请将上述 url 中的 ip 或者 port 替换为实际的值
-Terminal
+2. Feishu - 飞书
-修改 `config.json` 中的 `channel_type` 字段:
+飞书支持两种事件接收模式:WebSocket 长连接(推荐)和 Webhook。
+
+**方式一:WebSocket 模式(推荐,无需公网 IP)**
```json
{
- "channel_type": "terminal"
+ "channel_type": "feishu",
+ "feishu_app_id": "APP_ID",
+ "feishu_app_secret": "APP_SECRET",
+ "feishu_event_mode": "websocket"
}
```
-运行后可在终端与机器人进行对话。
+**方式二:Webhook 模式(需要公网 IP)**
+
+```json
+{
+ "channel_type": "feishu",
+ "feishu_app_id": "APP_ID",
+ "feishu_app_secret": "APP_SECRET",
+ "feishu_token": "VERIFICATION_TOKEN",
+ "feishu_event_mode": "webhook",
+ "feishu_port": 9891
+}
+```
+
+- `feishu_event_mode`: 事件接收模式,`websocket`(推荐)或 `webhook`
+- WebSocket 模式需安装依赖:`pip3 install lark-oapi`
+
+详细步骤和参数说明参考 [飞书接入](https://docs.link-ai.tech/cow/multi-platform/feishu)
-微信公众号
+3. DingTalk - 钉钉
-本项目支持订阅号和服务号两种公众号,通过服务号(`wechatmp_service`)体验更佳。将下列配置加入 `config.json`:
+钉钉需要在开放平台创建智能机器人应用,将以下配置填入 `config.json`:
```json
{
- "channel_type": "wechatmp",
- "wechatmp_token": "TOKEN",
- "wechatmp_port": 80,
- "wechatmp_app_id": "APPID",
- "wechatmp_app_secret": "APPSECRET",
- "wechatmp_aes_key": ""
+ "channel_type": "dingtalk",
+ "dingtalk_client_id": "CLIENT_ID",
+ "dingtalk_client_secret": "CLIENT_SECRET"
}
```
-- `channel_type`: 个人订阅号为`wechatmp`,企业服务号为`wechatmp_service`
-
-详细步骤和参数说明参考 [微信公众号接入](https://docs.link-ai.tech/cow/multi-platform/wechat-mp)
-
+详细步骤和参数说明参考 [钉钉接入](https://docs.link-ai.tech/cow/multi-platform/dingtalk)
-企业微信应用
+4. WeCom App - 企业微信应用
企业微信自建应用接入需在后台创建应用并启用消息回调,配置示例:
@@ -680,35 +676,53 @@ API Key创建:在 [控制台](https://aistudio.google.com/app/apikey?hl=zh-cn)
-钉钉
+5. WeChat MP - 微信公众号
-钉钉需要在开放平台创建智能机器人应用,将以下配置填入 `config.json`:
+本项目支持订阅号和服务号两种公众号,通过服务号(`wechatmp_service`)体验更佳。
+
+**个人订阅号(wechatmp)**
```json
{
- "channel_type": "dingtalk",
- "dingtalk_client_id": "CLIENT_ID",
- "dingtalk_client_secret": "CLIENT_SECRET"
+ "channel_type": "wechatmp",
+ "wechatmp_token": "TOKEN",
+ "wechatmp_port": 80,
+ "wechatmp_app_id": "APPID",
+ "wechatmp_app_secret": "APPSECRET",
+ "wechatmp_aes_key": ""
}
```
-详细步骤和参数说明参考 [钉钉接入](https://docs.link-ai.tech/cow/multi-platform/dingtalk)
+
+**企业服务号(wechatmp_service)**
+
+```json
+{
+ "channel_type": "wechatmp_service",
+ "wechatmp_token": "TOKEN",
+ "wechatmp_port": 80,
+ "wechatmp_app_id": "APPID",
+ "wechatmp_app_secret": "APPSECRET",
+ "wechatmp_aes_key": ""
+}
+```
+
+详细步骤和参数说明参考 [微信公众号接入](https://docs.link-ai.tech/cow/multi-platform/wechat-mp)
+
-飞书
+6. Terminal - 终端
-通过自建应用接入AI相关能力到飞书应用中,默认已是飞书的企业用户,且具有企业管理权限,将以下配置填入 `config.json`::
+修改 `config.json` 中的 `channel_type` 字段:
```json
{
- "channel_type": "feishu",
- "feishu_app_id": "APP_ID",
- "feishu_app_secret": "APP_SECRET",
- "feishu_token": "VERIFICATION_TOKEN",
- "feishu_port": 80
+ "channel_type": "terminal"
}
```
-详细步骤和参数说明参考 [飞书接入](https://docs.link-ai.tech/cow/multi-platform/feishu)
+
+运行后可在终端与机器人进行对话。
+
@@ -728,7 +742,7 @@ FAQs:
# 🛠️ 开发
-欢迎接入更多应用通道,参考 [Terminal代码](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/channel/terminal/terminal_channel.py) 新增自定义通道,实现接收和发送消息逻辑即可完成接入。 同时欢迎贡献新的插件,参考 [插件开发文档](https://github.com/zhayujie/chatgpt-on-wechat/tree/master/plugins)。
+欢迎接入更多应用通道,参考 [飞书通道](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/channel/feishu/feishu_channel.py) 新增自定义通道,实现接收和发送消息逻辑即可完成接入。 同时欢迎贡献新的Skills,参考 [Skill创造器说明](https://github.com/zhayujie/chatgpt-on-wechat/blob/master/skills/skill-creator/SKILL.md)。
# ✉ 联系
diff --git a/agent/prompt/builder.py b/agent/prompt/builder.py
index 5eed133..1a01520 100644
--- a/agent/prompt/builder.py
+++ b/agent/prompt/builder.py
@@ -397,8 +397,8 @@ def _build_workspace_section(workspace_dir: str, language: str, is_first_convers
"",
"**交流规范**:",
"",
- "- 在对话中,非必要不输出工作空间技术细节(如 SOUL.md、USER.md等文件名称,工具名称,配置等),除非用户明确询问",
- "- 例如用自然表达如「我已记住」而非「已更新 MEMORY.md」",
+ "- 在对话中,不要直接输出工作空间中的技术细节,特别是不要输出 SOUL.md、USER.md、MEMORY.md 等文件名称",
+ "- 例如用自然表达例如「我已记住」而不是「已更新 MEMORY.md」",
"",
]
diff --git a/bridge/bridge.py b/bridge/bridge.py
index 43616d2..1c42856 100644
--- a/bridge/bridge.py
+++ b/bridge/bridge.py
@@ -46,9 +46,6 @@ class Bridge(object):
if model_type and model_type.startswith("claude"):
self.btype["chat"] = const.CLAUDEAPI
- if model_type in ["claude"]:
- self.btype["chat"] = const.CLAUDEAI
-
if model_type in [const.MOONSHOT, "moonshot-v1-8k", "moonshot-v1-32k", "moonshot-v1-128k"]:
self.btype["chat"] = const.MOONSHOT
diff --git a/channel/web/web_channel.py b/channel/web/web_channel.py
index 49b32ae..88c04fd 100644
--- a/channel/web/web_channel.py
+++ b/channel/web/web_channel.py
@@ -3,6 +3,7 @@ import time
import web
import json
import uuid
+import io
from queue import Queue, Empty
from bridge.context import *
from bridge.reply import Reply, ReplyType
@@ -197,46 +198,50 @@ class WebChannel(ChatChannel):
def startup(self):
port = conf().get("web_port", 9899)
- logger.info("""[WebChannel] 当前channel为web,可修改 config.json 配置文件中的 channel_type 字段进行切换。全部可用类型为:
- 1. web: 网页
- 2. terminal: 终端
- 3. feishu: 飞书
- 4. dingtalk: 钉钉
- 5. wechatcom_app: 企微自建应用
- 6. wechatmp: 个人公众号
- 7. wechatmp_service: 企业公众号""")
- logger.info(f"✅ Web对话网页已运行, 请使用浏览器访问 http://localhost:{port}/chat (本地运行) 或 http://ip:{port}/chat (服务器运行)")
+
+ # 打印可用渠道类型提示
+ logger.info("[WebChannel] 当前channel为web,可修改 config.json 配置文件中的 channel_type 字段进行切换。全部可用类型为:")
+ logger.info("[WebChannel] 1. web - 网页")
+ logger.info("[WebChannel] 2. terminal - 终端")
+ logger.info("[WebChannel] 3. feishu - 飞书")
+ logger.info("[WebChannel] 4. dingtalk - 钉钉")
+ logger.info("[WebChannel] 5. wechatcom_app - 企微自建应用")
+ logger.info("[WebChannel] 6. wechatmp - 个人公众号")
+ logger.info("[WebChannel] 7. wechatmp_service - 企业公众号")
+ logger.info(f"[WebChannel] 🌐 本地访问: http://localhost:{port}/chat")
+ logger.info(f"[WebChannel] 🌍 服务器访问: http://YOUR_IP:{port}/chat (请将YOUR_IP替换为服务器IP)")
+ logger.info("[WebChannel] ✅ Web对话网页已运行")
# 确保静态文件目录存在
static_dir = os.path.join(os.path.dirname(__file__), 'static')
if not os.path.exists(static_dir):
os.makedirs(static_dir)
- logger.info(f"Created static directory: {static_dir}")
+ logger.debug(f"[WebChannel] Created static directory: {static_dir}")
urls = (
- '/', 'RootHandler', # 添加根路径处理器
+ '/', 'RootHandler',
'/message', 'MessageHandler',
- '/poll', 'PollHandler', # 添加轮询处理器
+ '/poll', 'PollHandler',
'/chat', 'ChatHandler',
- '/config', 'ConfigHandler', # 添加配置处理器
- '/assets/(.*)', 'AssetsHandler', # 匹配 /assets/任何路径
+ '/config', 'ConfigHandler',
+ '/assets/(.*)', 'AssetsHandler',
)
app = web.application(urls, globals(), autoreload=False)
# 完全禁用web.py的HTTP日志输出
- # 创建一个空的日志处理函数
- def null_log_function(status, environ):
- pass
-
- # 替换web.py的日志函数
web.httpserver.LogMiddleware.log = lambda self, status, environ: None
# 配置web.py的日志级别为ERROR
logging.getLogger("web").setLevel(logging.ERROR)
logging.getLogger("web.httpserver").setLevel(logging.ERROR)
- # 启动服务器
- web.httpserver.runsimple(app.wsgifunc(), ("0.0.0.0", port))
+ # 抑制 web.py 默认的服务器启动消息
+ old_stdout = sys.stdout
+ sys.stdout = io.StringIO()
+ try:
+ web.httpserver.runsimple(app.wsgifunc(), ("0.0.0.0", port))
+ finally:
+ sys.stdout = old_stdout
class RootHandler:
diff --git a/channel/wechatcom/wechatcomapp_channel.py b/channel/wechatcom/wechatcomapp_channel.py
index 41c824c..262702a 100644
--- a/channel/wechatcom/wechatcomapp_channel.py
+++ b/channel/wechatcom/wechatcomapp_channel.py
@@ -1,6 +1,7 @@
# -*- coding=utf-8 -*-
import io
import os
+import sys
import time
import requests
@@ -35,9 +36,8 @@ class WechatComAppChannel(ChatChannel):
self.agent_id = conf().get("wechatcomapp_agent_id")
self.token = conf().get("wechatcomapp_token")
self.aes_key = conf().get("wechatcomapp_aes_key")
- print(self.corp_id, self.secret, self.agent_id, self.token, self.aes_key)
logger.info(
- "[wechatcom] init: corp_id: {}, secret: {}, agent_id: {}, token: {}, aes_key: {}".format(self.corp_id, self.secret, self.agent_id, self.token, self.aes_key)
+ "[wechatcom] Initializing WeCom app channel, corp_id: {}, agent_id: {}".format(self.corp_id, self.agent_id)
)
self.crypto = WeChatCrypto(self.token, self.aes_key, self.corp_id)
self.client = WechatComAppClient(self.corp_id, self.secret)
@@ -47,7 +47,17 @@ class WechatComAppChannel(ChatChannel):
urls = ("/wxcomapp/?", "channel.wechatcom.wechatcomapp_channel.Query")
app = web.application(urls, globals(), autoreload=False)
port = conf().get("wechatcomapp_port", 9898)
- web.httpserver.runsimple(app.wsgifunc(), ("0.0.0.0", port))
+ logger.info("[wechatcom] ✅ WeCom app channel started successfully")
+ logger.info("[wechatcom] 📡 Listening on http://0.0.0.0:{}/wxcomapp/".format(port))
+ logger.info("[wechatcom] 🤖 Ready to receive messages")
+
+ # Suppress web.py's default server startup message
+ old_stdout = sys.stdout
+ sys.stdout = io.StringIO()
+ try:
+ web.httpserver.runsimple(app.wsgifunc(), ("0.0.0.0", port))
+ finally:
+ sys.stdout = old_stdout
def send(self, reply: Reply, context: Context):
receiver = context["receiver"]
@@ -74,6 +84,10 @@ class WechatComAppChannel(ChatChannel):
response = self.client.media.upload("voice", open(path, "rb"))
logger.debug("[wechatcom] upload voice response: {}".format(response))
media_ids.append(response["media_id"])
+ except ImportError as e:
+ logger.error("[wechatcom] voice conversion failed: {}".format(e))
+ logger.error("[wechatcom] please install pydub: pip install pydub")
+ return
except WeChatClientException as e:
logger.error("[wechatcom] upload voice failed: {}".format(e))
return
diff --git a/channel/wechatmp/wechatmp_channel.py b/channel/wechatmp/wechatmp_channel.py
index 5fc7b8c..e0a07dd 100644
--- a/channel/wechatmp/wechatmp_channel.py
+++ b/channel/wechatmp/wechatmp_channel.py
@@ -21,7 +21,11 @@ from common.log import logger
from common.singleton import singleton
from common.utils import split_string_by_utf8_length, remove_markdown_symbol
from config import conf
-from voice.audio_convert import any_to_mp3, split_audio
+
+try:
+ from voice.audio_convert import any_to_mp3, split_audio
+except ImportError as e:
+ logger.debug("import voice.audio_convert failed, voice features will not be supported: {}".format(e))
# If using SSL, uncomment the following lines, and modify the certificate path.
# from cheroot.server import HTTPServer
@@ -85,26 +89,31 @@ class WechatMPChannel(ChatChannel):
logger.info("[wechatmp] text cached, receiver {}\n{}".format(receiver, reply_text))
self.cache_dict[receiver].append(("text", reply_text))
elif reply.type == ReplyType.VOICE:
- voice_file_path = reply.content
- duration, files = split_audio(voice_file_path, 60 * 1000)
- if len(files) > 1:
- logger.info("[wechatmp] voice too long {}s > 60s , split into {} parts".format(duration / 1000.0, len(files)))
+ try:
+ voice_file_path = reply.content
+ duration, files = split_audio(voice_file_path, 60 * 1000)
+ if len(files) > 1:
+ logger.info("[wechatmp] voice too long {}s > 60s , split into {} parts".format(duration / 1000.0, len(files)))
- for path in files:
- # support: <2M, <60s, mp3/wma/wav/amr
- try:
- with open(path, "rb") as f:
- response = self.client.material.add("voice", f)
- logger.debug("[wechatmp] upload voice response: {}".format(response))
- f_size = os.fstat(f.fileno()).st_size
- time.sleep(1.0 + 2 * f_size / 1024 / 1024)
- # todo check media_id
- except WeChatClientException as e:
- logger.error("[wechatmp] upload voice failed: {}".format(e))
- return
- media_id = response["media_id"]
- logger.info("[wechatmp] voice uploaded, receiver {}, media_id {}".format(receiver, media_id))
- self.cache_dict[receiver].append(("voice", media_id))
+ for path in files:
+ # support: <2M, <60s, mp3/wma/wav/amr
+ try:
+ with open(path, "rb") as f:
+ response = self.client.material.add("voice", f)
+ logger.debug("[wechatmp] upload voice response: {}".format(response))
+ f_size = os.fstat(f.fileno()).st_size
+ time.sleep(1.0 + 2 * f_size / 1024 / 1024)
+ # todo check media_id
+ except WeChatClientException as e:
+ logger.error("[wechatmp] upload voice failed: {}".format(e))
+ return
+ media_id = response["media_id"]
+ logger.info("[wechatmp] voice uploaded, receiver {}, media_id {}".format(receiver, media_id))
+ self.cache_dict[receiver].append(("voice", media_id))
+ except ImportError as e:
+ logger.error("[wechatmp] voice conversion failed: {}".format(e))
+ logger.error("[wechatmp] please install pydub: pip install pydub")
+ return
elif reply.type == ReplyType.IMAGE_URL: # 从网络下载图片
img_url = reply.content
@@ -213,6 +222,10 @@ class WechatMPChannel(ChatChannel):
logger.debug("[wechatcom] upload voice response: {}".format(response))
media_ids.append(response["media_id"])
os.remove(path)
+ except ImportError as e:
+ logger.error("[wechatmp] voice conversion failed: {}".format(e))
+ logger.error("[wechatmp] please install pydub: pip install pydub")
+ return
except WeChatClientException as e:
logger.error("[wechatmp] upload voice failed: {}".format(e))
return
diff --git a/common/const.py b/common/const.py
index 16c450e..0e134db 100644
--- a/common/const.py
+++ b/common/const.py
@@ -1,77 +1,93 @@
-# bot_type
+# 厂商类型
OPEN_AI = "openAI"
CHATGPT = "chatGPT"
-BAIDU = "baidu" # 百度文心一言模型
+BAIDU = "baidu"
XUNFEI = "xunfei"
CHATGPTONAZURE = "chatGPTOnAzure"
LINKAI = "linkai"
-CLAUDEAI = "claude" # 使用cookie的历史模型
-CLAUDEAPI= "claudeAPI" # 通过Claude api调用模型
-QWEN = "qwen" # 旧版通义模型
-QWEN_DASHSCOPE = "dashscope" # 通义新版sdk和api key
-
-
-GEMINI = "gemini" # gemini-1.0-pro
+CLAUDEAPI= "claudeAPI"
+QWEN = "qwen" # 旧版千问接入
+QWEN_DASHSCOPE = "dashscope" # 新版千问接入(百炼)
+GEMINI = "gemini"
ZHIPU_AI = "glm-4"
MOONSHOT = "moonshot"
MiniMax = "minimax"
MODELSCOPE = "modelscope"
-# model
+# 模型列表
+# Claude (Anthropic)
CLAUDE3 = "claude-3-opus-20240229"
-GPT35 = "gpt-3.5-turbo"
-GPT35_0125 = "gpt-3.5-turbo-0125"
-GPT35_1106 = "gpt-3.5-turbo-1106"
-
-GPT_4o = "gpt-4o"
-GPT_4O_0806 = "gpt-4o-2024-08-06"
-GPT4_TURBO = "gpt-4-turbo"
-GPT4_TURBO_PREVIEW = "gpt-4-turbo-preview"
-GPT4_TURBO_04_09 = "gpt-4-turbo-2024-04-09"
-GPT4_TURBO_01_25 = "gpt-4-0125-preview"
-GPT4_TURBO_11_06 = "gpt-4-1106-preview"
-GPT4_VISION_PREVIEW = "gpt-4-vision-preview"
-
-GPT4 = "gpt-4"
-GPT_4o_MINI = "gpt-4o-mini"
-GPT4_32k = "gpt-4-32k"
-GPT4_06_13 = "gpt-4-0613"
-GPT4_32k_06_13 = "gpt-4-32k-0613"
-GPT_41 = "gpt-4.1"
-GPT_41_MINI = "gpt-4.1-mini"
-GPT_41_NANO = "gpt-4.1-nano"
-
-GPT_5 = "gpt-5"
-GPT_5_MINI = "gpt-5-mini"
-GPT_5_NANO = "gpt-5-nano"
-
-O1 = "o1-preview"
-O1_MINI = "o1-mini"
-
-WHISPER_1 = "whisper-1"
-TTS_1 = "tts-1"
-TTS_1_HD = "tts-1-hd"
-
-WEN_XIN = "wenxin"
-WEN_XIN_4 = "wenxin-4"
-
-QWEN_TURBO = "qwen-turbo"
-QWEN_PLUS = "qwen-plus"
-QWEN_MAX = "qwen-max"
-
-LINKAI_35 = "linkai-3.5"
-LINKAI_4_TURBO = "linkai-4-turbo"
-LINKAI_4o = "linkai-4o"
+CLAUDE_3_OPUS = "claude-3-opus-latest"
+CLAUDE_3_OPUS_0229 = "claude-3-opus-20240229"
+CLAUDE_3_SONNET = "claude-3-sonnet-20240229"
+CLAUDE_3_HAIKU = "claude-3-haiku-20240307"
+CLAUDE_35_SONNET = "claude-3-5-sonnet-latest" # 带 latest 标签的模型名称,会不断更新指向最新发布的模型
+CLAUDE_35_SONNET_1022 = "claude-3-5-sonnet-20241022" # 带具体日期的模型名称,会固定为该日期发布的模型
+CLAUDE_35_SONNET_0620 = "claude-3-5-sonnet-20240620"
+CLAUDE_4_OPUS = "claude-opus-4-0"
+CLAUDE_4_SONNET = "claude-sonnet-4-0" # Claude Sonnet 4.0 - Agent推荐模型
+CLAUDE_4_5_SONNET = "claude-sonnet-4-5" # Claude Sonnet 4.5 - Agent推荐模型
+# Gemini (Google)
GEMINI_PRO = "gemini-1.0-pro"
GEMINI_15_flash = "gemini-1.5-flash"
GEMINI_15_PRO = "gemini-1.5-pro"
GEMINI_20_flash_exp = "gemini-2.0-flash-exp" # exp结尾为实验模型,会逐步不再支持
GEMINI_20_FLASH = "gemini-2.0-flash" # 正式版模型
-GEMINI_25_FLASH_PRE = "gemini-2.5-flash-preview-05-20" # preview为预览版模型 ,主要是新能力体验
+GEMINI_25_FLASH_PRE = "gemini-2.5-flash-preview-05-20" # preview为预览版模型,主要是新能力体验
GEMINI_25_PRO_PRE = "gemini-2.5-pro-preview-05-06"
+GEMINI_3_FLASH_PRE = "gemini-3-flash-preview" # Gemini 3 Flash Preview - Agent推荐模型
+GEMINI_3_PRO_PRE = "gemini-3-pro-preview" # Gemini 3 Pro Preview - Agent推荐模型
+# OpenAI
+GPT35 = "gpt-3.5-turbo"
+GPT35_0125 = "gpt-3.5-turbo-0125"
+GPT35_1106 = "gpt-3.5-turbo-1106"
+GPT4 = "gpt-4"
+GPT4_06_13 = "gpt-4-0613"
+GPT4_32k = "gpt-4-32k"
+GPT4_32k_06_13 = "gpt-4-32k-0613"
+GPT4_TURBO = "gpt-4-turbo"
+GPT4_TURBO_PREVIEW = "gpt-4-turbo-preview"
+GPT4_TURBO_01_25 = "gpt-4-0125-preview"
+GPT4_TURBO_11_06 = "gpt-4-1106-preview"
+GPT4_TURBO_04_09 = "gpt-4-turbo-2024-04-09"
+GPT4_VISION_PREVIEW = "gpt-4-vision-preview"
+GPT_4o = "gpt-4o"
+GPT_4O_0806 = "gpt-4o-2024-08-06"
+GPT_4o_MINI = "gpt-4o-mini"
+GPT_41 = "gpt-4.1"
+GPT_41_MINI = "gpt-4.1-mini"
+GPT_41_NANO = "gpt-4.1-nano"
+GPT_5 = "gpt-5"
+GPT_5_MINI = "gpt-5-mini"
+GPT_5_NANO = "gpt-5-nano"
+O1 = "o1-preview"
+O1_MINI = "o1-mini"
+WHISPER_1 = "whisper-1"
+TTS_1 = "tts-1"
+TTS_1_HD = "tts-1-hd"
+# DeepSeek
+DEEPSEEK_CHAT = "deepseek-chat" # DeepSeek-V3对话模型
+DEEPSEEK_REASONER = "deepseek-reasoner" # DeepSeek-R1模型
+
+# Qwen (通义千问 - 阿里云)
+QWEN = "qwen"
+QWEN_TURBO = "qwen-turbo"
+QWEN_PLUS = "qwen-plus"
+QWEN_MAX = "qwen-max"
+QWEN_LONG = "qwen-long"
+QWEN3_MAX = "qwen3-max" # Qwen3 Max - Agent推荐模型
+QWQ_PLUS = "qwq-plus"
+
+# MiniMax
+MINIMAX_M2_1 = "MiniMax-M2.1" # MiniMax M2.1 - Agent推荐模型
+MINIMAX_M2_1_LIGHTNING = "MiniMax-M2.1-lightning" # MiniMax M2.1 极速版
+MINIMAX_M2 = "MiniMax-M2" # MiniMax M2
+MINIMAX_ABAB6_5 = "abab6.5-chat" # MiniMax abab6.5
+
+# GLM (智谱AI)
GLM_4 = "glm-4"
GLM_4_PLUS = "glm-4-plus"
GLM_4_flash = "glm-4-flash"
@@ -80,20 +96,19 @@ GLM_4_ALLTOOLS = "glm-4-alltools"
GLM_4_0520 = "glm-4-0520"
GLM_4_AIR = "glm-4-air"
GLM_4_AIRX = "glm-4-airx"
+GLM_4_7 = "glm-4.7" # 智谱 GLM-4.7 - Agent推荐模型
+# Kimi (Moonshot)
+MOONSHOT = "moonshot"
-CLAUDE_3_OPUS = "claude-3-opus-latest"
-CLAUDE_3_OPUS_0229 = "claude-3-opus-20240229"
-CLAUDE_35_SONNET = "claude-3-5-sonnet-latest" # 带 latest 标签的模型名称,会不断更新指向最新发布的模型
-CLAUDE_35_SONNET_1022 = "claude-3-5-sonnet-20241022" # 带具体日期的模型名称,会固定为该日期发布的模型
-CLAUDE_35_SONNET_0620 = "claude-3-5-sonnet-20240620"
-CLAUDE_3_SONNET = "claude-3-sonnet-20240229"
-CLAUDE_3_HAIKU = "claude-3-haiku-20240307"
-CLAUDE_4_SONNET = "claude-sonnet-4-0"
-CLAUDE_4_OPUS = "claude-opus-4-0"
-
-DEEPSEEK_CHAT = "deepseek-chat" # DeepSeek-V3对话模型
-DEEPSEEK_REASONER = "deepseek-reasoner" # DeepSeek-R1模型
+# 其他模型
+WEN_XIN = "wenxin"
+WEN_XIN_4 = "wenxin-4"
+XUNFEI = "xunfei"
+LINKAI_35 = "linkai-3.5"
+LINKAI_4_TURBO = "linkai-4-turbo"
+LINKAI_4o = "linkai-4o"
+MODELSCOPE = "modelscope"
GITEE_AI_MODEL_LIST = ["Yi-34B-Chat", "InternVL2-8B", "deepseek-coder-33B-instruct", "InternVL2.5-26B", "Qwen2-VL-72B", "Qwen2.5-32B-Instruct", "glm-4-9b-chat", "codegeex4-all-9b", "Qwen2.5-Coder-32B-Instruct", "Qwen2.5-72B-Instruct", "Qwen2.5-7B-Instruct", "Qwen2-72B-Instruct", "Qwen2-7B-Instruct", "code-raccoon-v1", "Qwen2.5-14B-Instruct"]
@@ -104,19 +119,43 @@ MODELSCOPE_MODEL_LIST = ["LLM-Research/c4ai-command-r-plus-08-2024","mistralai/M
"deepseek-ai/DeepSeek-R1-Distill-Qwen-14B","deepseek-ai/DeepSeek-R1-Distill-Qwen-7B","deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B","deepseek-ai/DeepSeek-R1","deepseek-ai/DeepSeek-V3","Qwen/QwQ-32B"]
MODEL_LIST = [
+ # Claude
+ CLAUDE3, CLAUDE_4_OPUS, CLAUDE_4_5_SONNET, CLAUDE_4_SONNET, CLAUDE_3_OPUS, CLAUDE_3_OPUS_0229,
+ CLAUDE_35_SONNET, CLAUDE_35_SONNET_1022, CLAUDE_35_SONNET_0620, CLAUDE_3_SONNET, CLAUDE_3_HAIKU,
+ "claude", "claude-3-haiku", "claude-3-sonnet", "claude-3-opus", "claude-3.5-sonnet",
+
+ # Gemini
+ GEMINI_3_PRO_PRE, GEMINI_3_FLASH_PRE, GEMINI_25_PRO_PRE, GEMINI_25_FLASH_PRE,
+ GEMINI_20_FLASH, GEMINI_20_flash_exp, GEMINI_15_PRO, GEMINI_15_flash, GEMINI_PRO, GEMINI,
+
+ # OpenAI
GPT35, GPT35_0125, GPT35_1106, "gpt-3.5-turbo-16k",
- GPT_41, GPT_41_MINI, GPT_41_NANO, O1, O1_MINI, GPT_4o, GPT_4O_0806, GPT_4o_MINI, GPT4_TURBO, GPT4_TURBO_PREVIEW, GPT4_TURBO_01_25, GPT4_TURBO_11_06, GPT4, GPT4_32k, GPT4_06_13, GPT4_32k_06_13,
+ GPT4, GPT4_06_13, GPT4_32k, GPT4_32k_06_13,
+ GPT4_TURBO, GPT4_TURBO_PREVIEW, GPT4_TURBO_01_25, GPT4_TURBO_11_06, GPT4_TURBO_04_09,
+ GPT_4o, GPT_4O_0806, GPT_4o_MINI,
+ GPT_41, GPT_41_MINI, GPT_41_NANO,
GPT_5, GPT_5_MINI, GPT_5_NANO,
- WEN_XIN, WEN_XIN_4,
- XUNFEI,
- ZHIPU_AI, GLM_4, GLM_4_PLUS, GLM_4_flash, GLM_4_LONG, GLM_4_ALLTOOLS, GLM_4_0520, GLM_4_AIR, GLM_4_AIRX,
- MOONSHOT, MiniMax,
- GEMINI_25_PRO_PRE, GEMINI_25_FLASH_PRE, GEMINI_20_FLASH, GEMINI, GEMINI_PRO, GEMINI_15_flash, GEMINI_15_PRO, GEMINI_20_flash_exp,
- CLAUDE_4_OPUS, CLAUDE_4_SONNET, CLAUDE_3_OPUS, CLAUDE_3_OPUS_0229, CLAUDE_35_SONNET, CLAUDE_35_SONNET_1022, CLAUDE_35_SONNET_0620, CLAUDE_3_SONNET, CLAUDE_3_HAIKU, "claude", "claude-3-haiku", "claude-3-sonnet", "claude-3-opus", "claude-3.5-sonnet",
- "moonshot-v1-8k", "moonshot-v1-32k", "moonshot-v1-128k",
- QWEN, QWEN_TURBO, QWEN_PLUS, QWEN_MAX,
- LINKAI_35, LINKAI_4_TURBO, LINKAI_4o,
+ O1, O1_MINI,
+
+ # DeepSeek
DEEPSEEK_CHAT, DEEPSEEK_REASONER,
+
+ # Qwen
+ QWEN, QWEN_TURBO, QWEN_PLUS, QWEN_MAX, QWEN_LONG, QWEN3_MAX,
+
+ # MiniMax
+ MiniMax, MINIMAX_M2_1, MINIMAX_M2_1_LIGHTNING, MINIMAX_M2, MINIMAX_ABAB6_5,
+
+ # GLM
+ ZHIPU_AI, GLM_4, GLM_4_PLUS, GLM_4_flash, GLM_4_LONG, GLM_4_ALLTOOLS,
+ GLM_4_0520, GLM_4_AIR, GLM_4_AIRX, GLM_4_7,
+
+ # Kimi
+ MOONSHOT, "moonshot-v1-8k", "moonshot-v1-32k", "moonshot-v1-128k",
+
+ # 其他模型
+ WEN_XIN, WEN_XIN_4, XUNFEI,
+ LINKAI_35, LINKAI_4_TURBO, LINKAI_4o,
MODELSCOPE
]
diff --git a/config.py b/config.py
index ce8fb91..666a7ff 100644
--- a/config.py
+++ b/config.py
@@ -189,7 +189,7 @@ available_setting = {
"web_port": 9899,
"agent": True, # 是否开启Agent模式
"agent_workspace": "~/cow", # agent工作空间路径,用于存储skills、memory等
- "agent_max_context_tokens": 40000, # Agent模式下最大上下文tokens
+ "agent_max_context_tokens": 50000, # Agent模式下最大上下文tokens
"agent_max_context_turns": 30, # Agent模式下最大上下文记忆轮次
"agent_max_steps": 15, # Agent模式下单次运行最大决策步数
}
diff --git a/docker/docker-compose.yml b/docker/docker-compose.yml
index d99ff41..8944d70 100644
--- a/docker/docker-compose.yml
+++ b/docker/docker-compose.yml
@@ -21,5 +21,6 @@ services:
EXPIRES_IN_SECONDS: 3600
USE_GLOBAL_PLUGIN_CONFIG: 'True'
USE_LINKAI: 'False'
+ AGENT: 'True'
LINKAI_API_KEY: ''
LINKAI_APP_CODE: ''
diff --git a/models/bot_factory.py b/models/bot_factory.py
index 2fb56dd..3027d47 100644
--- a/models/bot_factory.py
+++ b/models/bot_factory.py
@@ -40,9 +40,6 @@ def create_bot(bot_type):
from models.linkai.link_ai_bot import LinkAIBot
return LinkAIBot()
- elif bot_type == const.CLAUDEAI:
- from models.claude.claude_ai_bot import ClaudeAIBot
- return ClaudeAIBot()
elif bot_type == const.CLAUDEAPI:
from models.claudeapi.claude_api_bot import ClaudeAPIBot
return ClaudeAPIBot()
diff --git a/requirements-optional.txt b/requirements-optional.txt
index 78984b0..5208c7b 100644
--- a/requirements-optional.txt
+++ b/requirements-optional.txt
@@ -12,10 +12,6 @@ numpy<=1.24.2
langid # language detect
elevenlabs==1.0.3 # elevenlabs TTS
-# wechatcom & wechatmp
-web.py
-wechatpy
-
#install plugin
dulwich
diff --git a/requirements.txt b/requirements.txt
index 7f93bbe..4f0d205 100644
--- a/requirements.txt
+++ b/requirements.txt
@@ -13,6 +13,10 @@ python-dotenv>=1.0.0
PyYAML>=6.0
croniter>=2.0.0
+# wechatcom & wechatmp
+web.py
+wechatpy
+
# zhipuai
zai-sdk
# tongyi qwen sdk
diff --git a/voice/ali/ali_voice.py b/voice/ali/ali_voice.py
index 43ea0b4..91f9143 100644
--- a/voice/ali/ali_voice.py
+++ b/voice/ali/ali_voice.py
@@ -15,11 +15,15 @@ import time
from bridge.reply import Reply, ReplyType
from common.log import logger
-from voice.audio_convert import get_pcm_from_wav
from voice.voice import Voice
from voice.ali.ali_api import AliyunTokenGenerator, speech_to_text_aliyun, text_to_speech_aliyun
from config import conf
+try:
+ from voice.audio_convert import get_pcm_from_wav
+except ImportError as e:
+ logger.debug("import voice.audio_convert failed: {}".format(e))
+
class AliVoice(Voice):
def __init__(self):
diff --git a/voice/audio_convert.py b/voice/audio_convert.py
index 4263678..9dd9641 100644
--- a/voice/audio_convert.py
+++ b/voice/audio_convert.py
@@ -8,7 +8,13 @@ try:
except ImportError:
logger.debug("import pysilk failed, wechaty voice message will not be supported.")
-from pydub import AudioSegment
+try:
+ from pydub import AudioSegment
+ _pydub_available = True
+except ImportError:
+ logger.debug("import pydub failed, voice conversion features will not be supported.")
+ AudioSegment = None
+ _pydub_available = False
sil_supports = [8000, 12000, 16000, 24000, 32000, 44100, 48000] # slk转wav时,支持的采样率
@@ -44,6 +50,8 @@ def any_to_mp3(any_path, mp3_path):
"""
把任意格式转成mp3文件
"""
+ if not _pydub_available:
+ raise ImportError("pydub is required for audio conversion. Please install it with: pip install pydub")
if any_path.endswith(".mp3"):
shutil.copy2(any_path, mp3_path)
return
@@ -58,6 +66,8 @@ def any_to_wav(any_path, wav_path):
"""
把任意格式转成wav文件
"""
+ if not _pydub_available:
+ raise ImportError("pydub is required for audio conversion. Please install it with: pip install pydub")
if any_path.endswith(".wav"):
shutil.copy2(any_path, wav_path)
return
@@ -73,6 +83,8 @@ def any_to_sil(any_path, sil_path):
"""
把任意格式转成sil文件
"""
+ if not _pydub_available:
+ raise ImportError("pydub is required for audio conversion. Please install it with: pip install pydub")
if any_path.endswith(".sil") or any_path.endswith(".silk") or any_path.endswith(".slk"):
shutil.copy2(any_path, sil_path)
return 10000
@@ -92,6 +104,8 @@ def any_to_amr(any_path, amr_path):
"""
把任意格式转成amr文件
"""
+ if not _pydub_available:
+ raise ImportError("pydub is required for audio conversion. Please install it with: pip install pydub")
if any_path.endswith(".amr"):
shutil.copy2(any_path, amr_path)
return
@@ -116,6 +130,8 @@ def split_audio(file_path, max_segment_length_ms=60000):
"""
分割音频文件
"""
+ if not _pydub_available:
+ raise ImportError("pydub is required for audio conversion. Please install it with: pip install pydub")
audio = AudioSegment.from_file(file_path)
audio_length_ms = len(audio)
if audio_length_ms <= max_segment_length_ms:
diff --git a/voice/baidu/baidu_voice.py b/voice/baidu/baidu_voice.py
index 2c4bc4b..8ded4cf 100644
--- a/voice/baidu/baidu_voice.py
+++ b/voice/baidu/baidu_voice.py
@@ -13,9 +13,13 @@ from bridge.reply import Reply, ReplyType
from common.log import logger
from common.tmp_dir import TmpDir
from config import conf
-from voice.audio_convert import get_pcm_from_wav
from voice.voice import Voice
+try:
+ from voice.audio_convert import get_pcm_from_wav
+except ImportError as e:
+ logger.debug("import voice.audio_convert failed: {}".format(e))
+
class BaiduVoice(Voice):
def __init__(self):
try:
diff --git a/voice/xunfei/xunfei_voice.py b/voice/xunfei/xunfei_voice.py
index 7b503f7..6ce54e7 100644
--- a/voice/xunfei/xunfei_voice.py
+++ b/voice/xunfei/xunfei_voice.py
@@ -28,9 +28,15 @@ from config import conf
from voice.voice import Voice
from .xunfei_asr import xunfei_asr
from .xunfei_tts import xunfei_tts
-from voice.audio_convert import any_to_mp3
import shutil
-from pydub import AudioSegment
+
+try:
+ from voice.audio_convert import any_to_mp3
+ from pydub import AudioSegment
+ _audio_available = True
+except ImportError as e:
+ logger.debug("import audio libraries failed: {}".format(e))
+ _audio_available = False
class XunfeiVoice(Voice):