# 第 1 章 安装与环境配置 学完本章,你将拥有一个可以正常对话的 GenericAgent(GA)运行环境。 学习目标 在本地安装好 Python 并下载 GenericAgent 项目代码 完成 API 密钥配置,让 GA 能连接大模型 成功启动 GA 并完成第一次对话 1.1 安装 Python GA 依赖 Python 运行,我们先把它装好。 ⚠️ 推荐 Python 3.11 或 3.12。不要使用 3.14(与 等依赖不兼容)。 Windows 打开下载链接:https://www.python.org/ftp/python/3.12.10/python-3.12.10-amd64.exe 运行安装包,底部的 "Add python.
学完本章,你将拥有一个可以正常对话的 GenericAgent(GA)运行环境。
mykey.py API 密钥配置,让 GA 能连接大模型GA 依赖 Python 运行,我们先把它装好。
⚠️ 推荐 Python 3.11 或 3.12。不要使用 3.14(与
pywebview等依赖不兼容)。
Win + R 输入 cmd 打开终端,输入:python --version
看到 Python 3.x.x 就说明安装成功了。
macOS 和大多数 Linux 发行版自带 Python 3,打开终端(Terminal)验证:
python3 --version
看到 Python 3.x.x(3.11 或 3.12)即可。如果版本低于 3.10,前往 Python 官网 下载安装。
python3 --version
看到 Python 3.x.x 就说明安装成功了。
我们需要把 GenericAgent 的代码下载到本地。两种方式任选其一:
方式一:下载 ZIP(推荐新手)
D:\GenericAgent)方式二:Git Clone
如果已经安装了 Git,在终端执行:
git clone https://github.com/lsdefine/GenericAgent.git
打开终端,进入项目目录(运行以下命令),安装两个核心依赖:
# 1. cd 到下载的 GA 文件目录 cd d: (如果你的安装地址在D盘,终端打开后默认在c盘,安装在c盘跳过此步骤,仅限windows用户) cd "你的GenericAgent路径" (示例: cd D:/Document/GenericAgent-main) # 2. 安装最小环境依赖 pip install streamlit pywebview # 如果你的 Python 3 对应 pip3,则用:pip3 install streamlit pywebview
其余依赖不用手动装——1.5 节会教你让 GA 自己把剩余的包全装好。
GA 需要连接大模型才能工作。我们通过 mykey.py 告诉它用哪个模型、怎么连。
mykey 配置最简流程(5 步搞定)
如果你是第一次接触,只需要跟着下面 5 步做:
第 1 步:复制模板文件
进入你下载的 GenericAgent 项目文件夹,找到mykey_template.py这个文件,复制一份,然后把副本重命名为mykey.py。第 2 步:编辑 mykey.py,填入你的 API 信息
用任意文本编辑器(记事本、VS Code 都行)打开mykey.py。先找到 mykey 里你要用的模型 API 对应的格式模板,然后照着填。你会看到里面有很多#开头的行——这些是注释,程序运行时会自动忽略它们,相当于"说明书"。填写 API 信息有两种方式,任选其一:
- 方式 A:找到对应的配置区域,把你的 API Key、地址等信息填好后,删掉该行最前面的所有
#号,让这一行变成"真正的代码"。- 方式 B:不动原来的注释,直接在文件里另起一行,把你的配置写上去(不加
#)。简单来说:有
#的行 = 不生效,没有#的行 = 会生效。第 3 步:多个 API 怎么切换?
如果你填了不止一个 API 配置,GA 默认使用文件里第一个生效的配置(即第一个没被#注释掉的配置)。想切换模型有两种办法:
- 办法 A:启动 GA 后,点击界面侧边栏的切换模型按钮,直接切。
- 办法 B:回到
mykey.py,把你想用的那组配置挪到所有生效配置的最前面,保存后重启 GA。第 4 步:保存文件
改完以后一定要保存!快捷键:Windows 按Ctrl + S,Mac 按Cmd + S。第 5 步:重启 GA
每次修改mykey.py后,都需要关掉 GA 再重新启动,新的配置才会生效。
下面是更详细的配置说明和各渠道的具体写法:
mykey_template.py 复制一份,重命名为 mykey.pymykey.py,填入你的 API 信息。选一种填就行,不用的配置可以删掉或留着不管直接复制到 mykey.py,替换两个 apikey / apibase:
# ── 主力:Claude Opus 4.6(CC switch 反代(Reverse Proxy),最常见)── native_claude_config0 = { 'name': 'claude-main', # /llms 显示名 & mixin 引用名 'apikey': 'sk-user-<你的relay-key>', # 非 sk-ant- 前缀 → Bearer 鉴权 'apibase': 'https://<your-cc-switch-host>/claude/office', # CC switch 端点 'model': 'claude-opus-4-6', 'fake_cc_system_prompt': True, # CC 透传渠道必须置 True 'thinking_type': 'adaptive', # 某些渠道必须要求填thinking_type字段 'max_retries': 3, 'read_timeout': 180, } # ── 备选:GPT-5.4 做兜底 ── native_oai_config = { 'name': 'gpt-backup', 'apikey': 'sk-<你的 OpenAI key>', 'apibase': 'https://api.openai.com/v1', 'model': 'gpt-5.4', 'reasoning_effort': 'high', 'max_retries': 3, 'read_timeout': 120, } # ── Mixin 自动切换(Failover)── mixin_config = { 'llm_nos': ['claude-main', 'gpt-backup'], 'max_retries': 10, 'base_delay': 0.5, 'spring_back': 300, }
每次启动GA默认读的是第一个api信息。可以点击设置切换。
所有内置渠道一览(点击展开)
| 渠道 | 推荐变量名 | apikey 形式 | apibase | 示例 model | 备注 |
|---|---|---|---|---|---|
| Anthropic 官方 | native_claude_config_anthropic | sk-ant-xxx | https://api.anthropic.com | claude-opus-4-6[1m] | sk-ant- 前缀自动切 x-api-key 鉴权 |
| OpenAI 官方 | native_oai_config | sk-proj-xxx | https://api.openai.com/v1 | gpt-5.4 | 支持 api_mode: 'responses' |
| OpenRouter | oai_config_openrouter | sk-or-xxx | https://openrouter.ai/api/v1 | anthropic/claude-opus-4-6 | model 用 provider/model 格式 |
| 智谱 GLM-5.1 | native_claude_glm_config | xxx.yyy | https://open.bigmodel.cn/api/anthropic | glm-5.1 | 推荐用 Anthropic 路径 |
| MiniMax(Anthropic) | native_claude_config_minimax | sk-xxx | https://api.minimaxi.com/anthropic | MiniMax-M2.7 | 204K 上下文 |
| MiniMax(OAI) | oai_config_minimax | sk-cp-xxx | https://api.minimaxi.com/v1 | MiniMax-M2.7 | 回复带 think 标签 |
| Moonshot / Kimi | oai_config_kimi | sk-xxx | https://api.moonshot.cn/v1 | kimi-k2-turbo-preview | 温度强制 1.0 |
| DeepSeek V4 | native_oai_config_deepseek | sk-xxx | https://api.deepseek.com | deepseek-v4-pro | ⚠️ 不带 /v1 |
| 阶跃星辰 | oai_config_stepfun | xxx.yyy | https://api.stepfun.com/v1 | step-2-16k | OAI 兼容 |
| 豆包 / 火山引擎 | oai_config_volcengine | xxx-xxx | https://ark.cn-beijing.volces.com/api/v3 | doubao-seed-1-8 | OAI 兼容 |
| 硅基流动 | oai_config_siliconflow | sk-xxx | https://api.siliconflow.cn/v1 | deepseek-ai/DeepSeek-V3 | 新用户 16 元免费额度 |
fake_cc_system_prompt = True)| 渠道类型 | 推荐变量名 | apibase | 示例 model | 备注 |
|---|---|---|---|---|
| CC Switch(最常见) | native_claude_config0 | https://host/claude/office | claude-opus-4-6 | 多数中文低价站走此协议 |
| CRS 反代 | native_claude_config_crs | https://host/api | claude-opus-4-6[1m] | CRS 官方协议 |
| AnyRouter | native_claude_config_anyrouter | https://host/v1 | claude-opus-4-6 | 与 CC switch 同协议族 |
| Sider(订阅桥接) | sider_cookie | 自动 | gpt-5.4 / claude-opus-4-6 | 没有 API 时的兜底 |
| 方案 | 推荐变量名 | apibase | 示例 model | 备注 |
|---|---|---|---|---|
| Ollama | native_oai_ollama | http://127.0.0.1:11434/v1 |
qwen2.5:14b | 末尾 /v1 不能漏 |
| llama.cpp | oai_config_llamacpp | http://127.0.0.1:8080/v1 |
default | 建议走文本协议 |
| vLLM | native_oai_vllm | http://127.0.0.1:8000/v1 |
你 load 的模型 id | 需支持 function calling |
| LM Studio | oai_config_lmstudio | http://localhost:1234/v1 |
LM Studio 模型 id | GUI 本地部署最省心 |
⚙️ 关键可调字段速查(点击展开)
| 字段 | 默认 | 作用 | 何时要改 |
|---|---|---|---|
| name | 取 model | 显示名 & mixin 引用名 | 有 mixin 时建议显式填 |
| apikey | —— | 鉴权 Key | 必填 |
| apibase | —— | API 端点地址 | 必填 |
| model | —— | 模型名,后缀 [1m] 触发 1m 上下文 | 必填 |
| fake_cc_system_prompt | False | 伪装 Claude Code CLI 指纹 | CC switch / CRS 必须 True |
| api_mode | chat_completions | 可选 responses | ⚠️GPT-5.4 只能走 responses,必须显式设置 |
| thinking_type | adaptive | adaptive / enabled / disabled | 关思考用 disabled |
| thinking_budget_tokens | —— | 仅 enabled 生效 | low≈4096 / high≈32768 |
| reasoning_effort | —— | none ~ xhigh | o 系列 / Responses API 支持 |
| temperature | 1 | 采样温度 | Kimi 强制 1.0 |
| max_tokens | 8192 | 单次回复最大 token | 长思考可提到 32768 |
| context_win | 24000 | 历史裁剪阈值 | 1m 上下文设 800000 |
| max_retries | 1 | 自动退避重试次数 | 不稳定渠道改 3 |
| connect_timeout | 5 | 连接超时秒 | 海外端点调大 |
| read_timeout | 30 | 流式读取超时秒 | 开思考须 180+ |
| stream | True | 是否走 SSE 流式 | CDN 截断时改 False |
| proxy | —— | 单 session 代理 | 海外端点加代理 |
DeepSeek 于 2026 年4月24日发布了 V4 系列模型,相比之前的 V3 / R1 有重大升级:
| 特性 | 说明 |
|---|---|
| 模型 | deepseek-v4-flash(免费/低价)和 deepseek-v4-pro(旗舰) |
| 上下文 | 1M tokens |
| 思考模式 | 默认开启,支持 reasoning_effort:high(默认)/ max |
| Tool Calling | ✅ 已完善,Agent 场景可用 |
| 兼容性 | OpenAI SDK 格式,base_url 为 https://api.deepseek.com(注意:不再带 /v1 后缀) |
⚠️ 旧配置迁移提醒:如果你之前用的是
deepseek-chat/deepseek-reasoner,官方已宣布这两个模型名将逐步弃用。它们目前等价于deepseek-v4-flash的非思考 / 思考模式。建议尽早迁移到新模型名。
native_oai_config_deepseek = { 'name': 'deepseek-v4', 'apikey': 'sk-<你的 DeepSeek API Key>', 'apibase': 'https://api.deepseek.com', # ⚠️ 不带 /v1 'model': 'deepseek-v4-pro', 'thinking_type': 'enabled', # 开启思考链(默认就是开) 'reasoning_effort': 'high', # high 或 max 'read_timeout': 180, # 思考模式耗时长,务必调大 'stream': True, # 推荐开启,实时显示回复 }
如何获取 API Key:前往 DeepSeek 开放平台 注册账号,在「API Keys」页面创建密钥即可。新用户通常有免费额度。
DeepSeek V4 支持 Anthropic 协议端点,GA 的 native_claude 接口对思考链和 Tool Calling 的处理更成熟,推荐优先使用此方式:
native_claude_config_deepseek = { 'name': 'deepseek-v4-native', 'apikey': 'sk-<你的 DeepSeek API Key>', 'apibase': 'https://api.deepseek.com/anthropic', # Anthropic 兼容端点 'model': 'deepseek-v4-pro', 'thinking_type': 'enabled', 'reasoning_effort': 'high', 'read_timeout': 180, 'stream': True, }
两种接口(OpenAI 格式 / Anthropic 格式)用同一个
sk-开头的 API Key,不需要另外申请。
Mixin配置模式:允许GA在模型断开后自动切换模型
一次配好主 + 备 + 兜底,任何一个 429/5xx/超时都自动切下一个:
mixin_config = { 'llm_nos': ['claude-main', 'claude-backup', 'gpt-backup'], # 按优先级 'max_retries': 10, # 整个 rotation 总重试上限 'base_delay': 0.5, # 秒,指数退避起始 'spring_back': 300, # 秒,切到备用后多久尝试回到主 }
约束:llm_nos 中的名字必须精确匹配到其他 config 的 name 字段;所有被引用的 session 必须同属 Native 系列(NativeClaude + NativeOAI 可混)或全不属 Native 系列。
在终端中执行:
# 1. cd 到项目目录 cd "你的GenericAgent路径" # 2. 启动 python launch.pyw
如果是windows系统,可以双击launch.pyw启动。
看到浏览器弹出 Streamlit 聊天界面(或 pywebview 窗口),就说明启动成功了。如果用命令行模式
python agentmain.py,终端出现>>>提示符即为正常。
启动后,在对话框输入一句话,GA 会自己读代码、找出需要的包、全部装好:
请查看你的代码,安装所有用得上的 python 依赖
建立 Git 连接(方便以后更新代码):
请帮我建立 git 连接,方便以后更新代码
GA 会自动配好。如果你电脑上没有 Git,它也会帮你下载 portable 版。
创建桌面快捷方式(以后双击图标就能启动):
请帮我在桌面创建一个 launch.pyw 的快捷方式
hub.pyw 是 GA 的总控台——一键启动/停止所有后台服务,并实时查看日志。
启动方式:在终端执行 python3 hub.pyw,或直接双击 hub.pyw 文件。勾选想启动的服务即可,不用记命令行参数。
Hub 可管理的服务列表(点击展开)
| # | 服务名 | 角色 | 启动命令 |
|---|---|---|---|
| 1 | reflect/autonomous.py | 自主行动反射器:30 分钟无输入自动触发 | python agentmain.py --reflect reflect/autonomous.py |
| 2 | reflect/scheduler.py | 定时任务调度器 + L4 会话归档 | python agentmain.py --reflect reflect/scheduler.py |
| 3 | frontends/dingtalkapp.py | 钉钉机器人 | python frontends/dingtalkapp.py |
| 4 | frontends/fsapp.py | 飞书 / Lark 机器人 | python frontends/fsapp.py |
| 5 | frontends/qqapp.py | QQ 开放平台机器人 | python frontends/qqapp.py |
| 6 | frontends/qtapp.py | PySide6 桌面悬浮球 | python frontends/qtapp.py |
| 7 | frontends/stapp.py | 默认 Streamlit Web UI | python -m streamlit run frontends/stapp.py |
| 8 | frontends/stapp2.py | Anthropic 风格 Streamlit UI | python -m streamlit run frontends/stapp2.py |
| 9 | frontends/tgapp.py | Telegram 机器人 | python frontends/tgapp.py |
| 10 | frontends/wechatapp.py | 个人微信(首次扫码登录) | python frontends/wechatapp.py |
| 11 | frontends/wecomapp.py | 企业微信机器人 | python frontends/wecomapp.py |
原因:你的 mykey.py 中使用了非 Native 前缀的变量名(如 oai_config、claude_config),走的是旧版文本协议,部分模型在该协议下工具调用不稳定。
解决方法:把变量名前缀改成 native_ 开头:
| 改之前 | 改之后 |
|---|---|
claude_config |
native_claude_config |
oai_config |
native_oai_config |
改完重启 GA 即可。Native 协议使用模型原生的 tool use 格式,工具调用更稳定。
常见原因(按发生概率):
pywebview / streamlit / PySide6 还没跟进排查步骤:
# 1. 看 Python 版本(建议 3.11 或 3.12) python --version # 2. 手动起 agentmain 看报错 cd <你的 GenericAgent 目录> python agentmain.py # 3. 看 launch.pyw 报什么(改后缀为 .py 才能看 stderr) python launch.py
修复方法:
mykey.py 里只保留一个启用的 config,其他全部用 # 注释pip install 装的是 Python 第三方包(依赖),不是 GenericAgent 本体。GenericAgent 是一个 GitHub 仓库,必须手动下载 + 解压。
正确步骤:
D:\GenericAgent)cd D:\GenericAgentpython agentmain.py永久解决:让 GA 给你建桌面快捷方式(见 1.5 节折叠块"可选:让 GA 帮你做的事"),之后双击图标即可启动。
| 项目 | DinTalClaw 懒人包 | 命令行安装 |
|---|---|---|
| 便利性 | 解压即用,内置 Python + 依赖 | 需装 Python、pip install |
| 体积 | 约 500MB | 约 50MB 源码 + 按需依赖 |
| 版本 | 锁定某个 commit,可能落后 | 跟进最新 git |
| 自我升级 | 不能直接 git pull | 可以 git pull 或让 GA 自己更新 |
| 修改源码 | 需手动找到解包后的 python 环境 | 改完即生效 |
建议:想快速体验选懒人包;想长期用选命令行 + git clone。
不能。 Python 3.9+ 已官方放弃 Win7,pywebview 依赖的 WebView2 也装不上。
临时方案:Win7 上用命令行模式 + Python 3.8,只跑 agentmain.py,不启 launch.pyw。但很多前端也跑不起来,强烈建议升级到 Win10/11。
| 现象 | 判定 |
|---|---|
命令行出现 >>> 提示符,敲字能触发 [LLM Running...] |
✅ CLI 正常 |
| 浏览器 / pywebview 窗口出现 Streamlit 聊天界面 | ✅ GUI 正常 |
| 终端一直没输出 | ❌ 卡在 import 或 mykey 配置 |
| 界面有但模型选择列表为空 | ⚠ mykey.py 没有可用 LLM 配置 |
"界面不一样"通常是两种 Streamlit 前端:stapp.py(默认界面)和 stapp2.py(Anthropic 风格浅色主题),二者均正常,选你喜欢的即可。
能! 两种方式:
方式 A · 手动:
cd <GenericAgent 目录> git pull
若是 Download ZIP 安装的,没有 .git 目录,就到 GitHub 重新下 ZIP 覆盖。
方式 B · 让 GA 自己更新(推荐):
请帮我建立 git 连接,方便以后更新代码
之后任何时候输入:
请 git 更新你的代码,然后看看 commit 有什么新功能
GA 会自己 git pull + 解读 commit log + 汇报给你。
默认 chat_completions 即可。 只有两种情况改 responses:
/v1/responses 端点且想传 reasoning.effort 结构化参数native_oai_config_responses = { ... 'api_mode': 'responses', 'reasoning_effort': 'high', }
能,两个层面:
'max_retries': 3(默认 1),加大即可mixin_config 的 max_retries(整个 rotation 总重试)native_claude_config = { ... 'max_retries': 5, # 429/5xx/超时自动退避重试 'connect_timeout': 10, # 连接超时 5 → 10 秒 'read_timeout': 180, # 流式读取 30 → 180 秒(思考模式必须加大) }
通常不需要。 默认 context_win=24000(NativeClaude 默认 28000),这只是历史裁剪阈值,不是模型硬上限。
什么时候要改:
'model': 'claude-opus-4-6[1m]' + 'context_win': 800000'context_win': 100000'context_win': 6000| 内容 | 路径 |
|---|---|
| API 密钥配置模板 | mykey_template.py |
| API 密钥配置(你自己创建) | mykey.py |
| 主启动脚本 | launch.pyw |
| 服务总控台 | hub.pyw |
| CLI 入口 | agentmain.py |
| 默认 Web UI | frontends/stapp.py |
| Anthropic 风格 Web UI | frontends/stapp2.py |
pip install streamlit pywebviewmykey_template.py 为 mykey.py,填好 apikey 和 apibase 即可