第 1 章安装与环境配置

文档摘要

# 第 1 章安装与环境配置学完本章，你将拥有一个可以正常对话的 GenericAgent（GA）运行环境。学习目标在本地安装好 Python 并下载 GenericAgent 项目代码完成 API 密钥配置，让 GA 能连接大模型成功启动 GA 并完成第一次对话 1.1 安装 Python GA 依赖 Python 运行，我们先把它装好。 ⚠️ 推荐 Python 3.11 或 3.12。不要使用 3.14（与等依赖不兼容）。 Windows 打开下载链接：https://www.python.org/ftp/python/3.12.10/python-3.12.10-amd64.exe 运行安装包，底部的 "Add python.

第 1 章安装与环境配置

学完本章，你将拥有一个可以正常对话的 GenericAgent（GA）运行环境。

学习目标

在本地安装好 Python 并下载 GenericAgent 项目代码
完成 mykey.py API 密钥配置，让 GA 能连接大模型
成功启动 GA 并完成第一次对话

1.1 安装 Python

GA 依赖 Python 运行，我们先把它装好。

⚠️ 推荐 Python 3.11 或 3.12。不要使用 3.14（与 pywebview 等依赖不兼容）。

Windows

打开下载链接：https://www.python.org/ftp/python/3.12.10/python-3.12.10-amd64.exe
运行安装包，底部的 "Add python.exe to PATH" 一定要勾上，然后点击安装
验证安装：按 Win + R 输入 cmd 打开终端，输入：


   python --version

看到 Python 3.x.x 就说明安装成功了。

macOS

macOS 和大多数 Linux 发行版自带 Python 3，打开终端（Terminal）验证：


python3 --version

看到 Python 3.x.x（3.11 或 3.12）即可。如果版本低于 3.10，前往 Python 官网下载安装。

打开下载链接：https://www.python.org/ftp/python/3.12.10/python-3.12.10-macos11.pkg
运行安装包，一步一步跟着流程安装即可
验证安装：打开系统自带终端，输入：


python3 --version

看到 Python 3.x.x 就说明安装成功了。

1.2 下载项目

我们需要把 GenericAgent 的代码下载到本地。两种方式任选其一：

方式一：下载 ZIP（推荐新手）

打开 GitHub 仓库页面
点绿色 Code 按钮 → Download ZIP
解压到你喜欢的位置（例如 D:\GenericAgent）

方式二：Git Clone

如果已经安装了 Git，在终端执行：


git clone https://github.com/lsdefine/GenericAgent.git

1.3 安装最小依赖

打开终端，进入项目目录(运行以下命令)，安装两个核心依赖：


# 1. cd 到下载的 GA 文件目录
cd d:     (如果你的安装地址在D盘，终端打开后默认在c盘,安装在c盘跳过此步骤，仅限windows用户)
cd "你的GenericAgent路径"               （示例： cd D:/Document/GenericAgent-main） 

# 2. 安装最小环境依赖
pip install streamlit pywebview
# 如果你的 Python 3 对应 pip3，则用：pip3 install streamlit pywebview

其余依赖不用手动装——1.5 节会教你让 GA 自己把剩余的包全装好。

1.4 配置 API 密钥（mykey.py）

GA 需要连接大模型才能工作。我们通过 mykey.py 告诉它用哪个模型、怎么连。

mykey 配置最简流程（5 步搞定）

如果你是第一次接触，只需要跟着下面 5 步做：

第 1 步：复制模板文件
进入你下载的 GenericAgent 项目文件夹，找到 mykey_template.py 这个文件，复制一份，然后把副本重命名为 mykey.py。

第 2 步：编辑 mykey.py，填入你的 API 信息
用任意文本编辑器（记事本、VS Code 都行）打开 mykey.py。先找到 mykey 里你要用的模型 API 对应的格式模板，然后照着填。你会看到里面有很多 # 开头的行——这些是注释，程序运行时会自动忽略它们，相当于"说明书"。

填写 API 信息有两种方式，任选其一：

方式 A：找到对应的配置区域，把你的 API Key、地址等信息填好后，删掉该行最前面的所有 # 号，让这一行变成"真正的代码"。

方式 B：不动原来的注释，直接在文件里另起一行，把你的配置写上去（不加 #）。

简单来说：有 # 的行 = 不生效，没有 # 的行 = 会生效。

第 3 步：多个 API 怎么切换？
如果你填了不止一个 API 配置，GA 默认使用文件里第一个生效的配置（即第一个没被 # 注释掉的配置）。想切换模型有两种办法：

办法 A：启动 GA 后，点击界面侧边栏的切换模型按钮，直接切。

办法 B：回到 mykey.py，把你想用的那组配置挪到所有生效配置的最前面，保存后重启 GA。

第 4 步：保存文件
改完以后一定要保存！快捷键：Windows 按 Ctrl + S，Mac 按 Cmd + S。

第 5 步：重启 GA
每次修改 mykey.py 后，都需要关掉 GA 再重新启动，新的配置才会生效。

下面是更详细的配置说明和各渠道的具体写法：

进入项目文件夹，把 mykey_template.py 复制一份，重命名为 mykey.py
用任意文本编辑器打开 mykey.py，填入你的 API 信息。选一种填就行，不用的配置可以删掉或留着不管

新手推荐配置：Claude 主力 + GPT 兜底

直接复制到 mykey.py，替换两个 apikey / apibase：


# ── 主力：Claude Opus 4.6（CC switch 反代（Reverse Proxy），最常见）──
native_claude_config0 = {
    'name': 'claude-main',                        # /llms 显示名 & mixin 引用名
    'apikey': 'sk-user-<你的relay-key>',          # 非 sk-ant- 前缀 → Bearer 鉴权
    'apibase': 'https://<your-cc-switch-host>/claude/office',  # CC switch 端点
    'model': 'claude-opus-4-6',                
    'fake_cc_system_prompt': True,                # CC 透传渠道必须置 True
    'thinking_type': 'adaptive',               # 某些渠道必须要求填thinking_type字段
    'max_retries': 3,
    'read_timeout': 180,
}

# ── 备选：GPT-5.4 做兜底 ──
native_oai_config = {
    'name': 'gpt-backup',
    'apikey': 'sk-<你的 OpenAI key>',
    'apibase': 'https://api.openai.com/v1',
    'model': 'gpt-5.4',
    'reasoning_effort': 'high',
    'max_retries': 3,
    'read_timeout': 120,
}

# ── Mixin 自动切换（Failover）──
mixin_config = {
    'llm_nos': ['claude-main', 'gpt-backup'],
    'max_retries': 10,
    'base_delay': 0.5,
    'spring_back': 300,
}

每次启动GA默认读的是第一个api信息。可以点击设置切换。

所有内置渠道一览（点击展开）

一线直连渠道（填 apikey / apibase 即用）

渠道	推荐变量名	apikey 形式	apibase	示例 model	备注
Anthropic 官方	native_claude_config_anthropic	sk-ant-xxx	https://api.anthropic.com	claude-opus-4-6[1m]	sk-ant- 前缀自动切 x-api-key 鉴权
OpenAI 官方	native_oai_config	sk-proj-xxx	https://api.openai.com/v1	gpt-5.4	支持 api_mode: 'responses'
OpenRouter	oai_config_openrouter	sk-or-xxx	https://openrouter.ai/api/v1	anthropic/claude-opus-4-6	model 用 provider/model 格式
智谱 GLM-5.1	native_claude_glm_config	xxx.yyy	https://open.bigmodel.cn/api/anthropic	glm-5.1	推荐用 Anthropic 路径
MiniMax（Anthropic）	native_claude_config_minimax	sk-xxx	https://api.minimaxi.com/anthropic	MiniMax-M2.7	204K 上下文
MiniMax（OAI）	oai_config_minimax	sk-cp-xxx	https://api.minimaxi.com/v1	MiniMax-M2.7	回复带 think 标签
Moonshot / Kimi	oai_config_kimi	sk-xxx	https://api.moonshot.cn/v1	kimi-k2-turbo-preview	温度强制 1.0
DeepSeek V4	native_oai_config_deepseek	sk-xxx	https://api.deepseek.com	deepseek-v4-pro	⚠️ 不带 /v1
阶跃星辰	oai_config_stepfun	xxx.yyy	https://api.stepfun.com/v1	step-2-16k	OAI 兼容
豆包 / 火山引擎	oai_config_volcengine	xxx-xxx	https://ark.cn-beijing.volces.com/api/v3	doubao-seed-1-8	OAI 兼容
硅基流动	oai_config_siliconflow	sk-xxx	https://api.siliconflow.cn/v1	deepseek-ai/DeepSeek-V3	新用户 16 元免费额度

反代 / 透传类渠道（需要 `fake_cc_system_prompt = True`）

渠道类型	推荐变量名	apibase	示例 model	备注
CC Switch（最常见）	native_claude_config0	https://host/claude/office	claude-opus-4-6	多数中文低价站走此协议
CRS 反代	native_claude_config_crs	https://host/api	claude-opus-4-6[1m]	CRS 官方协议
AnyRouter	native_claude_config_anyrouter	https://host/v1	claude-opus-4-6	与 CC switch 同协议族
Sider（订阅桥接）	sider_cookie	自动	gpt-5.4 / claude-opus-4-6	没有 API 时的兜底

本地模型

方案	推荐变量名	apibase	示例 model	备注
Ollama	native_oai_ollama	`http://127.0.0.1:11434/v1`	qwen2.5:14b	末尾 /v1 不能漏
llama.cpp	oai_config_llamacpp	`http://127.0.0.1:8080/v1`	default	建议走文本协议
vLLM	native_oai_vllm	`http://127.0.0.1:8000/v1`	你 load 的模型 id	需支持 function calling
LM Studio	oai_config_lmstudio	`http://localhost:1234/v1`	LM Studio 模型 id	GUI 本地部署最省心

⚙️ 关键可调字段速查（点击展开）

字段	默认	作用	何时要改
name	取 model	显示名 & mixin 引用名	有 mixin 时建议显式填
apikey	——	鉴权 Key	必填
apibase	——	API 端点地址	必填
model	——	模型名，后缀 [1m] 触发 1m 上下文	必填
fake_cc_system_prompt	False	伪装 Claude Code CLI 指纹	CC switch / CRS 必须 True
api_mode	chat_completions	可选 responses	⚠️GPT-5.4 只能走 `responses`，必须显式设置
thinking_type	adaptive	adaptive / enabled / disabled	关思考用 disabled
thinking_budget_tokens	——	仅 enabled 生效	low≈4096 / high≈32768
reasoning_effort	——	none ~ xhigh	o 系列 / Responses API 支持
temperature	1	采样温度	Kimi 强制 1.0
max_tokens	8192	单次回复最大 token	长思考可提到 32768
context_win	24000	历史裁剪阈值	1m 上下文设 800000
max_retries	1	自动退避重试次数	不稳定渠道改 3
connect_timeout	5	连接超时秒	海外端点调大
read_timeout	30	流式读取超时秒	开思考须 180+
stream	True	是否走 SSE 流式	CDN 截断时改 False
proxy	——	单 session 代理	海外端点加代理

DeepSeek V4 接入配置

DeepSeek 于 2026 年4月24日发布了 V4 系列模型，相比之前的 V3 / R1 有重大升级：

特性	说明
模型	`deepseek-v4-flash`（免费/低价）和 `deepseek-v4-pro`（旗舰）
上下文	1M tokens
思考模式	默认开启，支持 `reasoning_effort`：`high`（默认）/ `max`
Tool Calling	✅ 已完善，Agent 场景可用
兼容性	OpenAI SDK 格式，`base_url` 为 `https://api.deepseek.com`（注意：不再带 `/v1` 后缀）

⚠️ 旧配置迁移提醒：如果你之前用的是 deepseek-chat / deepseek-reasoner，官方已宣布这两个模型名将逐步弃用。它们目前等价于 deepseek-v4-flash 的非思考 / 思考模式。建议尽早迁移到新模型名。

最简配置（推荐 V4-Pro）


native_oai_config_deepseek = {
    'name': 'deepseek-v4',
    'apikey': 'sk-<你的 DeepSeek API Key>',
    'apibase': 'https://api.deepseek.com',           # ⚠️ 不带 /v1
    'model': 'deepseek-v4-pro',
    'thinking_type': 'enabled',                      # 开启思考链（默认就是开）
    'reasoning_effort': 'high',                      # high 或 max
    'read_timeout': 180,                             # 思考模式耗时长，务必调大
    'stream': True,                                  # 推荐开启，实时显示回复
}

如何获取 API Key：前往 DeepSeek 开放平台注册账号，在「API Keys」页面创建密钥即可。新用户通常有免费额度。

Native Claude 接口配置（推荐）

DeepSeek V4 支持 Anthropic 协议端点，GA 的 native_claude 接口对思考链和 Tool Calling 的处理更成熟，推荐优先使用此方式：


native_claude_config_deepseek = {
    'name': 'deepseek-v4-native',
    'apikey': 'sk-<你的 DeepSeek API Key>',
    'apibase': 'https://api.deepseek.com/anthropic',  # Anthropic 兼容端点
    'model': 'deepseek-v4-pro',
    'thinking_type': 'enabled',
    'reasoning_effort': 'high',
    'read_timeout': 180,
    'stream': True,
}

两种接口（OpenAI 格式 / Anthropic 格式）用同一个 sk- 开头的 API Key，不需要另外申请。

Mixin配置模式：允许GA在模型断开后自动切换模型

一次配好主 + 备 + 兜底，任何一个 429/5xx/超时都自动切下一个：


mixin_config = {
    'llm_nos': ['claude-main', 'claude-backup', 'gpt-backup'],  # 按优先级
    'max_retries': 10,      # 整个 rotation 总重试上限
    'base_delay': 0.5,      # 秒，指数退避起始
    'spring_back': 300,     # 秒，切到备用后多久尝试回到主
}

约束：llm_nos 中的名字必须精确匹配到其他 config 的 name 字段；所有被引用的 session 必须同属 Native 系列（NativeClaude + NativeOAI 可混）或全不属 Native 系列。

1.5 启动 GenericAgent

首次启动

在终端中执行：


# 1. cd 到项目目录
cd "你的GenericAgent路径"

# 2. 启动
python launch.pyw

如果是windows系统，可以双击launch.pyw启动。

看到浏览器弹出 Streamlit 聊天界面（或 pywebview 窗口），就说明启动成功了。如果用命令行模式 python agentmain.py，终端出现 >>> 提示符即为正常。

让 GA 自动安装剩余依赖

启动后，在对话框输入一句话，GA 会自己读代码、找出需要的包、全部装好：


请查看你的代码，安装所有用得上的 python 依赖

️ 推荐：提升使用体验的两个任务

建立 Git 连接（方便以后更新代码）：


请帮我建立 git 连接，方便以后更新代码

GA 会自动配好。如果你电脑上没有 Git，它也会帮你下载 portable 版。

创建桌面快捷方式（以后双击图标就能启动）：


请帮我在桌面创建一个 launch.pyw 的快捷方式

使用 Hub 总控台（可选）

hub.pyw 是 GA 的总控台——一键启动/停止所有后台服务，并实时查看日志。

启动方式：在终端执行 python3 hub.pyw，或直接双击 hub.pyw 文件。勾选想启动的服务即可，不用记命令行参数。

Hub 可管理的服务列表（点击展开）

#	服务名	角色	启动命令
1	reflect/autonomous.py	自主行动反射器：30 分钟无输入自动触发	python agentmain.py --reflect reflect/autonomous.py
2	reflect/scheduler.py	定时任务调度器 + L4 会话归档	python agentmain.py --reflect reflect/scheduler.py
3	frontends/dingtalkapp.py	钉钉机器人	python frontends/dingtalkapp.py
4	frontends/fsapp.py	飞书 / Lark 机器人	python frontends/fsapp.py
5	frontends/qqapp.py	QQ 开放平台机器人	python frontends/qqapp.py
6	frontends/qtapp.py	PySide6 桌面悬浮球	python frontends/qtapp.py
7	frontends/stapp.py	默认 Streamlit Web UI	python -m streamlit run frontends/stapp.py
8	frontends/stapp2.py	Anthropic 风格 Streamlit UI	python -m streamlit run frontends/stapp2.py
9	frontends/tgapp.py	Telegram 机器人	python frontends/tgapp.py
10	frontends/wechatapp.py	个人微信（首次扫码登录）	python frontends/wechatapp.py
11	frontends/wecomapp.py	企业微信机器人	python frontends/wecomapp.py

1.6 常见问题排查

Q1: GA 调用工具时输出一大堆乱码 / 不会调用工具了？

原因：你的 mykey.py 中使用了非 Native 前缀的变量名（如 oai_config、claude_config），走的是旧版文本协议，部分模型在该协议下工具调用不稳定。

解决方法：把变量名前缀改成 native_ 开头：

改之前	改之后
`claude_config`	`native_claude_config`
`oai_config`	`native_oai_config`

改完重启 GA 即可。Native 协议使用模型原生的 tool use 格式，工具调用更稳定。

Q2: Windows 安装后闪退 / 重启后无法启动？

常见原因（按发生概率）：

Python 版本不对：装了 3.14，pywebview / streamlit / PySide6 还没跟进
Python 没加 PATH：安装时 "Add Python to PATH" 没勾
pip 依赖装了一半：中途断网或关窗，导致包半装
mykey.py 配置写错：变量名冲突让整个模块 import 失败

排查步骤：


# 1. 看 Python 版本（建议 3.11 或 3.12）
python --version

# 2. 手动起 agentmain 看报错
cd <你的 GenericAgent 目录>
python agentmain.py

# 3. 看 launch.pyw 报什么（改后缀为 .py 才能看 stderr）
python launch.py

修复方法：

卸载 3.14，装 Python 3.12，安装时勾 Add Python to PATH
mykey.py 里只保留一个启用的 config，其他全部用 # 注释
让 GA 自己补依赖（见 1.5 节"让 GA 自动安装剩余依赖"）

Q3: pip 装完后不知道在哪运行 / 不知道 cd 到哪？

pip install 装的是 Python 第三方包（依赖），不是 GenericAgent 本体。GenericAgent 是一个 GitHub 仓库，必须手动下载 + 解压。

正确步骤：

打开 https://github.com/lsdefine/GenericAgent
绿色 Code 按钮 → Download ZIP
解压到你喜欢的位置（例如 D:\GenericAgent）
终端里 cd D:\GenericAgent
python agentmain.py

永久解决：让 GA 给你建桌面快捷方式（见 1.5 节折叠块"可选：让 GA 帮你做的事"），之后双击图标即可启动。

Q4: DinTalClaw 懒人包和命令行安装有什么区别？

项目	DinTalClaw 懒人包	命令行安装
便利性	解压即用，内置 Python + 依赖	需装 Python、pip install
体积	约 500MB	约 50MB 源码 + 按需依赖
版本	锁定某个 commit，可能落后	跟进最新 git
自我升级	不能直接 git pull	可以 git pull 或让 GA 自己更新
修改源码	需手动找到解包后的 python 环境	改完即生效

建议：想快速体验选懒人包；想长期用选命令行 + git clone。

Q5: 能否支持 Win7？

不能。 Python 3.9+ 已官方放弃 Win7，pywebview 依赖的 WebView2 也装不上。

临时方案：Win7 上用命令行模式 + Python 3.8，只跑 agentmain.py，不启 launch.pyw。但很多前端也跑不起来，强烈建议升级到 Win10/11。

Q6: 怎样判断是否正常启动了？界面和别人的不一样

现象	判定
命令行出现 `>>>` 提示符，敲字能触发 `[LLM Running...]`	✅ CLI 正常
浏览器 / pywebview 窗口出现 Streamlit 聊天界面	✅ GUI 正常
终端一直没输出	❌ 卡在 import 或 mykey 配置
界面有但模型选择列表为空	⚠ mykey.py 没有可用 LLM 配置

"界面不一样"通常是两种 Streamlit 前端：stapp.py（默认界面）和 stapp2.py（Anthropic 风格浅色主题），二者均正常，选你喜欢的即可。

Q7: 如何更新到最新版本？能让 GA 自己更新吗？

能！两种方式：

方式 A · 手动：


cd <GenericAgent 目录>
git pull

若是 Download ZIP 安装的，没有 .git 目录，就到 GitHub 重新下 ZIP 覆盖。

方式 B · 让 GA 自己更新（推荐）：


请帮我建立 git 连接，方便以后更新代码

之后任何时候输入：


请 git 更新你的代码，然后看看 commit 有什么新功能

GA 会自己 git pull + 解读 commit log + 汇报给你。

Q8: API mode 需要改成 responses 吗？

默认 chat_completions 即可。 只有两种情况改 responses：

你用的是 OpenAI 官方 /v1/responses 端点且想传 reasoning.effort 结构化参数
上游渠道只开了 Responses API 没开 chat/completions


native_oai_config_responses = {
    ...
    'api_mode': 'responses',
    'reasoning_effort': 'high',
}

Q9: API 繁忙 / 高峰期失败一次就停，能配重试吗？

能，两个层面：

单 session：'max_retries': 3（默认 1），加大即可
多 session fallback：用 mixin_config 的 max_retries（整个 rotation 总重试）


native_claude_config = {
    ...
    'max_retries': 5,       # 429/5xx/超时自动退避重试
    'connect_timeout': 10,  # 连接超时 5 → 10 秒
    'read_timeout': 180,    # 流式读取 30 → 180 秒（思考模式必须加大）
}

Q10: 接 API key 时需要配上下文长度吗？

通常不需要。 默认 context_win=24000（NativeClaude 默认 28000），这只是历史裁剪阈值，不是模型硬上限。

什么时候要改：

用 1M 上下文 Claude 时：'model': 'claude-opus-4-6[1m]' + 'context_win': 800000
MiniMax 204K：'context_win': 100000
本地小模型 8K：'context_win': 6000

相关文件速查

内容	路径
API 密钥配置模板	`mykey_template.py`
API 密钥配置（你自己创建）	`mykey.py`
主启动脚本	`launch.pyw`
服务总控台	`hub.pyw`
CLI 入口	`agentmain.py`
默认 Web UI	`frontends/stapp.py`
Anthropic 风格 Web UI	`frontends/stapp2.py`

小结

环境三步走：装 Python 3.11/3.12 → 下载项目 → pip install streamlit pywebview
配置只需一个文件：复制 mykey_template.py 为 mykey.py，填好 apikey 和 apibase 即可
启动后让 GA 自己装剩余依赖，不用手动折腾

下一章：第 2 章浏览器能力解锁

第 1 章 安装与环境配置

文档摘要

第 1 章 安装与环境配置

学习目标

1.1 安装 Python

Windows

macOS

1.2 下载项目

1.3 安装最小依赖

1.4 配置 API 密钥（mykey.py）

mykey 配置最简流程（5 步搞定）

新手推荐配置：Claude 主力 + GPT 兜底

一线直连渠道（填 apikey / apibase 即用）

反代 / 透传类渠道（需要 fake_cc_system_prompt = True）

本地模型

DeepSeek V4 接入配置

最简配置（推荐 V4-Pro）

Native Claude 接口配置（推荐）

1.5 启动 GenericAgent

首次启动

让 GA 自动安装剩余依赖

️ 推荐：提升使用体验的两个任务

使用 Hub 总控台（可选）

1.6 常见问题排查

小结

第 1 章安装与环境配置

第 1 章安装与环境配置

反代 / 透传类渠道（需要 `fake_cc_system_prompt = True`）