第2章:Loop Engineering 核心架构详解 导读:本章深入 Loop Engineering 的核心架构。你将理解循环的四大阶段(Discover → Plan → Execute → Verify)如何协同工作,掌握六大基础设施原语的设计理念,学会区分开放循环与闭合循环的适用场景,并深入理解为什么验证器是整个系统的关键瓶颈。 2.1 架构全景:从 10,000 英尺高空俯瞰 Loop Engineering 的核心架构可以用一个简洁的模型来描述:一个循环、四个阶段、六大原语、两条路径。 这个架构图揭示了 Loop Engineering 的精妙之处:循环本身是通用的,但具体行为由六大基础设施原语决定。不同的原语组合,可以构建出功能完全不同的循环系统。 2.
导读:本章深入 Loop Engineering 的核心架构。你将理解循环的四大阶段(Discover → Plan → Execute → Verify)如何协同工作,掌握六大基础设施原语的设计理念,学会区分开放循环与闭合循环的适用场景,并深入理解为什么验证器是整个系统的关键瓶颈。
Loop Engineering 的核心架构可以用一个简洁的模型来描述:一个循环、四个阶段、六大原语、两条路径。
这个架构图揭示了 Loop Engineering 的精妙之处:循环本身是通用的,但具体行为由六大基础设施原语决定。不同的原语组合,可以构建出功能完全不同的循环系统。
发现阶段是循环的起点。AI Agent 需要回答一个问题:"现在需要做什么?"
发现阶段的输入包括:
# Discover 阶段伪代码 def discover(context: Context) -> Task: # 检查是否有显式任务 if context.pending_tasks: return context.pending_tasks.pop(0) # 检查触发器 for trigger in context.triggers: if trigger.is_fired(): return trigger.to_task() # 检查状态偏差 diff = context.expected_state.diff(context.actual_state) if diff.significant(): return Task(description="修复状态偏差", details=diff) return None # 无任务,循环休眠
规划阶段将发现阶段的任务转化为可执行的步骤序列。这不是简单的"写个计划",而是一个带有资源评估、依赖分析和风险预估的决策过程。
好的规划需要考虑:
执行阶段是 AI Agent 调用工具和原语,实际完成工作的阶段。这是 Agent 展现能力的地方,也是需要最多基础设施支持的阶段。
执行阶段的核心原则:
验证阶段是整个循环的质量守门人,也是最容易出问题的地方。验证器需要回答两个问题:
# Verify 阶段的三层验证模型 def verify(result: Result, goal: Goal) -> Verdict: # 第一层:自动化验证(快速、可靠) if not auto_checks_pass(result): return Verdict.REJECT # 明确失败,无需人工 # 第二层:AI 自验证(中等速度、可能出错) ai_quality = llm_evaluate(result, goal) if ai_quality.score < THRESHOLD: return Verdict.NEEDS_REVISION # 需要修改 # 第三层:人工验证(慢、但最可靠,仅开放循环需要) if is_open_loop: human_verdict = await request_human_review(result) return human_verdict return Verdict.ACCEPT
| 原语 | 功能 | 类比 | 核心设计原则 |
|---|---|---|---|
| Automations | 触发器与自动化规则 | 定时器和闹钟 | 声明式定义、可组合 |
| Worktrees | 隔离的工作空间 | 沙盒/分支 | 幂等、可回滚 |
| Skills | 可复用的能力模块 | 工具箱/技能书 | 自包含、可测试、可组合 |
| Connectors | 与外部系统的接口 | 线缆/适配器 | 标准化协议、断路器 |
| Sub-agents | 子代理(并行/专业化) | 外包团队 | 独立上下文、结果聚合 |
| External State | 持久化状态存储 | 黑板/共享内存 | 事务性、可恢复 |
六大原语不是孤立存在的,它们形成一个协作网络:
| 特性 | 开放循环 | 闭合循环 |
|---|---|---|
| 验证方式 | 人工参与关键验证 | 完全自动化验证 |
| 自主程度 | L1-L2(半自动到条件自动) | L3(全自动) |
| 适用场景 | 代码审查、内容发布、关键决策 | 测试、数据处理、日志分析 |
| 风险等级 | 低(有人工兜底) | 较高(依赖自动验证质量) |
| 吞吐量 | 受人工响应速度限制 | 可 7×24 不间断运行 |
| 典型错误 | 人工疲劳导致疏漏 | 验证器误判导致错误累积 |
选择建议:
验证器之所以是瓶颈,原因有三:
为了防止循环失控,每个 Loop 必须配置:
# 循环安全配置 loop: max_iterations: 10 # 最大迭代次数 max_duration: "30m" # 最大运行时间 max_token_budget: 50000 # Token 预算上限 circuit_breaker: consecutive_failures: 3 # 连续失败 N 次后熔断 error_rate_threshold: 0.5 # 错误率超过 50% 熔断 cooldown: "5m" # 熔断后冷却时间 escalation: # 熔断后升级策略 type: "human_notification" channel: "slack"
Q1:四大阶段是严格按顺序执行的吗?可以有并行吗?
标准循环是顺序的(Discover → Plan → Execute → Verify),但在 Execute 阶段内部,子任务可以并行。此外,多个循环实例之间天然可以并行。例如,你可以同时运行 3 个子代理,每个子代理运行独立的循环处理不同的子任务。关键是每个循环内部的四个阶段保持顺序依赖关系,因为 Verify 的结果决定了是否需要重新 Discover。
Q2:六大原语是否每次循环都需要全部配置?
不需要。原语是可选的、按需组合的。最简循环只需要 Skills(定义可执行的操作)和基本的验证逻辑。Automations 只在有定时或事件触发需求时配置,Worktrees 在需要隔离执行环境时配置,Connectors 在需要访问外部系统时配置,Sub-agents 在任务可并行时配置,External State 在需要跨循环持久化信息时配置。
Q3:验证器误判怎么办?如何平衡"不漏过错误"和"不误杀正确结果"?
这是一个经典的精确率与召回率权衡问题。实践中推荐的策略是:① 对高风险操作采用"宁可误杀"策略(高精确率);② 对低风险操作采用"宁可漏过"策略(高召回率);③ 引入"置信度阈值"——验证器给出置信度分数,在阈值附近的结果送人工复核。这种"三层验证模型"(自动验证→AI 验证→人工验证)是当前最佳的实践方案。
📖 导航:下一节 → 2.1 循环的四大阶段:发现、规划、执行、验证