基础
Agent loop
智能体式循环是智能体完整的“真实”运行:接收 → 上下文组装 → 模型推理 → 工具执行 → 流式回复 → 持久化。它是把消息转化为操作和最终回复的权威路径, 同时保持会话状态一致。
在 OpenClaw 中,一个循环是每个会话一次串行化运行,会在模型思考、调用工具和流式输出时 发出生命周期事件和流事件。本文档说明这个真实循环如何端到端地接线。
入口点
- Gateway 网关 RPC:
agent和agent.wait。 - CLI:
agent命令。
工作原理(高层)
agentRPC 校验参数,解析会话(sessionKey/sessionId),持久化会话元数据,并立即返回{ runId, acceptedAt }。agentCommand运行智能体:- 解析模型 + thinking/verbose/trace 默认值
- 加载 Skills 快照
- 调用
runEmbeddedPiAgent(pi-agent-core 运行时) - 如果嵌入式循环未发出生命周期 end/error,则发出 生命周期 end/error
runEmbeddedPiAgent:- 通过每会话 + 全局队列串行化运行
- 解析模型 + auth profile,并构建 pi 会话
- 订阅 pi 事件并流式传输 assistant/tool 增量
- 强制执行超时 -> 超时后中止运行
- 对于 Codex app-server 轮次,如果已接受的轮次在终端事件前停止产生 app-server 进度,则中止该轮次
- 返回载荷 + 使用量元数据
subscribeEmbeddedPiSession将 pi-agent-core 事件桥接到 OpenClawagent流:- 工具事件 =>
stream: "tool" - assistant 增量 =>
stream: "assistant" - 生命周期事件 =>
stream: "lifecycle"(phase: "start" | "end" | "error")
- 工具事件 =>
agent.wait使用waitForAgentRun:- 等待
runId的 生命周期 end/error - 返回
{ status: ok|error|timeout, startedAt, endedAt, error? }
- 等待
排队 + 并发
- 运行按会话键(会话通道)串行化,并可选择经过全局通道。
- 这会防止工具/会话竞争,并保持会话历史一致。
- 消息渠道可以选择队列模式(collect/steer/followup),并把它们送入这个通道系统。 参见 命令队列。
- 转录写入也受会话文件上的会话写入锁保护。该锁感知进程并基于文件,因此能捕获绕过进程内队列或来自其他进程的写入者。会话转录写入者最多等待
session.writeLock.acquireTimeoutMs,之后才会报告会话忙;默认值为60000ms。 - 会话写入锁默认不可重入。如果某个 helper 有意在保留同一个逻辑写入者的同时嵌套获取同一把锁,它必须用
allowReentrant: true显式选择加入。
会话 + 工作区准备
- 解析并创建工作区;沙箱隔离运行可能会重定向到沙箱工作区根目录。
- 加载 Skills(或从快照复用),并注入到环境和提示词中。
- 解析 bootstrap/context 文件,并注入到系统提示词报告中。
- 获取会话写入锁;在流式传输前打开并准备
SessionManager。任何后续转录重写、压缩或截断路径,都必须在打开或修改转录文件前获取同一把锁。
提示词组装 + 系统提示词
- 系统提示词由 OpenClaw 的基础提示词、Skills 提示词、bootstrap 上下文和每次运行覆盖项构建。
- 强制执行模型特定限制和压缩预留 token。
- 参见系统提示词,了解模型会看到什么。
钩子点(你可以拦截的位置)
OpenClaw 有两个钩子系统:
- 内部钩子(Gateway 网关钩子):用于命令和生命周期事件的事件驱动脚本。
- 插件钩子:智能体/工具生命周期和 Gateway 网关流水线中的扩展点。
内部钩子(Gateway 网关钩子)
agent:bootstrap:在系统提示词最终确定前构建 bootstrap 文件时运行。 用它来添加/移除 bootstrap 上下文文件。- 命令钩子:
/new、/reset、/stop以及其他命令事件(参见 Hooks 文档)。
参见 Hooks 获取设置和示例。
插件钩子(智能体 + Gateway 网关生命周期)
这些钩子在智能体循环或 Gateway 网关流水线内运行:
before_model_resolve:在会话前运行(没有messages),用于在模型解析前确定性地覆盖提供商/模型。before_prompt_build:在会话加载后运行(带有messages),用于在提交提示词前注入prependContext、systemPrompt、prependSystemContext或appendSystemContext。将prependContext用于每轮动态文本,将 system-context 字段用于应位于系统提示词空间中的稳定指导。before_agent_start:旧版兼容钩子,可能在任一阶段运行;优先使用上面的显式钩子。before_agent_reply:在内联操作之后、LLM 调用之前运行,让插件接管该轮并返回合成回复,或完全静默该轮。agent_end:完成后检查最终消息列表和运行元数据。before_compaction/after_compaction:观察或注释压缩周期。before_tool_call/after_tool_call:拦截工具参数/结果。before_install:检查内置扫描发现,并可选择阻止 Skills 或插件安装。tool_result_persist:在工具结果写入 OpenClaw 拥有的会话转录前,同步转换工具结果。message_received/message_sending/message_sent:入站 + 出站消息钩子。session_start/session_end:会话生命周期边界。gateway_start/gateway_stop:Gateway 网关生命周期事件。
出站/工具守卫的钩子决策规则:
before_tool_call:{ block: true }是终端结果,并会停止低优先级处理器。before_tool_call:{ block: false }是空操作,不会清除之前的阻止。before_install:{ block: true }是终端结果,并会停止低优先级处理器。before_install:{ block: false }是空操作,不会清除之前的阻止。message_sending:{ cancel: true }是终端结果,并会停止低优先级处理器。message_sending:{ cancel: false }是空操作,不会清除之前的取消。
参见插件钩子,了解钩子 API 和注册详情。
Harness 可能会以不同方式适配这些钩子。Codex app-server harness 将 OpenClaw 插件钩子作为已记录镜像表面的兼容性契约,而 Codex 原生钩子仍是独立的更低层 Codex 机制。
流式传输 + 部分回复
- assistant 增量从 pi-agent-core 流式传输,并作为
assistant事件发出。 - 分块流式传输可以在
text_end或message_end上发出部分回复。 - 推理流式传输可以作为单独流发出,也可以作为分块回复发出。
- 参见流式传输,了解分块和分块回复行为。
工具执行 + 消息工具
- 工具 start/update/end 事件会在
tool流上发出。 - 工具结果在记录/发出前会针对大小和图像载荷进行清理。
- 会跟踪消息工具发送,以抑制重复的 assistant 确认。
回复塑形 + 抑制
- 最终载荷由以下内容组装:
- assistant 文本(以及可选推理)
- 内联工具摘要(当 verbose + 允许时)
- 模型出错时的 assistant 错误文本
- 精确静默 token
NO_REPLY/no_reply会从出站载荷中过滤。 - 消息工具重复项会从最终载荷列表中移除。
- 如果没有剩余可渲染载荷且工具出错,则会发出 fallback 工具错误回复 (除非消息工具已经发送了用户可见回复)。
压缩 + 重试
- 自动压缩会发出
compaction流事件,并可能触发重试。 - 重试时,内存缓冲区和工具摘要会被重置,以避免重复输出。
- 参见压缩,了解压缩流水线。
事件流(当前)
lifecycle:由subscribeEmbeddedPiSession发出(并由agentCommand作为 fallback 发出)assistant:来自 pi-agent-core 的流式增量tool:来自 pi-agent-core 的流式工具事件
聊天渠道处理
- assistant 增量会缓冲到聊天
delta消息中。 - 聊天
final会在 生命周期 end/error 上发出。
超时
agent.wait默认值:30 秒(仅等待)。timeoutMs参数可覆盖。- 智能体运行时:
agents.defaults.timeoutSeconds默认值为 172800 秒(48 小时);在runEmbeddedPiAgent中通过中止计时器强制执行。 - Cron 运行时:隔离的智能体轮次
timeoutSeconds由 cron 拥有。调度器会在执行开始时启动该计时器,在配置的截止时间中止底层运行,然后在记录超时前运行有界清理,这样陈旧的子会话就不能让通道卡住。 - 会话活跃性诊断:启用诊断后,
diagnostics.stuckSessionWarnMs会分类长时间处于processing且没有观察到回复、工具、Status、block 或 ACP 进度的会话。活动的嵌入式运行、模型调用和工具调用会报告为session.long_running;没有近期进度的活动工作会报告为session.stalled;session.stuck保留用于没有活动工作的陈旧会话账本。陈旧会话账本会立即释放受影响的会话通道;停滞的嵌入式运行只有在diagnostics.stuckSessionAbortMs之后才会中止并排空(默认:至少 10 分钟且为警告阈值的 5 倍),这样排队工作可以恢复,而不会切断只是较慢的运行。恢复会发出结构化的 requested/completed 结果,并且只有在同一个处理 generation 仍是当前状态时,诊断状态才会标记为空闲。重复的session.stuck诊断会在会话保持不变时退避。 - 模型空闲超时:如果在空闲窗口前没有响应块到达,OpenClaw 会中止模型请求。
models.providers.<id>.timeoutSeconds会为较慢的本地/自托管提供商延长这个空闲看门狗;否则 OpenClaw 会在配置了agents.defaults.timeoutSeconds时使用它,默认上限为 120 秒。没有显式模型或智能体超时的 cron 触发运行会禁用空闲看门狗,并依赖 cron 外层超时。 - 提供商 HTTP 请求超时:
models.providers.<id>.timeoutSeconds适用于该提供商的模型 HTTP 获取,包括连接、headers、body、SDK 请求超时、总 guarded-fetch 中止处理以及模型流空闲看门狗。对于 Ollama 等较慢的本地/自托管提供商,请先使用此项,再提高整个智能体运行时超时。
可能提前结束的位置
- 智能体超时(中止)
- AbortSignal(取消)
- Gateway 网关断开连接或 RPC 超时
agent.wait超时(仅等待,不会停止智能体)
相关
- 工具 — 可用的智能体工具
- Hooks — 由智能体生命周期事件触发的事件驱动脚本
- 压缩 — 长对话如何被总结
- Exec Approvals — shell 命令的批准门禁
- 思考 — 思考/推理级别配置