基础

Agent loop

智能体式循环是智能体完整的“真实”运行：接收 → 上下文组装 → 模型推理 → 工具执行 → 流式回复 → 持久化。它是把消息转化为操作和最终回复的权威路径，同时保持会话状态一致。

在 OpenClaw 中，一个循环是每个会话一次串行化运行，会在模型思考、调用工具和流式输出时发出生命周期事件和流事件。本文档说明这个真实循环如何端到端地接线。

入口点

Gateway 网关 RPC：agent 和 agent.wait。
CLI：agent 命令。

工作原理（高层）

agent RPC 校验参数，解析会话（sessionKey/sessionId），持久化会话元数据，并立即返回 { runId, acceptedAt }。
agentCommand 运行智能体：
- 解析模型 + thinking/verbose/trace 默认值
- 加载 Skills 快照
- 调用 runEmbeddedPiAgent（pi-agent-core 运行时）
- 如果嵌入式循环未发出生命周期 end/error，则发出 生命周期 end/error
runEmbeddedPiAgent：
- 通过每会话 + 全局队列串行化运行
- 解析模型 + auth profile，并构建 pi 会话
- 订阅 pi 事件并流式传输 assistant/tool 增量
- 强制执行超时 -> 超时后中止运行
- 对于 Codex app-server 轮次，如果已接受的轮次在终端事件前停止产生 app-server 进度，则中止该轮次
- 返回载荷 + 使用量元数据
subscribeEmbeddedPiSession 将 pi-agent-core 事件桥接到 OpenClaw agent 流：
- 工具事件 => stream: "tool"
- assistant 增量 => stream: "assistant"
- 生命周期事件 => stream: "lifecycle"（phase: "start" | "end" | "error"）
agent.wait 使用 waitForAgentRun：
- 等待 runId 的 生命周期 end/error
- 返回 { status: ok|error|timeout, startedAt, endedAt, error? }

排队 + 并发

运行按会话键（会话通道）串行化，并可选择经过全局通道。
这会防止工具/会话竞争，并保持会话历史一致。
消息渠道可以选择队列模式（collect/steer/followup），并把它们送入这个通道系统。参见命令队列。
转录写入也受会话文件上的会话写入锁保护。该锁感知进程并基于文件，因此能捕获绕过进程内队列或来自其他进程的写入者。会话转录写入者最多等待 session.writeLock.acquireTimeoutMs，之后才会报告会话忙；默认值为 60000 ms。
会话写入锁默认不可重入。如果某个 helper 有意在保留同一个逻辑写入者的同时嵌套获取同一把锁，它必须用 allowReentrant: true 显式选择加入。

会话 + 工作区准备

解析并创建工作区；沙箱隔离运行可能会重定向到沙箱工作区根目录。
加载 Skills（或从快照复用），并注入到环境和提示词中。
解析 bootstrap/context 文件，并注入到系统提示词报告中。
获取会话写入锁；在流式传输前打开并准备 SessionManager。任何后续转录重写、压缩或截断路径，都必须在打开或修改转录文件前获取同一把锁。

提示词组装 + 系统提示词

系统提示词由 OpenClaw 的基础提示词、Skills 提示词、bootstrap 上下文和每次运行覆盖项构建。
强制执行模型特定限制和压缩预留 token。
参见系统提示词，了解模型会看到什么。

钩子点（你可以拦截的位置）

OpenClaw 有两个钩子系统：

内部钩子（Gateway 网关钩子）：用于命令和生命周期事件的事件驱动脚本。
插件钩子：智能体/工具生命周期和 Gateway 网关流水线中的扩展点。

内部钩子（Gateway 网关钩子）

agent:bootstrap：在系统提示词最终确定前构建 bootstrap 文件时运行。用它来添加/移除 bootstrap 上下文文件。
命令钩子：/new、/reset、/stop 以及其他命令事件（参见 Hooks 文档）。

参见 Hooks 获取设置和示例。

插件钩子（智能体 + Gateway 网关生命周期）

这些钩子在智能体循环或 Gateway 网关流水线内运行：

before_model_resolve：在会话前运行（没有 messages），用于在模型解析前确定性地覆盖提供商/模型。
before_prompt_build：在会话加载后运行（带有 messages），用于在提交提示词前注入 prependContext、systemPrompt、prependSystemContext 或 appendSystemContext。将 prependContext 用于每轮动态文本，将 system-context 字段用于应位于系统提示词空间中的稳定指导。
before_agent_start：旧版兼容钩子，可能在任一阶段运行；优先使用上面的显式钩子。
before_agent_reply：在内联操作之后、LLM 调用之前运行，让插件接管该轮并返回合成回复，或完全静默该轮。
agent_end：完成后检查最终消息列表和运行元数据。
before_compaction / after_compaction：观察或注释压缩周期。
before_tool_call / after_tool_call：拦截工具参数/结果。
before_install：检查内置扫描发现，并可选择阻止 Skills 或插件安装。
tool_result_persist：在工具结果写入 OpenClaw 拥有的会话转录前，同步转换工具结果。
message_received / message_sending / message_sent：入站 + 出站消息钩子。
session_start / session_end：会话生命周期边界。
gateway_start / gateway_stop：Gateway 网关生命周期事件。

出站/工具守卫的钩子决策规则：

before_tool_call：{ block: true } 是终端结果，并会停止低优先级处理器。
before_tool_call：{ block: false } 是空操作，不会清除之前的阻止。
before_install：{ block: true } 是终端结果，并会停止低优先级处理器。
before_install：{ block: false } 是空操作，不会清除之前的阻止。
message_sending：{ cancel: true } 是终端结果，并会停止低优先级处理器。
message_sending：{ cancel: false } 是空操作，不会清除之前的取消。

参见插件钩子，了解钩子 API 和注册详情。

Harness 可能会以不同方式适配这些钩子。Codex app-server harness 将 OpenClaw 插件钩子作为已记录镜像表面的兼容性契约，而 Codex 原生钩子仍是独立的更低层 Codex 机制。

流式传输 + 部分回复

assistant 增量从 pi-agent-core 流式传输，并作为 assistant 事件发出。
分块流式传输可以在 text_end 或 message_end 上发出部分回复。
推理流式传输可以作为单独流发出，也可以作为分块回复发出。
参见流式传输，了解分块和分块回复行为。

工具执行 + 消息工具

工具 start/update/end 事件会在 tool 流上发出。
工具结果在记录/发出前会针对大小和图像载荷进行清理。
会跟踪消息工具发送，以抑制重复的 assistant 确认。

回复塑形 + 抑制

最终载荷由以下内容组装：
- assistant 文本（以及可选推理）
- 内联工具摘要（当 verbose + 允许时）
- 模型出错时的 assistant 错误文本
精确静默 token NO_REPLY / no_reply 会从出站载荷中过滤。
消息工具重复项会从最终载荷列表中移除。
如果没有剩余可渲染载荷且工具出错，则会发出 fallback 工具错误回复（除非消息工具已经发送了用户可见回复）。

压缩 + 重试

自动压缩会发出 compaction 流事件，并可能触发重试。
重试时，内存缓冲区和工具摘要会被重置，以避免重复输出。
参见压缩，了解压缩流水线。

事件流（当前）

lifecycle：由 subscribeEmbeddedPiSession 发出（并由 agentCommand 作为 fallback 发出）
assistant：来自 pi-agent-core 的流式增量
tool：来自 pi-agent-core 的流式工具事件

聊天渠道处理

assistant 增量会缓冲到聊天 delta 消息中。
聊天 final 会在 生命周期 end/error 上发出。

超时

agent.wait 默认值：30 秒（仅等待）。timeoutMs 参数可覆盖。
智能体运行时：agents.defaults.timeoutSeconds 默认值为 172800 秒（48 小时）；在 runEmbeddedPiAgent 中通过中止计时器强制执行。
Cron 运行时：隔离的智能体轮次 timeoutSeconds 由 cron 拥有。调度器会在执行开始时启动该计时器，在配置的截止时间中止底层运行，然后在记录超时前运行有界清理，这样陈旧的子会话就不能让通道卡住。
会话活跃性诊断：启用诊断后，diagnostics.stuckSessionWarnMs 会分类长时间处于 processing 且没有观察到回复、工具、Status、block 或 ACP 进度的会话。活动的嵌入式运行、模型调用和工具调用会报告为 session.long_running；没有近期进度的活动工作会报告为 session.stalled；session.stuck 保留用于没有活动工作的陈旧会话账本。陈旧会话账本会立即释放受影响的会话通道；停滞的嵌入式运行只有在 diagnostics.stuckSessionAbortMs 之后才会中止并排空（默认：至少 10 分钟且为警告阈值的 5 倍），这样排队工作可以恢复，而不会切断只是较慢的运行。恢复会发出结构化的 requested/completed 结果，并且只有在同一个处理 generation 仍是当前状态时，诊断状态才会标记为空闲。重复的 session.stuck 诊断会在会话保持不变时退避。
模型空闲超时：如果在空闲窗口前没有响应块到达，OpenClaw 会中止模型请求。models.providers.<id>.timeoutSeconds 会为较慢的本地/自托管提供商延长这个空闲看门狗；否则 OpenClaw 会在配置了 agents.defaults.timeoutSeconds 时使用它，默认上限为 120 秒。没有显式模型或智能体超时的 cron 触发运行会禁用空闲看门狗，并依赖 cron 外层超时。
提供商 HTTP 请求超时：models.providers.<id>.timeoutSeconds 适用于该提供商的模型 HTTP 获取，包括连接、headers、body、SDK 请求超时、总 guarded-fetch 中止处理以及模型流空闲看门狗。对于 Ollama 等较慢的本地/自托管提供商，请先使用此项，再提高整个智能体运行时超时。

可能提前结束的位置

智能体超时（中止）
AbortSignal（取消）
Gateway 网关断开连接或 RPC 超时
agent.wait 超时（仅等待，不会停止智能体）

Agent loop

入口点

工作原理（高层）

排队 + 并发

会话 + 工作区准备

提示词组装 + 系统提示词

钩子点（你可以拦截的位置）

内部钩子（Gateway 网关钩子）

插件钩子（智能体 + Gateway 网关生命周期）

流式传输 + 部分回复

工具执行 + 消息工具

回复塑形 + 抑制

压缩 + 重试

事件流（当前）

聊天渠道处理

超时

可能提前结束的位置

相关

Ask OpenClaw

# 入口点

# 工作原理（高层）

# 排队 + 并发

# 会话 + 工作区准备

# 提示词组装 + 系统提示词

# 钩子点（你可以拦截的位置）

# 内部钩子（Gateway 网关钩子）

# 插件钩子（智能体 + Gateway 网关生命周期）

# 流式传输 + 部分回复

# 工具执行 + 消息工具

# 回复塑形 + 抑制

# 压缩 + 重试

# 事件流（当前）

# 聊天渠道处理

# 超时

# 可能提前结束的位置

# 相关

入口点

工作原理（高层）

排队 + 并发

会话 + 工作区准备

提示词组装 + 系统提示词

钩子点（你可以拦截的位置）

内部钩子（Gateway 网关钩子）

插件钩子（智能体 + Gateway 网关生命周期）

流式传输 + 部分回复

工具执行 + 消息工具

回复塑形 + 抑制

压缩 + 重试

事件流（当前）

聊天渠道处理

超时

可能提前结束的位置

相关