Tools
瀏覽器控制 API
關於設定、組態與疑難排解,請參閱 Browser。
本頁是本機控制 HTTP API、openclaw browser CLI,以及指令碼模式(快照、refs、等待、除錯流程)的參考。
控制 API(選用)
僅供本機整合使用,Gateway 會公開一個小型 loopback HTTP API:
- 狀態/啟動/停止:
GET /、POST /start、POST /stop - 分頁:
GET /tabs、POST /tabs/open、POST /tabs/focus、DELETE /tabs/:targetId - 快照/螢幕截圖:
GET /snapshot、POST /screenshot - 動作:
POST /navigate、POST /act - Hooks:
POST /hooks/file-chooser、POST /hooks/dialog - 下載:
POST /download、POST /wait/download - 權限:
POST /permissions/grant - 除錯:
GET /console、POST /pdf - 除錯:
GET /errors、GET /requests、POST /trace/start、POST /trace/stop、POST /highlight - 網路:
POST /response/body - 狀態:
GET /cookies、POST /cookies/set、POST /cookies/clear - 狀態:
GET /storage/:kind、POST /storage/:kind/set、POST /storage/:kind/clear - 設定:
POST /set/offline、POST /set/headers、POST /set/credentials、POST /set/geolocation、POST /set/media、POST /set/timezone、POST /set/locale、POST /set/device
所有端點都接受 ?profile=<name>。POST /start?headless=true 會要求針對本機受管設定檔進行一次性的 headless 啟動,而不變更已持久化的瀏覽器組態;attach-only、遠端 CDP,以及既有工作階段設定檔會拒絕該覆寫,因為 OpenClaw 不會啟動那些瀏覽器程序。
如果已設定 shared-secret Gateway 驗證,瀏覽器 HTTP 路由也需要驗證:
Authorization: Bearer <gateway token>x-openclaw-password: <gateway password>或使用該密碼的 HTTP Basic 驗證
注意事項:
- 這個獨立的 loopback 瀏覽器 API 不會使用 trusted-proxy 或 Tailscale Serve 身分標頭。
- 如果
gateway.auth.mode是none或trusted-proxy,這些 loopback 瀏覽器路由不會繼承那些帶有身分資訊的模式;請讓它們僅限 loopback 使用。
/act 錯誤契約
POST /act 會針對路由層級驗證與政策失敗使用結構化錯誤回應:
{ "error": "<message>", "code": "ACT_*" }
目前的 code 值:
ACT_KIND_REQUIRED(HTTP 400):kind缺少或無法辨識。ACT_INVALID_REQUEST(HTTP 400):動作 payload 正規化或驗證失敗。ACT_SELECTOR_UNSUPPORTED(HTTP 400):selector搭配了不支援的動作種類使用。ACT_EVALUATE_DISABLED(HTTP 403):evaluate(或wait --fn)已被組態停用。ACT_TARGET_ID_MISMATCH(HTTP 403):頂層或批次的targetId與要求目標衝突。ACT_EXISTING_SESSION_UNSUPPORTED(HTTP 501):既有工作階段設定檔不支援該動作。
其他執行階段失敗仍可能回傳沒有 code 欄位的 { "error": "<message>" }。
Playwright 需求
部分功能(導覽/動作/AI 快照/角色快照、元素螢幕截圖、PDF)需要 Playwright。如果未安裝 Playwright,這些端點會回傳清楚的 501 錯誤。
沒有 Playwright 時仍可運作的項目:
- ARIA 快照
- 當每個分頁的 CDP WebSocket 可用時,角色樣式的無障礙快照(
--interactive、--compact、--depth、--efficient)。這是用於檢查與 ref 探索的 fallback;Playwright 仍是主要的動作引擎。 - 當每個分頁的 CDP WebSocket 可用時,受管
openclaw瀏覽器的頁面螢幕截圖 existing-session/ Chrome MCP 設定檔的頁面螢幕截圖- 來自快照輸出的
existing-sessionref 型螢幕截圖(--ref)
仍需要 Playwright 的項目:
navigateact- 依賴 Playwright 原生 AI 快照格式的 AI 快照
- CSS 選擇器元素螢幕截圖(
--element) - 完整瀏覽器 PDF 匯出
元素螢幕截圖也會拒絕 --full-page;該路由會回傳 fullPage is not supported for element screenshots。
如果你看到 Playwright is not available in this gateway build,表示封裝的 Gateway 缺少核心瀏覽器執行階段相依性。重新安裝或更新 OpenClaw,然後重新啟動 Gateway。若使用 Docker,也請依下方所示安裝 Chromium 瀏覽器二進位檔。
Docker Playwright 安裝
如果你的 Gateway 在 Docker 中執行,請避免使用 npx playwright(npm 覆寫衝突)。改用 bundled CLI:
docker compose run --rm openclaw-cli \
node /app/node_modules/playwright-core/cli.js install chromium
若要持久化瀏覽器下載,請設定 PLAYWRIGHT_BROWSERS_PATH(例如 /home/node/.cache/ms-playwright),並確認 /home/node 透過 OPENCLAW_HOME_VOLUME 或 bind mount 持久化。請參閱 Docker。
運作方式(內部)
一個小型 loopback 控制伺服器會接受 HTTP 要求,並透過 CDP 連線到 Chromium-based 瀏覽器。進階動作(點擊/輸入/快照/PDF)會在 CDP 之上透過 Playwright 執行;當 Playwright 缺少時,只有非 Playwright 操作可用。代理會看到一個穩定的介面,而本機/遠端瀏覽器與設定檔可在底層自由替換。
CLI 快速參考
所有命令都接受 --browser-profile <name> 以指定特定設定檔,並接受 --json 以輸出機器可讀格式。
Basics: status, tabs, open/focus/close
openclaw browser status
openclaw browser start
openclaw browser start --headless # one-shot local managed headless launch
openclaw browser stop # also clears emulation on attach-only/remote CDP
openclaw browser tabs
openclaw browser tab # shortcut for current tab
openclaw browser tab new
openclaw browser tab select 2
openclaw browser tab close 2
openclaw browser open https://example.com
openclaw browser focus abcd1234
openclaw browser close abcd1234
Inspection: screenshot, snapshot, console, errors, requests
openclaw browser screenshot
openclaw browser screenshot --full-page
openclaw browser screenshot --ref 12 # or --ref e12
openclaw browser screenshot --labels
openclaw browser snapshot
openclaw browser snapshot --format aria --limit 200
openclaw browser snapshot --interactive --compact --depth 6
openclaw browser snapshot --efficient
openclaw browser snapshot --labels
openclaw browser snapshot --urls
openclaw browser snapshot --selector "#main" --interactive
openclaw browser snapshot --frame "iframe#main" --interactive
openclaw browser console --level error
openclaw browser errors --clear
openclaw browser requests --filter api --clear
openclaw browser pdf
openclaw browser responsebody "**/api" --max-chars 5000
Actions: navigate, click, type, drag, wait, evaluate
openclaw browser navigate https://example.com
openclaw browser resize 1280 720
openclaw browser click 12 --double # or e12 for role refs
openclaw browser click-coords 120 340 # viewport coordinates
openclaw browser type 23 "hello" --submit
openclaw browser press Enter
openclaw browser hover 44
openclaw browser scrollintoview e12
openclaw browser drag 10 11
openclaw browser select 9 OptionA OptionB
openclaw browser download e12 report.pdf
openclaw browser waitfordownload report.pdf
openclaw browser upload /tmp/openclaw/uploads/file.pdf
openclaw browser fill --fields '[{"ref":"1","type":"text","value":"Ada"}]'
openclaw browser dialog --accept
openclaw browser wait --text "Done"
openclaw browser wait "#main" --url "**/dash" --load networkidle --fn "window.ready===true"
openclaw browser evaluate --fn '(el) => el.textContent' --ref 7
openclaw browser highlight e12
openclaw browser trace start
openclaw browser trace stop
State: cookies, storage, offline, headers, geo, device
openclaw browser cookies
openclaw browser cookies set session abc123 --url "https://example.com"
openclaw browser cookies clear
openclaw browser storage local get
openclaw browser storage local set theme dark
openclaw browser storage session clear
openclaw browser set offline on
openclaw browser set headers --headers-json '{"X-Debug":"1"}'
openclaw browser set credentials user pass # --clear to remove
openclaw browser set geo 37.7749 -122.4194 --origin "https://example.com"
openclaw browser set media dark
openclaw browser set timezone America/New_York
openclaw browser set locale en-US
openclaw browser set device "iPhone 14"
注意事項:
upload與dialog是預先啟用呼叫;請在觸發選擇器/對話框的點擊/按鍵之前執行它們。click/type/等等需要來自snapshot的ref(數字12、角色 refe12,或可動作的 ARIA refax12)。動作刻意不支援 CSS 選擇器。當可見 viewport 位置是唯一可靠目標時,請使用click-coords。- 下載、trace 與上傳路徑受限於 OpenClaw 暫存根目錄:
/tmp/openclaw{,/downloads,/uploads}(fallback:${os.tmpdir()}/openclaw/...)。 upload也可以透過--input-ref或--element直接設定檔案輸入。
當 OpenClaw 能證明替換分頁時,穩定的分頁 id 與標籤會在 Chromium 原始目標替換後保留下來,例如相同 URL,或表單提交後單一舊分頁變成單一新分頁。原始 target id 仍然易變;在指令碼中請優先使用 tabs 的 suggestedTargetId。
快照旗標速覽:
--format ai(有 Playwright 時的預設值):含數字 refs(aria-ref="<n>")的 AI 快照。--format aria:含axNrefs 的無障礙樹。當 Playwright 可用時,OpenClaw 會使用後端 DOM id 將 refs 綁定到即時頁面,讓後續動作可以使用它們;否則請將輸出視為僅供檢查。--efficient(或--mode efficient):精簡角色快照 preset。設定browser.snapshotDefaults.mode: "efficient"可將此設為預設值(請參閱 Gateway 組態)。--interactive、--compact、--depth、--selector會強制使用含ref=e12refs 的角色快照。--frame "<iframe>"會將角色快照限制在 iframe 範圍內。--labels會加入僅限 viewport 的螢幕截圖,並覆疊 ref 標籤(列印MEDIA:<path>)。--urls會將探索到的連結目的地附加到 AI 快照。
快照與 refs
OpenClaw 支援兩種「快照」樣式:
-
AI 快照(數字 refs):
openclaw browser snapshot(預設;--format ai)- 輸出:包含數字 refs 的文字快照。
- 動作:
openclaw browser click 12、openclaw browser type 23 "hello"。 - 在內部,ref 會透過 Playwright 的
aria-ref解析。
-
角色快照(像
e12的角色 refs):openclaw browser snapshot --interactive(或--compact、--depth、--selector、--frame)- 輸出:含
[ref=e12](以及選用的[nth=1])的角色型清單/樹。 - 動作:
openclaw browser click e12、openclaw browser highlight e12。 - 在內部,ref 會透過
getByRole(...)(加上用於重複項目的nth())解析。 - 加上
--labels可包含一張 viewport 螢幕截圖,並覆疊e12標籤。 - 當連結文字模糊且代理需要具體導覽目標時,請加上
--urls。
- 輸出:含
-
ARIA 快照(像
ax12的 ARIA refs):openclaw browser snapshot --format aria- 輸出:以結構化節點呈現的無障礙樹。
- 動作:當快照路徑可透過 Playwright 和 Chrome 後端 DOM id 綁定 ref 時,
openclaw browser click ax12可運作。
-
如果 Playwright 不可用,ARIA 快照仍可用於檢查,但 refs 可能無法動作。當你需要動作 refs 時,請使用
--format ai或--interactive重新快照。 -
raw-CDP fallback 路徑的 Docker 證明:
pnpm test:docker:browser-cdp-snapshot會使用 CDP 啟動 Chromium、執行browser doctor --deep,並驗證角色快照包含連結 URL、游標提升的可點擊項目,以及 iframe metadata。
Ref 行為:
- 參照在跨導覽時並不穩定;如果某些操作失敗,請重新執行
snapshot並使用新的參照。 /act會在動作觸發的替換之後傳回目前的原始targetId, 前提是它可以證明替換後的分頁。後續命令請繼續使用穩定的分頁 ID/標籤。- 如果角色快照是使用
--frame擷取的,角色參照會限定在該 iframe 內,直到下一次角色快照為止。 - 未知或過期的
axN參照會快速失敗,而不是落入 Playwright 的aria-ref選擇器。發生這種情況時,請在同一個分頁上執行新的快照。
等待增強功能
你可以等待的不只是時間/文字:
- 等待 URL(支援 Playwright glob):
openclaw browser wait --url "**/dash"
- 等待載入狀態:
openclaw browser wait --load networkidle
- 等待 JS 判斷式:
openclaw browser wait --fn "window.ready===true"
- 等待選擇器變成可見:
openclaw browser wait "#main"
這些可以組合使用:
openclaw browser wait "#main" \
--url "**/dash" \
--load networkidle \
--fn "window.ready===true" \
--timeout-ms 15000
偵錯工作流程
當動作失敗時(例如「不可見」、「strict mode 違規」、「被覆蓋」):
openclaw browser snapshot --interactive- 使用
click <ref>/type <ref>(在互動模式中優先使用角色參照) - 如果仍然失敗:使用
openclaw browser highlight <ref>查看 Playwright 的目標 - 如果頁面行為異常:
openclaw browser errors --clearopenclaw browser requests --filter api --clear
- 若要深入偵錯:記錄追蹤:
openclaw browser trace start- 重現問題
openclaw browser trace stop(印出TRACE:<path>)
JSON 輸出
--json 用於指令碼和結構化工具。
範例:
openclaw browser status --json
openclaw browser snapshot --interactive --json
openclaw browser requests --filter api --json
openclaw browser cookies --json
JSON 中的角色快照包含 refs,以及小型 stats 區塊(行數/字元數/參照數/互動狀態),讓工具可以推理承載大小和密度。
狀態與環境旋鈕
這些對於「讓網站表現得像 X」的工作流程很有用:
- Cookie:
cookies、cookies set、cookies clear - 儲存空間:
storage local|session get|set|clear - 離線:
set offline on|off - 標頭:
set headers --headers-json '{"X-Debug":"1"}'(舊版set headers --json '{"X-Debug":"1"}'仍受支援) - HTTP 基本驗證:
set credentials user pass(或--clear) - 地理位置:
set geo <lat> <lon> --origin "https://example.com"(或--clear) - 媒體:
set media dark|light|no-preference|none - 時區 / 語系:
set timezone ...、set locale ... - 裝置 / viewport:
set device "iPhone 14"(Playwright 裝置預設集)set viewport 1280 720
安全性與隱私
- openclaw 瀏覽器設定檔可能包含已登入的工作階段;請將其視為敏感資料。
browser act kind=evaluate/openclaw browser evaluate和wait --fn會在頁面內容中執行任意 JavaScript。提示注入可能會引導 這項行為。如果不需要,請使用browser.evaluateEnabled=false停用。- 關於登入和反機器人注意事項(X/Twitter 等),請參閱瀏覽器登入 + X/Twitter 發文。
- 保持 Gateway/node 主機私密(回送或僅限 tailnet)。
- 遠端 CDP 端點權限很高;請透過通道連線並加以保護。
Strict-mode 範例(預設封鎖私有/內部目的地):
{
browser: {
ssrfPolicy: {
dangerouslyAllowPrivateNetwork: false,
hostnameAllowlist: ["*.example.com", "example.com"],
allowedHostnames: ["localhost"], // optional exact allow
},
},
}
相關
- 瀏覽器 - 概觀、設定、設定檔、安全性
- 瀏覽器登入 - 登入網站
- 瀏覽器 Linux 疑難排解
- 瀏覽器 WSL2 疑難排解