Release and CI
テスト
-
完全なテストキット(スイート、ライブ、Docker): テスト
-
更新とPluginパッケージの検証: 更新とPluginのテスト
-
pnpm test:force: デフォルトの制御ポートを保持している残存 Gateway プロセスを終了し、サーバーテストが実行中のインスタンスと衝突しないよう、分離された Gateway ポートで Vitest スイート全体を実行します。以前の Gateway 実行でポート 18789 が使用中のまま残った場合に使用します。 -
pnpm test:coverage: V8 カバレッジを有効にして(vitest.unit.config.ts経由で)ユニットスイートを実行します。これはデフォルトのユニットレーンのカバレッジゲートであり、リポジトリ全体の全ファイルカバレッジではありません。しきい値は行/関数/ステートメントが 70%、ブランチが 55% です。coverage.allは false で、デフォルトレーンはカバレッジ対象を兄弟ソースファイルを持つ非 fast ユニットテストにスコープするため、このゲートは偶然ロードされたすべての推移的インポートではなく、このレーンが所有するソースを測定します。 -
pnpm test:coverage:changed:origin/main以降に変更されたファイルのみを対象にユニットカバレッジを実行します。 -
pnpm test:changed: 安価なスマート変更テスト実行です。直接編集されたテスト、兄弟*.test.tsファイル、明示的なソースマッピング、ローカルインポートグラフから正確なターゲットを実行します。広範な設定/パッケージ変更は、正確なテストにマッピングされない限りスキップされます。 -
OPENCLAW_TEST_CHANGED_BROAD=1 pnpm test:changed: 明示的な広範囲変更テスト実行です。テストハーネス/設定/パッケージの編集で、Vitest のより広範な変更テスト動作へフォールバックすべき場合に使用します。 -
pnpm changed:lanes:origin/mainとの差分によってトリガーされるアーキテクチャレーンを表示します。 -
pnpm check:changed:origin/mainとの差分に対してスマート変更チェックゲートを実行します。影響を受けるアーキテクチャレーンの型チェック、lint、ガードコマンドを実行しますが、Vitest テストは実行しません。テスト証明にはpnpm test:changedまたは明示的なpnpm test <target>を使用します。 -
pnpm test: 明示的なファイル/ディレクトリターゲットを、スコープ済み Vitest レーン経由でルーティングします。ターゲットなしの実行では固定シャードグループを使用し、ローカル並列実行のためにリーフ設定へ展開します。拡張グループは、巨大な単一ルートプロジェクトプロセスではなく、常に拡張ごとのシャード設定へ展開されます。 -
テストラッパーの実行は、短い
[test] passed|failed|skipped ... in ...サマリーで終わります。Vitest 自身の所要時間行はシャードごとの詳細として残ります。 -
共有 OpenClaw テスト状態: テストで分離された
HOME、OPENCLAW_STATE_DIR、OPENCLAW_CONFIG_PATH、設定フィクスチャ、ワークスペース、エージェントディレクトリ、または認証プロファイルストアが必要な場合は、Vitest からsrc/test-utils/openclaw-test-state.tsを使用します。 -
プロセス E2E ヘルパー: Vitest のプロセスレベル E2E テストで、実行中の Gateway、CLI 環境、ログキャプチャ、クリーンアップを 1 か所で扱う必要がある場合は、
test/helpers/openclaw-test-instance.tsを使用します。 -
Docker/Bash E2E ヘルパー:
scripts/lib/docker-e2e-image.shを source するレーンは、docker_e2e_test_state_shell_b64 <label> <scenario>をコンテナへ渡し、scripts/lib/openclaw-e2e-instance.shでデコードできます。複数 HOME のスクリプトはdocker_e2e_test_state_function_b64を渡し、各フローでopenclaw_test_state_create <label> <scenario>を呼び出せます。低レベルの呼び出し元は、コンテナ内シェルスニペットにはscripts/lib/openclaw-test-state.mjs shell --label <name> --scenario <name>を使用でき、source 可能なホスト環境ファイルにはnode scripts/lib/openclaw-test-state.mjs -- create --label <name> --scenario <name> --env-file <path> --jsonを使用できます。createの前の--は、新しい Node ランタイムが--env-fileを Node フラグとして扱わないようにします。Gateway を起動する Docker/Bash レーンは、エントリポイント解決、モック OpenAI 起動、Gateway のフォアグラウンド/バックグラウンド起動、準備完了プローブ、状態環境変数のエクスポート、ログダンプ、プロセスクリーンアップのために、コンテナ内でscripts/lib/openclaw-e2e-instance.shを source できます。 -
フル、拡張、include パターンのシャード実行は、ローカルのタイミングデータを
.artifacts/vitest-shard-timings.jsonに更新します。後続の設定全体の実行では、それらのタイミングを使って低速シャードと高速シャードのバランスを取ります。include パターンの CI シャードはタイミングキーにシャード名を追加するため、設定全体のタイミングデータを置き換えずに、フィルター済みシャードのタイミングを確認できます。ローカルタイミング成果物を無視するにはOPENCLAW_TEST_PROJECTS_TIMINGS=0を設定します。 -
選択された
plugin-sdkとcommandsのテストファイルは、test/setup.tsのみを残す専用の軽量レーン経由でルーティングされるようになり、ランタイム負荷の高いケースは既存のレーンに残ります。 -
兄弟テストを持つソースファイルは、より広いディレクトリ glob にフォールバックする前に、その兄弟テストへマッピングされます。
src/channels/plugins/contracts/test-helpers、src/plugin-sdk/test-helpers、src/plugins/contracts配下のヘルパー編集は、依存パスが正確な場合に、すべてのシャードを広範に実行するのではなく、ローカルインポートグラフを使ってインポート元テストを実行します。 -
auto-replyは、返信ハーネスが軽量なトップレベルのステータス/トークン/ヘルパーテストを支配しないよう、3 つの専用設定(core、top-level、reply)にも分割されるようになりました。 -
ベース Vitest 設定は、リポジトリ設定全体で共有の非分離ランナーを有効にしたうえで、
pool: "threads"とisolate: falseをデフォルトにするようになりました。 -
pnpm test:channelsはvitest.channels.config.tsを実行します。 -
pnpm test:extensionsとpnpm test extensionsは、すべての拡張/Plugin シャードを実行します。重いチャネル Plugin、ブラウザー Plugin、OpenAI は専用シャードとして実行され、その他の Plugin グループはバッチのままです。バンドルされた Plugin レーンを 1 つだけ実行するには、pnpm test extensions/<id>を使用します。 -
pnpm test:perf:imports: Vitest のインポート所要時間とインポート内訳レポートを有効にしつつ、明示的なファイル/ディレクトリターゲットには引き続きスコープ済みレーンルーティングを使用します。 -
pnpm test:perf:imports:changed: 同じインポートプロファイリングですが、origin/main以降に変更されたファイルのみを対象にします。 -
pnpm test:perf:changed:bench -- --ref <git-ref>は、同じコミット済み git 差分について、ルーティングされた変更モードパスをネイティブのルートプロジェクト実行と比較してベンチマークします。 -
pnpm test:perf:changed:bench -- --worktreeは、現在のワークツリー変更セットを、先にコミットせずにベンチマークします。 -
pnpm test:perf:profile:main: Vitest メインスレッドの CPU プロファイル(.artifacts/vitest-main-profile)を書き出します。 -
pnpm test:perf:profile:runner: ユニットランナーの CPU + ヒーププロファイル(.artifacts/vitest-runner-profile)を書き出します。 -
pnpm test:perf:groups --full-suite --allow-failures --output .artifacts/test-perf/baseline-before.json: すべてのフルスイート Vitest リーフ設定を直列に実行し、グループ化された所要時間データと、設定ごとの JSON/ログ成果物を書き出します。Test Performance Agent は、低速テスト修正を試みる前のベースラインとしてこれを使用します。 -
pnpm test:perf:groups:compare .artifacts/test-perf/baseline-before.json .artifacts/test-perf/after-agent.json: パフォーマンス重視の変更後に、グループ化レポートを比較します。 -
Gateway 統合:
OPENCLAW_TEST_INCLUDE_GATEWAY=1 pnpm testまたはpnpm test:gatewayでオプトインします。 -
pnpm test:e2e: Gateway のエンドツーエンドスモークテスト(複数インスタンスの WS/HTTP/node ペアリング)を実行します。vitest.e2e.config.tsでは、適応ワーカー付きのthreads+isolate: falseがデフォルトです。OPENCLAW_E2E_WORKERS=<n>で調整し、詳細ログにはOPENCLAW_E2E_VERBOSE=1を設定します。 -
pnpm test:live: プロバイダーのライブテスト(minimax/zai)を実行します。スキップを解除するには API キーとLIVE=1(またはプロバイダー固有の*_LIVE_TEST=1)が必要です。 -
pnpm test:docker:all: 共有ライブテストイメージをビルドし、OpenClaw を npm tarball として 1 回パックし、素の Node/Git ランナーイメージと、その tarball を/appにインストールする機能イメージをビルド/再利用してから、重み付きスケジューラーを通じてOPENCLAW_SKIP_DOCKER_BUILD=1で Docker スモークレーンを実行します。素のイメージ(OPENCLAW_DOCKER_E2E_BARE_IMAGE)はインストーラー/更新/Plugin 依存関係レーンに使用されます。これらのレーンは、コピーされたリポジトリソースではなく、事前ビルド済み tarball をマウントします。機能イメージ(OPENCLAW_DOCKER_E2E_FUNCTIONAL_IMAGE)は通常のビルド済みアプリ機能レーンに使用されます。scripts/package-openclaw-for-docker.mjsは単一のローカル/CI パッケージパッカーであり、Docker が消費する前に tarball とdist/postinstall-inventory.jsonを検証します。Docker レーン定義はscripts/lib/docker-e2e-scenarios.mjsにあり、プランナーロジックはscripts/lib/docker-e2e-plan.mjsにあり、scripts/test-docker-all.mjsが選択されたプランを実行します。node scripts/test-docker-all.mjs --plan-jsonは、Docker をビルドまたは実行せずに、選択されたレーン、イメージ種別、パッケージ/ライブイメージ要件、状態シナリオ、認証情報チェックについて、スケジューラー所有の CI プランを出力します。OPENCLAW_DOCKER_ALL_PARALLELISM=<n>はプロセススロットを制御し、デフォルトは 10 です。OPENCLAW_DOCKER_ALL_TAIL_PARALLELISM=<n>はプロバイダー依存の tail プールを制御し、デフォルトは 10 です。重いレーンの上限はデフォルトでOPENCLAW_DOCKER_ALL_LIVE_LIMIT=9、OPENCLAW_DOCKER_ALL_NPM_LIMIT=10、OPENCLAW_DOCKER_ALL_SERVICE_LIMIT=7です。プロバイダー上限は、OPENCLAW_DOCKER_ALL_LIVE_CLAUDE_LIMIT=4、OPENCLAW_DOCKER_ALL_LIVE_CODEX_LIMIT=4、OPENCLAW_DOCKER_ALL_LIVE_GEMINI_LIMIT=4により、プロバイダーごとに重いレーン 1 つがデフォルトです。より大きいホストではOPENCLAW_DOCKER_ALL_WEIGHT_LIMITまたはOPENCLAW_DOCKER_ALL_DOCKER_LIMITを使用します。低並列ホストで 1 つのレーンが有効な重みまたはリソース上限を超える場合でも、空のプールから起動でき、容量を解放するまで単独で実行されます。ローカル Docker デーモンの作成集中を避けるため、レーン開始はデフォルトで 2 秒ずつずらされます。OPENCLAW_DOCKER_ALL_START_STAGGER_MS=<ms>で上書きできます。ランナーはデフォルトで Docker を事前チェックし、古い OpenClaw E2E コンテナをクリーンアップし、30 秒ごとにアクティブレーンのステータスを出力し、互換性のあるレーン間でプロバイダー CLI ツールキャッシュを共有し、一時的なライブプロバイダー失敗をデフォルトで 1 回再試行し(OPENCLAW_DOCKER_ALL_LIVE_RETRIES=<n>)、後続実行で長い順に並べるためにレーンタイミングを.artifacts/docker-tests/lane-timings.jsonに保存します。Docker を実行せずにレーンマニフェストを出力するにはOPENCLAW_DOCKER_ALL_DRY_RUN=1、ステータス出力を調整するにはOPENCLAW_DOCKER_ALL_STATUS_INTERVAL_MS=<ms>、タイミング再利用を無効にするにはOPENCLAW_DOCKER_ALL_TIMINGS=0を使用します。決定的/ローカルレーンのみにはOPENCLAW_DOCKER_ALL_LIVE_MODE=skip、ライブプロバイダーレーンのみにはOPENCLAW_DOCKER_ALL_LIVE_MODE=onlyを使用します。パッケージエイリアスはpnpm test:docker:local:allとpnpm test:docker:live:allです。live-only モードでは main と tail のライブレーンを 1 つの長い順プールに統合するため、プロバイダーバケットは Claude、Codex、Gemini の作業をまとめて詰め込めます。OPENCLAW_DOCKER_ALL_FAIL_FAST=0が設定されていない限り、ランナーは最初の失敗後に新しいプール済みレーンのスケジューリングを停止します。各レーンには 120 分のフォールバックタイムアウトがあり、OPENCLAW_DOCKER_ALL_LANE_TIMEOUT_MSで上書きできます。選択された live/tail レーンは、より厳しいレーンごとの上限を使用します。CLI バックエンド Docker セットアップコマンドには、OPENCLAW_LIVE_CLI_BACKEND_SETUP_TIMEOUT_SECONDS(デフォルト 180)による独自のタイムアウトがあります。レーンごとのログ、summary.json、failures.json、フェーズタイミングは.artifacts/docker-tests/<run-id>/配下に書き込まれます。低速レーンを調べるにはpnpm test:docker:timings <summary.json>を使用し、安価なターゲット指定再実行コマンドを出力するにはpnpm test:docker:rerun <run-id|summary.json|failures.json>を使用します。 -
pnpm test:docker:browser-cdp-snapshot: Chromium ベースのソース E2E コンテナをビルドし、生の CDP と分離された Gateway を起動し、browser doctor --deepを実行して、CDP ロールスナップショットにリンク URL、カーソルで昇格されたクリック可能要素、iframe 参照、フレームメタデータが含まれることを検証します。 -
CLI バックエンドのライブ Docker プローブは、たとえば
pnpm test:docker:live-cli-backend:codex、pnpm test:docker:live-cli-backend:codex:resume、pnpm test:docker:live-cli-backend:codex:mcpのような集中的なレーンとして実行できます。Claude と Gemini には対応する:resumeと:mcpエイリアスがあります。 -
pnpm test:docker:openwebui: Docker 化された OpenClaw + Open WebUI を起動し、Open WebUI 経由でサインインし、/api/modelsを確認してから、/api/chat/completionsを通じて実際のプロキシ済みチャットを実行します。利用可能なライブモデルキー(たとえば~/.profile内の OpenAI)が必要で、外部 Open WebUI イメージを pull し、通常のユニット/e2e スイートのような CI 安定性は期待されていません。 -
pnpm test:docker:mcp-channels: シード済みの Gateway コンテナと、openclaw mcp serveを起動する 2 つ目のクライアントコンテナを開始し、ルーティングされた会話の検出、トランスクリプト読み取り、添付ファイルメタデータ、ライブイベントキューの挙動、送信ルーティング、実際の stdio ブリッジ経由の Claude 形式のチャンネル通知と権限通知を検証します。Claude 通知のアサーションは生の stdio MCP フレームを直接読み取るため、このスモークテストはブリッジが実際に出力する内容を反映します。 -
pnpm test:docker:upgrade-survivor: パックされた OpenClaw tarball を汚れた旧ユーザーフィクスチャの上にインストールし、ライブプロバイダーやチャンネルキーなしでパッケージ更新と非対話型 doctor を実行し、その後 loopback Gateway を起動して、エージェント、チャンネル設定、Plugin 許可リスト、ワークスペース/セッションファイル、古いレガシー Plugin 依存関係状態、起動、RPC ステータスが維持されることを確認します。 -
pnpm test:docker:published-upgrade-survivor: 既定でopenclaw@latestをインストールし、ライブプロバイダーやチャンネルキーなしで現実的な既存ユーザーファイルをシードし、そのベースラインを組み込みのopenclaw config setコマンドレシピで設定し、その公開済みインストールをパックされた OpenClaw tarball に更新し、非対話型 doctor を実行し、.artifacts/upgrade-survivor/summary.jsonを書き込み、その後 loopback Gateway を起動して、設定済みインテント、ワークスペース/セッションファイル、古い Plugin 設定とレガシー依存関係状態、起動、/healthz、/readyz、RPC ステータスが維持されるか正常に修復されることを確認します。OPENCLAW_UPGRADE_SURVIVOR_BASELINE_SPECで 1 つのベースラインを上書きし、OPENCLAW_UPGRADE_SURVIVOR_BASELINE_SPECSで[email protected] [email protected] [email protected]のような正確なローカルマトリクスを展開するか、OPENCLAW_UPGRADE_SURVIVOR_SCENARIOS=reported-issuesでシナリオフィクスチャを追加します。reported-issues セットには、設定済みの外部 OpenClaw plugins がアップグレード中に自動インストールされることを検証するconfigured-plugin-installsと、ソース専用 Plugin シャドウが起動を壊さないようにするstale-source-plugin-shadowが含まれます。パッケージ受け入れは、それらをpublished_upgrade_survivor_baseline、published_upgrade_survivor_baselines、published_upgrade_survivor_scenariosとして公開し、正確なパッケージ仕様を Docker レーンに渡す前に、last-stable-4やall-since-2026.4.23などのメタベースライントークンを解決します。 -
pnpm test:docker:update-migration: クリーンアップが多いplugin-deps-cleanupシナリオで公開済みアップグレードサバイバーハーネスを実行し、既定では[email protected]から開始します。別個のUpdate Migrationワークフローはこのレーンをbaselines=all-since-2026.4.23で展開し、.23以降のすべての安定版公開パッケージが候補版へ更新され、Full Release CI の外で設定済み Plugin 依存関係のクリーンアップを証明します。 -
pnpm test:docker:plugins: ローカルパス、file:、hoist された依存関係を持つ npm レジストリパッケージ、git 移動参照、ClawHub フィクスチャ、マーケットプレイス更新、Claude バンドルの有効化/検査について、インストール/更新スモークを実行します。
ローカル PR ゲート
ローカルでの PR 取り込み/ゲートチェックには、次を実行します:
pnpm check:changedpnpm checkpnpm check:test-typespnpm buildpnpm testpnpm check:docs
負荷の高いホストで pnpm test が不安定に失敗する場合は、回帰として扱う前に一度再実行し、その後 pnpm test <path/to/test> で切り分けます。メモリに制約のあるホストでは、次を使用します:
OPENCLAW_VITEST_MAX_WORKERS=1 pnpm testOPENCLAW_VITEST_FS_MODULE_CACHE_PATH=/tmp/openclaw-vitest-cache pnpm test:changed
モデルレイテンシベンチ(ローカルキー)
スクリプト: scripts/bench-model.ts
使用方法:
source ~/.profile && pnpm tsx scripts/bench-model.ts --runs 10- 任意の env:
MINIMAX_API_KEY,MINIMAX_BASE_URL,MINIMAX_MODEL,ANTHROPIC_API_KEY - デフォルトプロンプト: 「単語 1 つで返信してください: ok。句読点や余分なテキストは不要です。」
最終実行(2025-12-31、20 回実行):
- minimax 中央値 1279ms(最小 1114、最大 2431)
- opus 中央値 2454ms(最小 1224、最大 3170)
CLI 起動ベンチ
スクリプト: scripts/bench-cli-startup.ts
使用方法:
pnpm test:startup:benchpnpm test:startup:bench:smokepnpm test:startup:bench:savepnpm test:startup:bench:updatepnpm test:startup:bench:checkpnpm tsx scripts/bench-cli-startup.tspnpm tsx scripts/bench-cli-startup.ts --runs 12pnpm tsx scripts/bench-cli-startup.ts --preset realpnpm tsx scripts/bench-cli-startup.ts --preset real --case status --case gatewayStatus --runs 3pnpm tsx scripts/bench-cli-startup.ts --preset real --case tasksJson --case tasksListJson --case tasksAuditJson --runs 3pnpm tsx scripts/bench-cli-startup.ts --entry openclaw.mjs --entry-secondary dist/entry.js --preset allpnpm tsx scripts/bench-cli-startup.ts --preset all --output .artifacts/cli-startup-bench-all.jsonpnpm tsx scripts/bench-cli-startup.ts --preset real --case gatewayStatusJson --output .artifacts/cli-startup-bench-smoke.jsonpnpm tsx scripts/bench-cli-startup.ts --preset real --cpu-prof-dir .artifacts/cli-cpupnpm tsx scripts/bench-cli-startup.ts --json
プリセット:
startup:--version,--help,health,health --json,status --json,statusreal:health,status,status --json,sessions,sessions --json,tasks --json,tasks list --json,tasks audit --json,agents list --json,gateway status,gateway status --json,gateway health --json,config get gateway.portall: 両方のプリセット
出力には、各コマンドの sampleCount、平均、p50、p95、最小/最大、終了コード/シグナル分布、最大 RSS サマリーが含まれます。任意の --cpu-prof-dir / --heap-prof-dir は実行ごとに V8 プロファイルを書き込むため、タイミングとプロファイル取得に同じハーネスを使用します。
保存済み出力の規約:
pnpm test:startup:bench:smokeは、対象を絞ったスモークアーティファクトを.artifacts/cli-startup-bench-smoke.jsonに書き込みますpnpm test:startup:bench:saveは、runs=5とwarmup=1を使用してフルスイートアーティファクトを.artifacts/cli-startup-bench-all.jsonに書き込みますpnpm test:startup:bench:updateは、runs=5とwarmup=1を使用して、チェックイン済みのベースラインフィクスチャtest/fixtures/cli-startup-bench.jsonを更新します
チェックイン済みフィクスチャ:
test/fixtures/cli-startup-bench.jsonpnpm test:startup:bench:updateで更新しますpnpm test:startup:bench:checkで現在の結果をフィクスチャと比較します
オンボーディング E2E(Docker)
Docker は任意です。これはコンテナ化されたオンボーディングスモークテストにのみ必要です。
クリーンな Linux コンテナでの完全なコールドスタートフロー:
scripts/e2e/onboard-docker.sh
このスクリプトは疑似 tty 経由で対話型ウィザードを操作し、config/workspace/session ファイルを検証してから Gateway を起動し、openclaw health を実行します。
QR インポートスモーク(Docker)
メンテナンスされている QR ランタイムヘルパーが、サポート対象の Docker Node ランタイム(Node 24 がデフォルト、Node 22 が互換)で読み込まれることを確認します:
pnpm test:docker:qr