Nodes and media

カメラキャプチャ

OpenClaw はエージェントワークフロー向けの カメラキャプチャ をサポートしています。

  • iOS ノード(Gateway 経由でペアリング): node.invoke 経由で 写真jpg)または 短い動画クリップmp4、任意で音声付き)をキャプチャします。
  • Android ノード(Gateway 経由でペアリング): node.invoke 経由で 写真jpg)または 短い動画クリップmp4、任意で音声付き)をキャプチャします。
  • macOS アプリ(Gateway 経由のノード): node.invoke 経由で 写真jpg)または 短い動画クリップmp4、任意で音声付き)をキャプチャします。

すべてのカメラアクセスは ユーザーが制御する設定 によって制限されます。

iOS ノード

ユーザー設定(デフォルトはオン)

  • iOS 設定タブ → CameraAllow Cameracamera.enabled
    • デフォルト: オン(キーがない場合は有効として扱われます)。
    • オフの場合: camera.* コマンドは CAMERA_DISABLED を返します。

コマンド(Gateway node.invoke 経由)

  • camera.list

    • レスポンスペイロード:
      • devices: { id, name, position, deviceType } の配列
  • camera.snap

    • パラメーター:
      • facing: front|back(デフォルト: front
      • maxWidth: 数値(任意。iOS ノードでのデフォルトは 1600
      • quality: 0..1(任意。デフォルトは 0.9
      • format: 現在は jpg
      • delayMs: 数値(任意。デフォルトは 0
      • deviceId: 文字列(任意。camera.list から取得)
    • レスポンスペイロード:
      • format: "jpg"
      • base64: "<...>"
      • width, height
    • ペイロードガード: 写真は base64 ペイロードを 5 MB 未満に保つため再圧縮されます。
  • camera.clip

    • パラメーター:
      • facing: front|back(デフォルト: front
      • durationMs: 数値(デフォルトは 3000、最大 60000 に制限)
      • includeAudio: boolean(デフォルトは true
      • format: 現在は mp4
      • deviceId: 文字列(任意。camera.list から取得)
    • レスポンスペイロード:
      • format: "mp4"
      • base64: "<...>"
      • durationMs
      • hasAudio

フォアグラウンド要件

canvas.* と同様に、iOS ノードは フォアグラウンド でのみ camera.* コマンドを許可します。バックグラウンドでの呼び出しは NODE_BACKGROUND_UNAVAILABLE を返します。

CLI ヘルパー(一時ファイル + MEDIA)

添付ファイルを取得する最も簡単な方法は CLI ヘルパーを使うことです。これはデコード済みメディアを一時ファイルに書き込み、MEDIA:<path> を出力します。

例:

openclaw nodes camera snap --node <id>               # default: both front + back (2 MEDIA lines)
openclaw nodes camera snap --node <id> --facing front
openclaw nodes camera clip --node <id> --duration 3000
openclaw nodes camera clip --node <id> --no-audio

注:

  • nodes camera snap は、エージェントに両方のビューを提供するため、デフォルトで 両方 の向きを使用します。
  • 独自のラッパーを作成しない限り、出力ファイルは(一時 OS ディレクトリ内の)一時ファイルです。

Android ノード

Android ユーザー設定(デフォルトはオン)

  • Android 設定シート → CameraAllow Cameracamera.enabled
    • デフォルト: オン(キーがない場合は有効として扱われます)。
    • オフの場合: camera.* コマンドは CAMERA_DISABLED を返します。

権限

  • Android ではランタイム権限が必要です。
    • camera.snapcamera.clip の両方に CAMERA
    • includeAudio=true のとき、camera.clipRECORD_AUDIO

権限がない場合、可能であればアプリがプロンプトを表示します。拒否された場合、camera.* リクエストは *_PERMISSION_REQUIRED エラーで失敗します。

Android フォアグラウンド要件

canvas.* と同様に、Android ノードは フォアグラウンド でのみ camera.* コマンドを許可します。バックグラウンドでの呼び出しは NODE_BACKGROUND_UNAVAILABLE を返します。

Android コマンド(Gateway node.invoke 経由)

  • camera.list
    • レスポンスペイロード:
      • devices: { id, name, position, deviceType } の配列

ペイロードガード

写真は base64 ペイロードを 5 MB 未満に保つため再圧縮されます。

macOS アプリ

ユーザー設定(デフォルトはオフ)

macOS コンパニオンアプリにはチェックボックスがあります。

  • Settings → General → Allow Cameraopenclaw.cameraEnabled
    • デフォルト: オフ
    • オフの場合: カメラリクエストは「ユーザーによりカメラが無効化されています」を返します。

CLI ヘルパー(ノード呼び出し)

メインの openclaw CLI を使って、macOS ノード上でカメラコマンドを呼び出します。

例:

openclaw nodes camera list --node <id>            # list camera ids
openclaw nodes camera snap --node <id>            # prints MEDIA:<path>
openclaw nodes camera snap --node <id> --max-width 1280
openclaw nodes camera snap --node <id> --delay-ms 2000
openclaw nodes camera snap --node <id> --device-id <id>
openclaw nodes camera clip --node <id> --duration 10s          # prints MEDIA:<path>
openclaw nodes camera clip --node <id> --duration-ms 3000      # prints MEDIA:<path> (legacy flag)
openclaw nodes camera clip --node <id> --device-id <id>
openclaw nodes camera clip --node <id> --no-audio

注:

  • openclaw nodes camera snap は、上書きしない限りデフォルトで maxWidth=1600 になります。
  • macOS では、camera.snap はウォームアップと露出の安定後、キャプチャ前に delayMs(デフォルト 2000ms)待機します。
  • 写真ペイロードは、base64 を 5 MB 未満に保つため再圧縮されます。

安全性 + 実用上の制限

  • カメラとマイクへのアクセスでは通常の OS 権限プロンプトが表示されます(また、Info.plist に用途文字列が必要です)。
  • 動画クリップは、ノードペイロードが過大になるのを避けるため(base64 のオーバーヘッド + メッセージ制限)、上限があります(現在は <= 60s)。

macOS 画面動画(OS レベル)

画面 動画(カメラではない)には macOS コンパニオンを使用します。

openclaw nodes screen record --node <id> --duration 10s --fps 15   # prints MEDIA:<path>

注:

  • macOS の 画面収録 権限(TCC)が必要です。

関連