Gateway

Motores de la CLI

OpenClaw puede ejecutar CLI de IA locales como respaldo solo de texto cuando los proveedores de API están caídos, tienen límites de tasa o se comportan mal temporalmente. Esto es intencionalmente conservador:

  • Las herramientas de OpenClaw no se inyectan directamente, pero los backends con bundleMcp: true pueden recibir herramientas del Gateway mediante un puente MCP de loopback.
  • Streaming JSONL para las CLI que lo admiten.
  • Las sesiones son compatibles (así los turnos de seguimiento se mantienen coherentes).
  • Las imágenes pueden pasarse directamente si la CLI acepta rutas de imagen.

Esto está diseñado como una red de seguridad, no como una ruta principal. Úsalo cuando quieras respuestas de texto que "siempre funcionan" sin depender de API externas.

Si quieres un runtime de arnés completo con controles de sesión ACP, tareas en segundo plano, vinculación de hilo/conversación y sesiones externas de codificación persistentes, usa Agentes ACP en su lugar. Los backends de CLI no son ACP.

Inicio rápido para principiantes

Puedes usar Codex CLI sin ninguna configuración (el Plugin de OpenAI incluido registra un backend predeterminado):

openclaw agent --message "hi" --model codex-cli/gpt-5.5

Si tu Gateway se ejecuta bajo launchd/systemd y PATH es mínimo, agrega solo la ruta del comando:

{
  agents: {
    defaults: {
      cliBackends: {
        "codex-cli": {
          command: "/opt/homebrew/bin/codex",
        },
      },
    },
  },
}

Eso es todo. No se necesitan claves ni configuración de autenticación adicional más allá de la CLI misma.

Si usas un backend de CLI incluido como proveedor de mensajes principal en un host de Gateway, OpenClaw ahora carga automáticamente el Plugin incluido propietario cuando tu configuración hace referencia explícita a ese backend en una referencia de modelo o bajo agents.defaults.cliBackends.

Usarlo como respaldo

Agrega un backend de CLI a tu lista de respaldos para que solo se ejecute cuando fallen los modelos principales:

{
  agents: {
    defaults: {
      model: {
        primary: "anthropic/claude-opus-4-6",
        fallbacks: ["codex-cli/gpt-5.5"],
      },
      models: {
        "anthropic/claude-opus-4-6": { alias: "Opus" },
        "codex-cli/gpt-5.5": {},
      },
    },
  },
}

Notas:

  • Si usas agents.defaults.models (lista de permitidos), también debes incluir allí tus modelos de backend de CLI.
  • Si el proveedor principal falla (autenticación, límites de tasa, tiempos de espera), OpenClaw intentará después con el backend de CLI.

Descripción general de la configuración

Todos los backends de CLI viven bajo:

agents.defaults.cliBackends

Cada entrada usa como clave un id de proveedor (por ejemplo, codex-cli, my-cli). El id de proveedor se convierte en el lado izquierdo de tu referencia de modelo:

<provider>/<model>

Configuración de ejemplo

{
  agents: {
    defaults: {
      cliBackends: {
        "codex-cli": {
          command: "/opt/homebrew/bin/codex",
        },
        "my-cli": {
          command: "my-cli",
          args: ["--json"],
          output: "json",
          input: "arg",
          modelArg: "--model",
          modelAliases: {
            "claude-opus-4-6": "opus",
            "claude-sonnet-4-6": "sonnet",
          },
          sessionArg: "--session",
          sessionMode: "existing",
          sessionIdFields: ["session_id", "conversation_id"],
          systemPromptArg: "--system",
          // For CLIs with a dedicated prompt-file flag:
          // systemPromptFileArg: "--system-file",
          // Codex-style CLIs can point at a prompt file instead:
          // systemPromptFileConfigArg: "-c",
          // systemPromptFileConfigKey: "model_instructions_file",
          systemPromptWhen: "first",
          imageArg: "--image",
          imageMode: "repeat",
          serialize: true,
        },
      },
    },
  },
}

Cómo funciona

  1. Selecciona un backend según el prefijo del proveedor (codex-cli/...).
  2. Construye un prompt de sistema usando el mismo prompt de OpenClaw + contexto del workspace.
  3. Ejecuta la CLI con un id de sesión (si es compatible) para que el historial se mantenga consistente. El backend claude-cli incluido mantiene vivo un proceso stdio de Claude por sesión de OpenClaw y envía turnos de seguimiento por stdin stream-json.
  4. Analiza la salida (JSON o texto sin formato) y devuelve el texto final.
  5. Persiste los ids de sesión por backend, para que los seguimientos reutilicen la misma sesión de CLI.

El backend OpenAI codex-cli incluido pasa el prompt de sistema de OpenClaw mediante la anulación de configuración model_instructions_file de Codex (-c model_instructions_file="..."). Codex no expone una marca estilo Claude --append-system-prompt, así que OpenClaw escribe el prompt ensamblado en un archivo temporal para cada sesión nueva de Codex CLI.

El backend Anthropic claude-cli incluido recibe la instantánea de Skills de OpenClaw de dos formas: el catálogo compacto de Skills de OpenClaw en el prompt de sistema anexado, y un Plugin temporal de Claude Code pasado con --plugin-dir. El Plugin contiene solo las Skills elegibles para ese agente/sesión, por lo que el resolvedor nativo de Skills de Claude Code ve el mismo conjunto filtrado que OpenClaw anunciaría de otro modo en el prompt. OpenClaw sigue aplicando las anulaciones de entorno/API keys de Skills al entorno del proceso hijo para la ejecución.

Claude CLI también tiene su propio modo de permisos no interactivo. OpenClaw mapea eso a la política de ejecución existente en lugar de agregar configuración específica de Claude: cuando la política de ejecución solicitada efectiva es YOLO (tools.exec.security: "full" y tools.exec.ask: "off"), OpenClaw agrega --permission-mode bypassPermissions. La configuración por agente agents.list[].tools.exec anula tools.exec global para ese agente. Para forzar un modo diferente de Claude, establece argumentos de backend raw explícitos como --permission-mode default o --permission-mode acceptEdits bajo agents.defaults.cliBackends.claude-cli.args y resumeArgs coincidentes.

El backend Anthropic claude-cli incluido también mapea niveles de OpenClaw /think a la marca nativa --effort de Claude Code para niveles distintos de off. minimal y low se mapean a low, adaptive y medium se mapean a medium, y high, xhigh y max se mapean directamente. Otros backends de CLI necesitan que su Plugin propietario declare un mapeador argv equivalente antes de que /think pueda afectar a la CLI generada.

Antes de que OpenClaw pueda usar el backend claude-cli incluido, Claude Code mismo ya debe haber iniciado sesión en el mismo host:

claude auth login
claude auth status --text
openclaw models auth login --provider anthropic --method cli --set-default

Usa agents.defaults.cliBackends.claude-cli.command solo cuando el binario claude aún no esté en PATH.

Sesiones

  • Si la CLI admite sesiones, establece sessionArg (por ejemplo, --session-id) o sessionArgs (marcador de posición {sessionId}) cuando el ID deba insertarse en varias marcas.
  • Si la CLI usa un subcomando de reanudación con marcas diferentes, establece resumeArgs (reemplaza args al reanudar) y opcionalmente resumeOutput (para reanudaciones no JSON).
  • sessionMode:
    • always: siempre envía un id de sesión (nuevo UUID si no hay ninguno almacenado).
    • existing: solo envía un id de sesión si antes se almacenó uno.
    • none: nunca envía un id de sesión.
  • claude-cli usa de forma predeterminada liveSession: "claude-stdio", output: "jsonl", e input: "stdin" para que los turnos de seguimiento reutilicen el proceso activo de Claude mientras esté activo. Ahora stdio cálido es el predeterminado, incluso para configuraciones personalizadas que omiten campos de transporte. Si el Gateway se reinicia o el proceso inactivo sale, OpenClaw reanuda desde el id de sesión de Claude almacenado. Los ids de sesión almacenados se verifican contra una transcripción de proyecto legible existente antes de reanudar, por lo que las vinculaciones fantasma se limpian con reason=transcript-missing en lugar de iniciar silenciosamente una sesión nueva de Claude CLI bajo --resume.
  • Las sesiones live de Claude mantienen guardas acotadas de salida JSONL. Los valores predeterminados permiten hasta 8 MiB y 20,000 líneas JSONL raw por turno. Los turnos de Claude con muchas herramientas pueden aumentarlos por backend con agents.defaults.cliBackends.claude-cli.reliability.outputLimits.maxTurnRawChars y maxTurnLines; OpenClaw limita esas opciones a 64 MiB y 100,000 líneas.
  • Las sesiones de CLI almacenadas son continuidad propiedad del proveedor. El reinicio diario implícito de sesión no las corta; /reset y las políticas explícitas session.reset sí lo hacen.

Notas de serialización:

  • serialize: true mantiene ordenadas las ejecuciones de la misma lane.
  • La mayoría de las CLI serializan en una lane de proveedor.
  • OpenClaw descarta la reutilización de sesiones de CLI almacenadas cuando cambia la identidad de autenticación seleccionada, incluido un cambio de id de perfil de autenticación, clave de API estática, token estático o identidad de cuenta OAuth cuando la CLI expone una. La rotación de tokens OAuth de acceso y refresh no corta la sesión de CLI almacenada. Si una CLI no expone un id de cuenta OAuth estable, OpenClaw deja que esa CLI haga cumplir los permisos de reanudación.

Preludio de respaldo desde sesiones claude-cli

Cuando un intento de claude-cli pasa por fallo a un candidato no CLI en agents.defaults.model.fallbacks, OpenClaw inicializa el siguiente intento con un preludio de contexto obtenido de la transcripción JSONL local de Claude Code en ~/.claude/projects/. Sin esta semilla, el proveedor de respaldo empezaría en frío porque la transcripción de sesión propia de OpenClaw está vacía para ejecuciones de claude-cli.

  • El preludio prefiere el resumen /compact más reciente o el marcador compact_boundary, luego anexa los turnos pos-límite más recientes hasta un presupuesto de caracteres. Los turnos previos al límite se descartan porque el resumen ya los representa.
  • Los bloques de herramientas se fusionan en sugerencias compactas (tool call: name) y (tool result: …) para mantener honesto el presupuesto del prompt. El resumen se etiqueta como (truncated) si se desborda.
  • Los respaldos de claude-cli a claude-cli del mismo proveedor dependen del propio --resume de Claude y omiten el preludio.
  • La semilla reutiliza la validación existente de ruta de archivo de sesión de Claude, por lo que no se pueden leer rutas arbitrarias.

Imágenes (paso directo)

Si tu CLI acepta rutas de imagen, establece imageArg:

imageArg: "--image",
imageMode: "repeat"

OpenClaw escribirá imágenes base64 en archivos temporales. Si imageArg está establecido, esas rutas se pasan como argumentos de CLI. Si falta imageArg, OpenClaw anexa las rutas de archivo al prompt (inyección de ruta), lo cual basta para las CLI que cargan automáticamente archivos locales desde rutas en texto sin formato.

Entradas / salidas

  • output: "json" (predeterminado) intenta analizar JSON y extraer texto + id de sesión.
  • Para la salida JSON de Gemini CLI, OpenClaw lee el texto de respuesta desde response y el uso desde stats cuando usage falta o está vacío.
  • output: "jsonl" analiza streams JSONL (por ejemplo, Codex CLI --json) y extrae el mensaje final del agente más los identificadores de sesión cuando están presentes.
  • output: "text" trata stdout como la respuesta final.

Modos de entrada:

  • input: "arg" (predeterminado) pasa el prompt como el último argumento de CLI.
  • input: "stdin" envía el prompt mediante stdin.
  • Si el prompt es muy largo y maxPromptArgChars está establecido, se usa stdin.

Valores predeterminados (propiedad del Plugin)

El Plugin de OpenAI incluido también registra un valor predeterminado para codex-cli:

  • command: "codex"
  • args: ["exec","--json","--color","never","--sandbox","workspace-write","--skip-git-repo-check"]
  • resumeArgs: ["exec","resume","{sessionId}","-c","sandbox_mode=\"workspace-write\"","--skip-git-repo-check"]
  • output: "jsonl"
  • resumeOutput: "text"
  • modelArg: "--model"
  • imageArg: "--image"
  • sessionMode: "existing"

El Plugin de Google incluido también registra un valor predeterminado para google-gemini-cli:

  • command: "gemini"
  • args: ["--output-format", "json", "--prompt", "{prompt}"]
  • resumeArgs: ["--resume", "{sessionId}", "--output-format", "json", "--prompt", "{prompt}"]
  • imageArg: "@"
  • imagePathScope: "workspace"
  • modelArg: "--model"
  • sessionMode: "existing"
  • sessionIdFields: ["session_id", "sessionId"]

Requisito previo: la CLI local de Gemini debe estar instalada y disponible como gemini en PATH (brew install gemini-cli o npm install -g @google/gemini-cli).

Notas sobre JSON de Gemini CLI:

  • El texto de respuesta se lee desde el campo JSON response.
  • El uso recurre a stats cuando usage está ausente o vacío.
  • stats.cached se normaliza en cacheRead de OpenClaw.
  • Si falta stats.input, OpenClaw deriva los tokens de entrada a partir de stats.input_tokens - stats.cached.

Sobrescriba solo si es necesario (común: ruta absoluta de command).

Valores predeterminados propiedad del Plugin

Los valores predeterminados del backend de CLI ahora forman parte de la superficie del Plugin:

  • Los Plugins los registran con api.registerCliBackend(...).
  • El id del backend se convierte en el prefijo del proveedor en las referencias de modelo.
  • La configuración de usuario en agents.defaults.cliBackends.<id> sigue sobrescribiendo el valor predeterminado del Plugin.
  • La limpieza de configuración específica del backend sigue siendo propiedad del Plugin mediante el hook opcional normalizeConfig.

Los Plugins que necesitan pequeños shims de compatibilidad de prompts/mensajes pueden declarar transformaciones de texto bidireccionales sin reemplazar un proveedor o backend de CLI:

api.registerTextTransforms({
  input: [
    { from: /red basket/g, to: "blue basket" },
    { from: /paper ticket/g, to: "digital ticket" },
    { from: /left shelf/g, to: "right shelf" },
  ],
  output: [
    { from: /blue basket/g, to: "red basket" },
    { from: /digital ticket/g, to: "paper ticket" },
    { from: /right shelf/g, to: "left shelf" },
  ],
});

input reescribe el prompt del sistema y el prompt de usuario pasados a la CLI. output reescribe los deltas del asistente transmitidos y el texto final analizado antes de que OpenClaw gestione sus propios marcadores de control y la entrega al canal.

Para las CLI que emiten JSONL compatible con Claude Code stream-json, configure jsonlDialect: "claude-stream-json" en la configuración de ese backend.

Superposiciones MCP incluidas

Los backends de CLI no reciben llamadas a herramientas de OpenClaw directamente, pero un backend puede optar por una superposición de configuración MCP generada con bundleMcp: true.

Comportamiento incluido actual:

  • claude-cli: archivo de configuración MCP estricto generado
  • codex-cli: sobrescrituras de configuración en línea para mcp_servers; el servidor local loopback generado por OpenClaw se marca con el modo de aprobación de herramientas por servidor de Codex para que las llamadas MCP no puedan quedarse bloqueadas en prompts de aprobación locales
  • google-gemini-cli: archivo de configuración del sistema de Gemini generado

Cuando MCP incluido está habilitado, OpenClaw:

  • inicia un servidor MCP HTTP de loopback que expone herramientas de Gateway al proceso de CLI
  • autentica el puente con un token por sesión (OPENCLAW_MCP_TOKEN)
  • limita el acceso a herramientas a la sesión, cuenta y contexto de canal actuales
  • carga los servidores bundle-MCP habilitados para el espacio de trabajo actual
  • los combina con cualquier forma existente de configuración/ajustes MCP del backend
  • reescribe la configuración de lanzamiento usando el modo de integración propiedad del backend desde la extensión propietaria

Si no hay servidores MCP habilitados, OpenClaw aun así inyecta una configuración estricta cuando un backend opta por MCP incluido para que las ejecuciones en segundo plano permanezcan aisladas.

Los runtimes MCP incluidos con alcance de sesión se almacenan en caché para reutilizarse dentro de una sesión y luego se eliminan tras mcp.sessionIdleTtlMs milisegundos de inactividad (valor predeterminado: 10 minutos; configure 0 para deshabilitar). Las ejecuciones integradas de una sola vez, como pruebas de autenticación, generación de slugs y solicitudes de recuperación de Active Memory limpian al finalizar la ejecución para que los procesos secundarios stdio y los flujos Streamable HTTP/SSE no sobrevivan a la ejecución.

Limitaciones

  • Sin llamadas directas a herramientas de OpenClaw. OpenClaw no inyecta llamadas a herramientas en el protocolo del backend de CLI. Los backends solo ven herramientas de Gateway cuando optan por bundleMcp: true.
  • El streaming es específico del backend. Algunos backends transmiten JSONL; otros almacenan en búfer hasta salir.
  • Las salidas estructuradas dependen del formato JSON de la CLI.
  • Las sesiones de Codex CLI se reanudan mediante salida de texto (sin JSONL), que es menos estructurada que la ejecución inicial con --json. Las sesiones de OpenClaw siguen funcionando con normalidad.

Solución de problemas

  • No se encuentra la CLI: configure command con una ruta completa.
  • Nombre de modelo incorrecto: use modelAliases para mapear provider/model → modelo de CLI.
  • Sin continuidad de sesión: asegúrese de que sessionArg esté configurado y que sessionMode no sea none (Codex CLI actualmente no puede reanudar con salida JSON).
  • Imágenes ignoradas: configure imageArg (y verifique que la CLI admita rutas de archivo).

Relacionado