Technical reference

Uso y costos de la API

Este documento enumera funciones que pueden invocar claves de API y dónde aparecen sus costos. Se centra en funciones de OpenClaw que pueden generar uso de proveedores o llamadas de API pagas.

Dónde aparecen los costos (chat + CLI)

Instantánea de costo por sesión

/status muestra el modelo de la sesión actual, el uso de contexto y los tokens de la última respuesta.
Si el modelo usa autenticación con clave de API, /status también muestra el costo estimado de la última respuesta.
Si los metadatos de la sesión en vivo son escasos, /status puede recuperar contadores de tokens/caché y la etiqueta del modelo de runtime activo desde la entrada de uso más reciente de la transcripción. Los valores en vivo distintos de cero existentes siguen teniendo prioridad, y los totales de transcripción del tamaño del prompt pueden prevalecer cuando los totales almacenados faltan o son menores.

Pie de costo por mensaje

/usage full agrega un pie de uso a cada respuesta, incluido el costo estimado (solo clave de API).
/usage tokens muestra solo tokens; los flujos de OAuth/token de estilo suscripción y CLI ocultan el costo en dólares.
Nota de Gemini CLI: cuando la CLI devuelve salida JSON, OpenClaw lee el uso desde stats, normaliza stats.cached en cacheRead y deriva los tokens de entrada a partir de stats.input_tokens - stats.cached cuando es necesario.

Nota de Anthropic: el personal de Anthropic nos dijo que el uso de Claude CLI al estilo de OpenClaw vuelve a estar permitido, por lo que OpenClaw trata la reutilización de Claude CLI y el uso de claude -p como aprobados para esta integración salvo que Anthropic publique una nueva política. Anthropic aún no expone una estimación en dólares por mensaje que OpenClaw pueda mostrar en /usage full.

Ventanas de uso de CLI (cuotas de proveedor)

openclaw status --usage y openclaw channels list muestran ventanas de uso del proveedor (instantáneas de cuota, no costos por mensaje).
La salida legible para humanos se normaliza a X% left en todos los proveedores.
Proveedores actuales de ventanas de uso: Anthropic, GitHub Copilot, Gemini CLI, OpenAI Codex, MiniMax, Xiaomi y z.ai.
Nota de MiniMax: sus campos sin procesar usage_percent / usagePercent significan cuota restante, por lo que OpenClaw los invierte antes de mostrarlos. Los campos basados en conteos siguen prevaleciendo cuando están presentes. Si el proveedor devuelve model_remains, OpenClaw prefiere la entrada del modelo de chat, deriva la etiqueta de ventana a partir de marcas de tiempo cuando es necesario e incluye el nombre del modelo en la etiqueta del plan.
La autenticación de uso para esas ventanas de cuota proviene de hooks específicos del proveedor cuando están disponibles; de lo contrario, OpenClaw recurre a credenciales OAuth/clave de API coincidentes desde perfiles de autenticación, env o configuración.

Consulta Uso de tokens y costos para ver detalles y ejemplos.

Cómo se descubren las claves

OpenClaw puede recoger credenciales de:

Perfiles de autenticación (por agente, almacenados en auth-profiles.json).
Variables de entorno (por ejemplo, OPENAI_API_KEY, BRAVE_API_KEY, FIRECRAWL_API_KEY).
Configuración (models.providers.*.apiKey, plugins.entries.*.config.webSearch.apiKey, plugins.entries.firecrawl.config.webFetch.apiKey, memorySearch.*, talk.providers.*.apiKey).
Skills (skills.entries.<name>.apiKey), que pueden exportar claves al env del proceso de la skill.

Funciones que pueden gastar claves

1) Respuestas del modelo principal (chat + herramientas)

Cada respuesta o llamada de herramienta usa el proveedor de modelo actual (OpenAI, Anthropic, etc.). Esta es la fuente principal de uso y costo.

Esto también incluye proveedores alojados de estilo suscripción que siguen facturando fuera de la UI local de OpenClaw, como OpenAI Codex, Alibaba Cloud Model Studio Coding Plan, MiniMax Coding Plan, Z.AI / GLM Coding Plan y la ruta de inicio de sesión de Claude de OpenClaw con Anthropic con Extra Usage habilitado.

Consulta Modelos para la configuración de precios y Uso de tokens y costos para la visualización.

2) Comprensión de medios (audio/imagen/video)

Los medios entrantes pueden resumirse/transcribirse antes de que se ejecute la respuesta. Esto usa APIs de modelo/proveedor.

Audio: OpenAI / Groq / Deepgram / DeepInfra / Google / Mistral.
Imagen: OpenAI / OpenRouter / Anthropic / DeepInfra / Google / MiniMax / Moonshot / Qwen / Z.AI.
Video: Google / Qwen / Moonshot.

Consulta Comprensión de medios.

3) Generación de imágenes y videos

Las capacidades de generación compartidas también pueden gastar claves de proveedor:

Generación de imágenes: OpenAI / Google / DeepInfra / fal / MiniMax
Generación de video: DeepInfra / Qwen

La generación de imágenes puede inferir un valor predeterminado de proveedor respaldado por autenticación cuando agents.defaults.imageGenerationModel no está definido. Actualmente, la generación de video requiere un agents.defaults.videoGenerationModel explícito, como qwen/wan2.6-t2v.

Consulta Generación de imágenes, Qwen Cloud y Modelos.

4) Embeddings de memoria + búsqueda semántica

La búsqueda semántica de memoria usa APIs de embeddings cuando está configurada para proveedores remotos:

memorySearch.provider = "openai" → embeddings de OpenAI
memorySearch.provider = "gemini" → embeddings de Gemini
memorySearch.provider = "voyage" → embeddings de Voyage
memorySearch.provider = "mistral" → embeddings de Mistral
memorySearch.provider = "deepinfra" → embeddings de DeepInfra
memorySearch.provider = "lmstudio" → embeddings de LM Studio (local/autohospedado)
memorySearch.provider = "ollama" → embeddings de Ollama (local/autohospedado; normalmente sin facturación de API alojada)
Fallback opcional a un proveedor remoto si fallan los embeddings locales

Puedes mantenerlo local con memorySearch.provider = "local" (sin uso de API).

Consulta Memoria.

5) Herramienta de búsqueda web

web_search puede incurrir en cargos de uso según tu proveedor:

Brave Search API: BRAVE_API_KEY o plugins.entries.brave.config.webSearch.apiKey
Exa: EXA_API_KEY o plugins.entries.exa.config.webSearch.apiKey
Firecrawl: FIRECRAWL_API_KEY o plugins.entries.firecrawl.config.webSearch.apiKey
Gemini (Google Search): GEMINI_API_KEY o plugins.entries.google.config.webSearch.apiKey
Grok (xAI): XAI_API_KEY o plugins.entries.xai.config.webSearch.apiKey
Kimi (Moonshot): KIMI_API_KEY, MOONSHOT_API_KEY o plugins.entries.moonshot.config.webSearch.apiKey
MiniMax Search: MINIMAX_CODE_PLAN_KEY, MINIMAX_CODING_API_KEY, MINIMAX_API_KEY o plugins.entries.minimax.config.webSearch.apiKey
Ollama Web Search: sin clave para un host local de Ollama accesible y con sesión iniciada; la búsqueda directa en https://ollama.com usa OLLAMA_API_KEY, y los hosts protegidos por autenticación pueden reutilizar la autenticación bearer normal del proveedor Ollama
Perplexity Search API: PERPLEXITY_API_KEY, OPENROUTER_API_KEY o plugins.entries.perplexity.config.webSearch.apiKey
Tavily: TAVILY_API_KEY o plugins.entries.tavily.config.webSearch.apiKey
DuckDuckGo: fallback sin clave (sin facturación de API, pero no oficial y basado en HTML)
SearXNG: SEARXNG_BASE_URL o plugins.entries.searxng.config.webSearch.baseUrl (sin clave/autohospedado; sin facturación de API alojada)

Las rutas heredadas de proveedor tools.web.search.* siguen cargándose mediante el shim de compatibilidad temporal, pero ya no son la superficie de configuración recomendada.

Crédito gratuito de Brave Search: Cada plan de Brave incluye $5/mes de crédito gratuito renovable. El plan Search cuesta $5 por cada 1,000 solicitudes, por lo que el crédito cubre 1,000 solicitudes/mes sin cargo. Define tu límite de uso en el panel de Brave para evitar cargos inesperados.

Consulta Herramientas web.

5) Herramienta de obtención web (Firecrawl)

web_fetch puede llamar a Firecrawl cuando hay una clave de API presente:

FIRECRAWL_API_KEY o plugins.entries.firecrawl.config.webFetch.apiKey

Si Firecrawl no está configurado, la herramienta recurre a fetch directo más el plugin web-readability incluido (sin API paga). Deshabilita plugins.entries.web-readability.enabled para omitir la extracción local de Readability.

Consulta Herramientas web.

6) Instantáneas de uso del proveedor (estado/salud)

Algunos comandos de estado llaman a endpoints de uso del proveedor para mostrar ventanas de cuota o salud de autenticación. Suelen ser llamadas de bajo volumen, pero aun así llegan a APIs del proveedor:

openclaw status --usage
openclaw models status --json

Consulta CLI de modelos.

7) Resumen de salvaguarda de Compaction

La salvaguarda de Compaction puede resumir el historial de sesión usando el modelo actual, lo que invoca APIs del proveedor cuando se ejecuta.

Consulta Gestión de sesiones + Compaction.

8) Escaneo / sondeo de modelos

openclaw models scan puede sondear modelos de OpenRouter y usa OPENROUTER_API_KEY cuando el sondeo está habilitado.

Consulta CLI de modelos.

9) Conversación (voz)

El modo de conversación puede invocar ElevenLabs cuando está configurado:

ELEVENLABS_API_KEY o talk.providers.elevenlabs.apiKey

Consulta Modo de conversación.

10) Skills (APIs de terceros)

Skills puede almacenar apiKey en skills.entries.<name>.apiKey. Si una skill usa esa clave para APIs externas, puede incurrir en costos según el proveedor de la skill.

Consulta Skills.

Uso y costos de la API

Dónde aparecen los costos (chat + CLI)

Cómo se descubren las claves

Funciones que pueden gastar claves

1) Respuestas del modelo principal (chat + herramientas)

2) Comprensión de medios (audio/imagen/video)

3) Generación de imágenes y videos

4) Embeddings de memoria + búsqueda semántica

5) Herramienta de búsqueda web

5) Herramienta de obtención web (Firecrawl)

6) Instantáneas de uso del proveedor (estado/salud)

7) Resumen de salvaguarda de Compaction

8) Escaneo / sondeo de modelos

9) Conversación (voz)

10) Skills (APIs de terceros)

Relacionado

Ask OpenClaw

# Dónde aparecen los costos (chat + CLI)

# Cómo se descubren las claves

# Funciones que pueden gastar claves

# 1) Respuestas del modelo principal (chat + herramientas)

# 2) Comprensión de medios (audio/imagen/video)

# 3) Generación de imágenes y videos

# 4) Embeddings de memoria + búsqueda semántica

# 5) Herramienta de búsqueda web

# 5) Herramienta de obtención web (Firecrawl)

# 6) Instantáneas de uso del proveedor (estado/salud)

# 7) Resumen de salvaguarda de Compaction

# 8) Escaneo / sondeo de modelos

# 9) Conversación (voz)

# 10) Skills (APIs de terceros)

# Relacionado

Dónde aparecen los costos (chat + CLI)

Cómo se descubren las claves

Funciones que pueden gastar claves

1) Respuestas del modelo principal (chat + herramientas)

2) Comprensión de medios (audio/imagen/video)

3) Generación de imágenes y videos

4) Embeddings de memoria + búsqueda semántica

5) Herramienta de búsqueda web

5) Herramienta de obtención web (Firecrawl)

6) Instantáneas de uso del proveedor (estado/salud)

7) Resumen de salvaguarda de Compaction

8) Escaneo / sondeo de modelos

9) Conversación (voz)

10) Skills (APIs de terceros)

Relacionado