Technical reference

Utilizzo dell'API e costi

Questo documento elenca le funzionalità che possono invocare chiavi API e dove vengono visualizzati i relativi costi. Si concentra sulle funzionalità di OpenClaw che possono generare utilizzo dei provider o chiamate API a pagamento.

Dove vengono visualizzati i costi (chat + CLI)

Snapshot del costo per sessione

  • /status mostra il modello della sessione corrente, l'utilizzo del contesto e i token dell'ultima risposta.
  • Se il modello usa autenticazione con chiave API, /status mostra anche il costo stimato dell'ultima risposta.
  • Se i metadati della sessione live sono scarsi, /status può recuperare i contatori di token/cache e l'etichetta del modello runtime attivo dall'ultima voce di utilizzo della trascrizione. I valori live non nulli esistenti hanno comunque la precedenza, e i totali della trascrizione dimensionati sul prompt possono prevalere quando i totali memorizzati mancano o sono inferiori.

Footer del costo per messaggio

  • /usage full aggiunge un footer di utilizzo a ogni risposta, incluso il costo stimato (solo chiave API).
  • /usage tokens mostra solo i token; i flussi OAuth/token in stile abbonamento e CLI nascondono il costo in dollari.
  • Nota su Gemini CLI: quando la CLI restituisce output JSON, OpenClaw legge l'utilizzo da stats, normalizza stats.cached in cacheRead e deriva i token di input da stats.input_tokens - stats.cached quando necessario.

Nota su Anthropic: lo staff di Anthropic ci ha comunicato che l'utilizzo di Claude CLI in stile OpenClaw è di nuovo consentito, quindi OpenClaw considera il riuso di Claude CLI e l'utilizzo di claude -p autorizzati per questa integrazione, a meno che Anthropic non pubblichi una nuova policy. Anthropic continua a non esporre una stima in dollari per messaggio che OpenClaw possa mostrare in /usage full.

Finestre di utilizzo della CLI (quote dei provider)

  • openclaw status --usage e openclaw channels list mostrano le finestre di utilizzo dei provider (snapshot delle quote, non costi per messaggio).
  • L'output leggibile dalle persone viene normalizzato in X% left tra i provider.
  • Provider attuali per le finestre di utilizzo: Anthropic, GitHub Copilot, Gemini CLI, OpenAI Codex, MiniMax, Xiaomi e z.ai.
  • Nota su MiniMax: i suoi campi raw usage_percent / usagePercent indicano la quota rimanente, quindi OpenClaw li inverte prima della visualizzazione. I campi basati sul conteggio hanno comunque la precedenza quando presenti. Se il provider restituisce model_remains, OpenClaw preferisce la voce del modello chat, deriva l'etichetta della finestra dai timestamp quando necessario e include il nome del modello nell'etichetta del piano.
  • L'autenticazione per l'utilizzo di queste finestre di quota proviene da hook specifici del provider quando disponibili; altrimenti OpenClaw ripiega su credenziali OAuth/chiave API corrispondenti da profili di autenticazione, env o configurazione.

Consulta Utilizzo dei token e costi per dettagli ed esempi.

Come vengono scoperte le chiavi

OpenClaw può rilevare credenziali da:

  • Profili di autenticazione (per agente, memorizzati in auth-profiles.json).
  • Variabili d'ambiente (ad es. OPENAI_API_KEY, BRAVE_API_KEY, FIRECRAWL_API_KEY).
  • Configurazione (models.providers.*.apiKey, plugins.entries.*.config.webSearch.apiKey, plugins.entries.firecrawl.config.webFetch.apiKey, memorySearch.*, talk.providers.*.apiKey).
  • Skills (skills.entries.<name>.apiKey) che possono esportare chiavi nell'env del processo della skill.

Funzionalità che possono consumare chiavi

1) Risposte del modello core (chat + strumenti)

Ogni risposta o chiamata a uno strumento usa il provider del modello corrente (OpenAI, Anthropic, ecc.). Questa è la fonte principale di utilizzo e costi.

Questo include anche provider ospitati in stile abbonamento che fatturano comunque al di fuori dell'interfaccia utente locale di OpenClaw, come OpenAI Codex, Alibaba Cloud Model Studio Coding Plan, MiniMax Coding Plan, Z.AI / GLM Coding Plan e il percorso di accesso OpenClaw Claude di Anthropic con Utilizzo extra abilitato.

Consulta Modelli per la configurazione dei prezzi e Utilizzo dei token e costi per la visualizzazione.

2) Comprensione dei media (audio/immagine/video)

I media in ingresso possono essere riassunti/trascritti prima che venga eseguita la risposta. Questo usa API di modelli/provider.

  • Audio: OpenAI / Groq / Deepgram / DeepInfra / Google / Mistral.
  • Immagine: OpenAI / OpenRouter / Anthropic / DeepInfra / Google / MiniMax / Moonshot / Qwen / Z.AI.
  • Video: Google / Qwen / Moonshot.

Consulta Comprensione dei media.

3) Generazione di immagini e video

Anche le capacità di generazione condivise possono consumare chiavi dei provider:

  • Generazione di immagini: OpenAI / Google / DeepInfra / fal / MiniMax
  • Generazione di video: DeepInfra / Qwen

La generazione di immagini può inferire un default del provider basato sull'autenticazione quando agents.defaults.imageGenerationModel non è impostato. La generazione di video attualmente richiede un valore esplicito di agents.defaults.videoGenerationModel, ad esempio qwen/wan2.6-t2v.

Consulta Generazione di immagini, Qwen Cloud e Modelli.

4) Embedding di memoria + ricerca semantica

La ricerca semantica nella memoria usa API di embedding quando è configurata per provider remoti:

  • memorySearch.provider = "openai" → embedding OpenAI
  • memorySearch.provider = "gemini" → embedding Gemini
  • memorySearch.provider = "voyage" → embedding Voyage
  • memorySearch.provider = "mistral" → embedding Mistral
  • memorySearch.provider = "deepinfra" → embedding DeepInfra
  • memorySearch.provider = "lmstudio" → embedding LM Studio (locale/self-hosted)
  • memorySearch.provider = "ollama" → embedding Ollama (locale/self-hosted; in genere senza fatturazione API ospitata)
  • Fallback opzionale a un provider remoto se gli embedding locali non riescono

Puoi mantenerla locale con memorySearch.provider = "local" (nessun utilizzo API).

Consulta Memoria.

5) Strumento di ricerca web

web_search può comportare addebiti di utilizzo a seconda del provider:

  • Brave Search API: BRAVE_API_KEY o plugins.entries.brave.config.webSearch.apiKey
  • Exa: EXA_API_KEY o plugins.entries.exa.config.webSearch.apiKey
  • Firecrawl: FIRECRAWL_API_KEY o plugins.entries.firecrawl.config.webSearch.apiKey
  • Gemini (Google Search): GEMINI_API_KEY o plugins.entries.google.config.webSearch.apiKey
  • Grok (xAI): XAI_API_KEY o plugins.entries.xai.config.webSearch.apiKey
  • Kimi (Moonshot): KIMI_API_KEY, MOONSHOT_API_KEY o plugins.entries.moonshot.config.webSearch.apiKey
  • MiniMax Search: MINIMAX_CODE_PLAN_KEY, MINIMAX_CODING_API_KEY, MINIMAX_API_KEY o plugins.entries.minimax.config.webSearch.apiKey
  • Ollama Web Search: senza chiave per un host Ollama locale raggiungibile e con accesso effettuato; la ricerca diretta su https://ollama.com usa OLLAMA_API_KEY, e gli host protetti da autenticazione possono riutilizzare la normale autenticazione bearer del provider Ollama
  • Perplexity Search API: PERPLEXITY_API_KEY, OPENROUTER_API_KEY o plugins.entries.perplexity.config.webSearch.apiKey
  • Tavily: TAVILY_API_KEY o plugins.entries.tavily.config.webSearch.apiKey
  • DuckDuckGo: fallback senza chiave (nessuna fatturazione API, ma non ufficiale e basato su HTML)
  • SearXNG: SEARXNG_BASE_URL o plugins.entries.searxng.config.webSearch.baseUrl (senza chiave/self-hosted; nessuna fatturazione API ospitata)

I percorsi provider legacy tools.web.search.* vengono ancora caricati tramite lo shim temporaneo di compatibilità, ma non sono più la superficie di configurazione consigliata.

Credito gratuito Brave Search: Ogni piano Brave include $5/mese di credito gratuito rinnovabile. Il piano Search costa $5 per 1.000 richieste, quindi il credito copre 1.000 richieste/mese senza addebiti. Imposta il limite di utilizzo nel dashboard Brave per evitare addebiti imprevisti.

Consulta Strumenti web.

5) Strumento di recupero web (Firecrawl)

web_fetch può chiamare Firecrawl quando è presente una chiave API:

  • FIRECRAWL_API_KEY o plugins.entries.firecrawl.config.webFetch.apiKey

Se Firecrawl non è configurato, lo strumento ripiega sul recupero diretto più il Plugin web-readability incluso (nessuna API a pagamento). Disabilita plugins.entries.web-readability.enabled per saltare l'estrazione locale Readability.

Consulta Strumenti web.

6) Snapshot di utilizzo del provider (stato/salute)

Alcuni comandi di stato chiamano endpoint di utilizzo del provider per visualizzare finestre di quota o salute dell'autenticazione. Di solito sono chiamate a basso volume, ma raggiungono comunque le API dei provider:

  • openclaw status --usage
  • openclaw models status --json

Consulta CLI dei modelli.

7) Riassunto di salvaguardia della Compaction

La salvaguardia della Compaction può riassumere la cronologia della sessione usando il modello corrente, il che invoca API dei provider quando viene eseguita.

Consulta Gestione della sessione + Compaction.

8) Scansione / probe dei modelli

openclaw models scan può sondare i modelli OpenRouter e usa OPENROUTER_API_KEY quando il sondaggio è abilitato.

Consulta CLI dei modelli.

9) Parlato (voce)

La modalità parlato può invocare ElevenLabs quando configurata:

  • ELEVENLABS_API_KEY o talk.providers.elevenlabs.apiKey

Consulta Modalità parlato.

10) Skills (API di terze parti)

Le Skills possono memorizzare apiKey in skills.entries.<name>.apiKey. Se una skill usa quella chiave per API esterne, può generare costi secondo il provider della skill.

Consulta Skills.

Correlati