Technical reference
Uso e custos da API
Este documento lista recursos que podem invocar chaves de API e onde seus custos aparecem. Ele se concentra em recursos do OpenClaw que podem gerar uso de provedores ou chamadas de API pagas.
Onde os custos aparecem (chat + CLI)
Instantâneo de custo por sessão
/statusmostra o modelo da sessão atual, o uso de contexto e os tokens da última resposta.- Se o modelo usar autenticação por chave de API,
/statustambém mostra o custo estimado da última resposta. - Se os metadados da sessão ao vivo estiverem escassos,
/statuspode recuperar contadores de tokens/cache e o rótulo do modelo de runtime ativo a partir da entrada de uso mais recente do transcript. Valores ao vivo não zero existentes ainda têm precedência, e totais de transcript do tamanho do prompt podem prevalecer quando os totais armazenados estão ausentes ou são menores.
Rodapé de custo por mensagem
/usage fullacrescenta um rodapé de uso a cada resposta, incluindo custo estimado (somente chave de API)./usage tokensmostra apenas tokens; fluxos de OAuth/token em estilo assinatura e CLI ocultam o custo em dólares.- Observação sobre o Gemini CLI: quando a CLI retorna saída JSON, o OpenClaw lê o uso de
stats, normalizastats.cachedparacacheReade deriva os tokens de entrada destats.input_tokens - stats.cachedquando necessário.
Observação sobre Anthropic: a equipe da Anthropic nos informou que o uso do Claude CLI no estilo OpenClaw voltou a ser permitido, então o OpenClaw trata a reutilização do Claude CLI e o uso de claude -p como sancionados para esta integração, a menos que a Anthropic publique uma nova política. A Anthropic ainda não expõe uma estimativa em dólares por mensagem que o OpenClaw possa mostrar em /usage full.
Janelas de uso da CLI (cotas de provedores)
openclaw status --usageeopenclaw channels listmostram janelas de uso dos provedores (instantâneos de cota, não custos por mensagem).- A saída legível para humanos é normalizada para
X% leftentre provedores. - Provedores atuais de janelas de uso: Anthropic, GitHub Copilot, Gemini CLI, OpenAI Codex, MiniMax, Xiaomi e z.ai.
- Observação sobre MiniMax: seus campos brutos
usage_percent/usagePercentsignificam cota restante, então o OpenClaw os inverte antes de exibir. Campos baseados em contagem ainda prevalecem quando presentes. Se o provedor retornarmodel_remains, o OpenClaw prefere a entrada do modelo de chat, deriva o rótulo da janela a partir dos carimbos de data/hora quando necessário e inclui o nome do modelo no rótulo do plano. - A autenticação de uso dessas janelas de cota vem de hooks específicos do provedor quando disponíveis; caso contrário, o OpenClaw recorre a credenciais OAuth/chave de API correspondentes de perfis de autenticação, env ou configuração.
Consulte Uso de tokens e custos para detalhes e exemplos.
Como as chaves são descobertas
O OpenClaw pode obter credenciais de:
- Perfis de autenticação (por agente, armazenados em
auth-profiles.json). - Variáveis de ambiente (por exemplo,
OPENAI_API_KEY,BRAVE_API_KEY,FIRECRAWL_API_KEY). - Configuração (
models.providers.*.apiKey,plugins.entries.*.config.webSearch.apiKey,plugins.entries.firecrawl.config.webFetch.apiKey,memorySearch.*,talk.providers.*.apiKey). - Skills (
skills.entries.<name>.apiKey), que podem exportar chaves para o ambiente do processo da skill.
Recursos que podem gastar chaves
1) Respostas do modelo principal (chat + ferramentas)
Cada resposta ou chamada de ferramenta usa o provedor do modelo atual (OpenAI, Anthropic etc.). Esta é a principal fonte de uso e custo.
Isso também inclui provedores hospedados em estilo assinatura que ainda cobram fora da UI local do OpenClaw, como OpenAI Codex, Alibaba Cloud Model Studio Coding Plan, MiniMax Coding Plan, Z.AI / GLM Coding Plan e o caminho de login Claude da Anthropic no OpenClaw com Extra Usage habilitado.
Consulte Modelos para configuração de preços e Uso de tokens e custos para exibição.
2) Compreensão de mídia (áudio/imagem/vídeo)
Mídias de entrada podem ser resumidas/transcritas antes de a resposta ser executada. Isso usa APIs de modelo/provedor.
- Áudio: OpenAI / Groq / Deepgram / DeepInfra / Google / Mistral.
- Imagem: OpenAI / OpenRouter / Anthropic / DeepInfra / Google / MiniMax / Moonshot / Qwen / Z.AI.
- Vídeo: Google / Qwen / Moonshot.
Consulte Compreensão de mídia.
3) Geração de imagens e vídeos
Capacidades compartilhadas de geração também podem gastar chaves de provedores:
- Geração de imagens: OpenAI / Google / DeepInfra / fal / MiniMax
- Geração de vídeos: DeepInfra / Qwen
A geração de imagens pode inferir um padrão de provedor com autenticação quando agents.defaults.imageGenerationModel não está definido. A geração de vídeos atualmente exige um agents.defaults.videoGenerationModel explícito, como qwen/wan2.6-t2v.
Consulte Geração de imagens, Qwen Cloud e Modelos.
4) Embeddings de memória + busca semântica
A busca semântica de memória usa APIs de embeddings quando configurada para provedores remotos:
memorySearch.provider = "openai"→ embeddings da OpenAImemorySearch.provider = "gemini"→ embeddings do GeminimemorySearch.provider = "voyage"→ embeddings da VoyagememorySearch.provider = "mistral"→ embeddings da MistralmemorySearch.provider = "deepinfra"→ embeddings da DeepInframemorySearch.provider = "lmstudio"→ embeddings do LM Studio (local/auto-hospedado)memorySearch.provider = "ollama"→ embeddings do Ollama (local/auto-hospedado; normalmente sem cobrança de API hospedada)- Fallback opcional para um provedor remoto se os embeddings locais falharem
Você pode mantê-la local com memorySearch.provider = "local" (sem uso de API).
Consulte Memória.
5) Ferramenta de busca na web
web_search pode incorrer em cobranças de uso dependendo do seu provedor:
- Brave Search API:
BRAVE_API_KEYouplugins.entries.brave.config.webSearch.apiKey - Exa:
EXA_API_KEYouplugins.entries.exa.config.webSearch.apiKey - Firecrawl:
FIRECRAWL_API_KEYouplugins.entries.firecrawl.config.webSearch.apiKey - Gemini (Google Search):
GEMINI_API_KEYouplugins.entries.google.config.webSearch.apiKey - Grok (xAI):
XAI_API_KEYouplugins.entries.xai.config.webSearch.apiKey - Kimi (Moonshot):
KIMI_API_KEY,MOONSHOT_API_KEYouplugins.entries.moonshot.config.webSearch.apiKey - MiniMax Search:
MINIMAX_CODE_PLAN_KEY,MINIMAX_CODING_API_KEY,MINIMAX_API_KEYouplugins.entries.minimax.config.webSearch.apiKey - Ollama Web Search: sem chave para um host local do Ollama acessível e com sessão iniciada; a busca direta em
https://ollama.comusaOLLAMA_API_KEY, e hosts protegidos por autenticação podem reutilizar a autenticação bearer normal do provedor Ollama - Perplexity Search API:
PERPLEXITY_API_KEY,OPENROUTER_API_KEYouplugins.entries.perplexity.config.webSearch.apiKey - Tavily:
TAVILY_API_KEYouplugins.entries.tavily.config.webSearch.apiKey - DuckDuckGo: fallback sem chave (sem cobrança de API, mas não oficial e baseado em HTML)
- SearXNG:
SEARXNG_BASE_URLouplugins.entries.searxng.config.webSearch.baseUrl(sem chave/auto-hospedado; sem cobrança de API hospedada)
Caminhos legados de provedor tools.web.search.* ainda são carregados por meio do shim temporário de compatibilidade, mas não são mais a superfície de configuração recomendada.
Crédito grátis do Brave Search: Cada plano do Brave inclui US$ 5/mês em crédito grátis renovável. O plano Search custa US$ 5 por 1.000 solicitações, então o crédito cobre 1.000 solicitações/mês sem cobrança. Defina seu limite de uso no painel do Brave para evitar cobranças inesperadas.
Consulte Ferramentas web.
5) Ferramenta de busca de conteúdo web (Firecrawl)
web_fetch pode chamar Firecrawl quando uma chave de API está presente:
FIRECRAWL_API_KEYouplugins.entries.firecrawl.config.webFetch.apiKey
Se o Firecrawl não estiver configurado, a ferramenta recorre a busca direta mais o plugin web-readability incluído (sem API paga). Desabilite plugins.entries.web-readability.enabled para pular a extração local com Readability.
Consulte Ferramentas web.
6) Instantâneos de uso do provedor (status/saúde)
Alguns comandos de status chamam endpoints de uso do provedor para exibir janelas de cota ou a saúde da autenticação. Normalmente são chamadas de baixo volume, mas ainda acessam APIs dos provedores:
openclaw status --usageopenclaw models status --json
Consulte CLI de modelos.
7) Sumarização de salvaguarda de Compaction
A salvaguarda de Compaction pode resumir o histórico da sessão usando o modelo atual, o que invoca APIs de provedores quando é executada.
Consulte Gerenciamento de sessão + Compaction.
8) Varredura / sonda de modelos
openclaw models scan pode sondar modelos do OpenRouter e usa OPENROUTER_API_KEY quando a sondagem está habilitada.
Consulte CLI de modelos.
9) Talk (fala)
O modo Talk pode invocar ElevenLabs quando configurado:
ELEVENLABS_API_KEYoutalk.providers.elevenlabs.apiKey
Consulte Modo Talk.
10) Skills (APIs de terceiros)
Skills podem armazenar apiKey em skills.entries.<name>.apiKey. Se uma skill usar essa chave para APIs externas, ela poderá incorrer em custos de acordo com o provedor da skill.
Consulte Skills.