Providers

LM Studio

O LM Studio é um app amigável, mas poderoso, para executar modelos de pesos abertos no seu próprio hardware. Ele permite executar modelos llama.cpp (GGUF) ou MLX (Apple Silicon). Vem em um pacote com GUI ou como daemon sem interface gráfica (llmster). Para documentação do produto e de configuração, consulte lmstudio.ai.

Início rápido

Instale o LM Studio (desktop) ou llmster (sem interface gráfica) e, em seguida, inicie o servidor local:

curl -fsSL https://lmstudio.ai/install.sh | bash

Inicie o servidor

Certifique-se de iniciar o app desktop ou executar o daemon usando o seguinte comando:

lms daemon up

lms server start --port 1234

Se você estiver usando o app, certifique-se de ter o JIT habilitado para uma experiência fluida. Saiba mais no guia de JIT e TTL do LM Studio.

Se a autenticação do LM Studio estiver habilitada, defina LM_API_TOKEN:

export LM_API_TOKEN="your-lm-studio-api-token"

Se a autenticação do LM Studio estiver desabilitada, você pode deixar a chave de API em branco durante a configuração interativa do OpenClaw.

Para detalhes de configuração da autenticação do LM Studio, consulte Autenticação do LM Studio.

Execute a integração inicial e escolha LM Studio:

openclaw onboard

Na integração inicial, use o prompt Default model para escolher seu modelo do LM Studio.

Você também pode definir ou alterá-lo depois:

openclaw models set lmstudio/qwen/qwen3.5-9b

As chaves de modelo do LM Studio seguem o formato author/model-name (por exemplo, qwen/qwen3.5-9b). As refs de modelo do OpenClaw prefixam o nome do provedor: lmstudio/qwen/qwen3.5-9b. Você pode encontrar a chave exata de um modelo executando curl http://localhost:1234/api/v1/models e verificando o campo key.

Integração inicial não interativa

Use a integração inicial não interativa quando quiser automatizar a configuração por script (CI, provisionamento, bootstrap remoto):

openclaw onboard \
  --non-interactive \
  --accept-risk \
  --auth-choice lmstudio

Ou especifique a URL base, o modelo e a chave de API opcional:

openclaw onboard \
  --non-interactive \
  --accept-risk \
  --auth-choice lmstudio \
  --custom-base-url http://localhost:1234/v1 \
  --lmstudio-api-key "$LM_API_TOKEN" \
  --custom-model-id qwen/qwen3.5-9b

--custom-model-id recebe a chave do modelo conforme retornada pelo LM Studio (por exemplo, qwen/qwen3.5-9b), sem o prefixo de provedor lmstudio/.

Para servidores LM Studio autenticados, passe --lmstudio-api-key ou defina LM_API_TOKEN. Para servidores LM Studio não autenticados, omita a chave; o OpenClaw armazena um marcador local não secreto.

--custom-api-key continua compatível por compatibilidade, mas --lmstudio-api-key é preferível para o LM Studio.

Isso grava models.providers.lmstudio e define o modelo padrão como lmstudio/<custom-model-id>. Quando você fornece uma chave de API, a configuração também grava o perfil de autenticação lmstudio:default.

A configuração interativa pode solicitar um comprimento de contexto de carregamento preferido opcional e aplicá-lo aos modelos do LM Studio descobertos que ela salva na configuração. A configuração do Plugin do LM Studio confia no endpoint configurado do LM Studio para solicitações de modelo, incluindo hosts loopback, LAN e tailnet. Você pode optar por sair definindo models.providers.lmstudio.request.allowPrivateNetwork: false.

Configuração

Compatibilidade de uso em streaming

O LM Studio é compatível com uso em streaming. Quando ele não emite um objeto usage no formato do OpenAI, o OpenClaw recupera as contagens de tokens a partir dos metadados timings.prompt_n / timings.predicted_n no estilo llama.cpp.

O mesmo comportamento de uso em streaming se aplica a estes backends locais compatíveis com OpenAI:

vLLM
SGLang
llama.cpp
LocalAI
Jan
TabbyAPI
text-generation-webui

Compatibilidade de raciocínio

Quando a descoberta de /api/v1/models do LM Studio relata opções de raciocínio específicas do modelo, o OpenClaw expõe os valores reasoning_effort compatíveis com OpenAI correspondentes nos metadados de compatibilidade do modelo. Builds atuais do LM Studio podem anunciar opções binárias de UI, como allowed_options: ["off", "on"], enquanto rejeitam esses valores em /v1/chat/completions; o OpenClaw normaliza esse formato binário de descoberta para none, minimal, low, medium, high e xhigh antes de enviar solicitações. Configurações salvas antigas do LM Studio que contêm mapas de raciocínio off/on são normalizadas da mesma forma quando o catálogo é carregado.

Configuração explícita

{
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://localhost:1234/v1",
        apiKey: "${LM_API_TOKEN}",
        api: "openai-completions",
        models: [
          {
            id: "qwen/qwen3-coder-next",
            name: "Qwen 3 Coder Next",
            reasoning: false,
            input: ["text"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 128000,
            maxTokens: 8192,
          },
        ],
      },
    },
  },
}

Solução de problemas

LM Studio não detectado

Certifique-se de que o LM Studio esteja em execução. Se a autenticação estiver habilitada, defina também LM_API_TOKEN:

# Start via desktop app, or headless:
lms server start --port 1234

Verifique se a API está acessível:

curl http://localhost:1234/api/v1/models

Erros de autenticação (HTTP 401)

Se a configuração relatar HTTP 401, verifique sua chave de API:

Verifique se LM_API_TOKEN corresponde à chave configurada no LM Studio.
Para detalhes de configuração da autenticação do LM Studio, consulte Autenticação do LM Studio.
Se seu servidor não exigir autenticação, deixe a chave em branco durante a configuração.

Carregamento de modelo just-in-time

O LM Studio oferece suporte ao carregamento de modelos just-in-time (JIT), em que os modelos são carregados na primeira solicitação. O OpenClaw pré-carrega modelos por meio do endpoint de carregamento nativo do LM Studio por padrão, o que ajuda quando o JIT está desabilitado. Para permitir que o JIT, o TTL ocioso e o comportamento de auto-remoção do LM Studio gerenciem o ciclo de vida do modelo, desabilite a etapa de pré-carregamento do OpenClaw:

{
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://localhost:1234/v1",
        api: "openai-completions",
        params: { preload: false },
        models: [{ id: "qwen/qwen3.5-9b" }],
      },
    },
  },
}

Host LM Studio em LAN ou tailnet

Use o endereço acessível do host do LM Studio, mantenha /v1 e certifique-se de que o LM Studio esteja vinculado além do loopback nessa máquina:

{
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://gpu-box.local:1234/v1",
        apiKey: "lmstudio",
        api: "openai-completions",
        models: [{ id: "qwen/qwen3.5-9b" }],
      },
    },
  },
}

Diferentemente de provedores genéricos compatíveis com OpenAI, lmstudio confia automaticamente no endpoint local/privado configurado para solicitações de modelo protegidas. IDs de provedor personalizados de loopback, como localhost ou 127.0.0.1, também são confiáveis automaticamente; para IDs de provedor personalizados de LAN, tailnet ou DNS privado, defina models.providers.<id>.request.allowPrivateNetwork: true explicitamente.

LM Studio

Início rápido

Integração inicial não interativa

Configuração

Compatibilidade de uso em streaming

Compatibilidade de raciocínio

Configuração explícita

Solução de problemas

LM Studio não detectado

Erros de autenticação (HTTP 401)

Carregamento de modelo just-in-time

Host LM Studio em LAN ou tailnet

Relacionados

Ask OpenClaw

# Início rápido

# Integração inicial não interativa

# Configuração

# Compatibilidade de uso em streaming

# Compatibilidade de raciocínio

# Configuração explícita

# Solução de problemas

# LM Studio não detectado

# Erros de autenticação (HTTP 401)

# Carregamento de modelo just-in-time

# Host LM Studio em LAN ou tailnet

# Relacionados

Início rápido

Integração inicial não interativa

Configuração

Compatibilidade de uso em streaming

Compatibilidade de raciocínio

Configuração explícita

Solução de problemas

LM Studio não detectado

Erros de autenticação (HTTP 401)

Carregamento de modelo just-in-time

Host LM Studio em LAN ou tailnet

Relacionados