Providers

Deepgram

Deepgram é uma API de speech-to-text. No OpenClaw, ela é usada para transcrição de áudio/notas de voz de entrada por meio de tools.media.audio e para STT em streaming do Voice Call por meio de plugins.entries.voice-call.config.streaming.

Para transcrição em lote, o OpenClaw faz upload do arquivo de áudio completo para a Deepgram e injeta a transcrição no pipeline de resposta ({{Transcript}} + bloco [Audio]). Para STT em streaming do Voice Call, o OpenClaw encaminha frames ao vivo G.711 u-law pelo endpoint WebSocket listen da Deepgram e emite transcrições parciais ou finais conforme a Deepgram as retorna.

Detalhe	Valor
Site	deepgram.com
Documentação	developers.deepgram.com
Auth	`DEEPGRAM_API_KEY`
Modelo padrão	`nova-3`

Primeiros passos

Defina sua chave de API

Adicione sua chave de API da Deepgram ao ambiente:

DEEPGRAM_API_KEY=dg_...

Ative o provedor de áudio

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

Envie uma nota de voz

Envie uma mensagem de áudio por qualquer canal conectado. O OpenClaw a transcreve pela Deepgram e injeta a transcrição no pipeline de resposta.

Opções de configuração

Opção	Caminho	Descrição
`model`	`tools.media.audio.models[].model`	ID do modelo da Deepgram (padrão: `nova-3`)
`language`	`tools.media.audio.models[].language`	Dica de idioma (opcional)
`detect_language`	`tools.media.audio.providerOptions.deepgram.detect_language`	Ativa detecção de idioma (opcional)
`punctuate`	`tools.media.audio.providerOptions.deepgram.punctuate`	Ativa pontuação (opcional)
`smart_format`	`tools.media.audio.providerOptions.deepgram.smart_format`	Ativa formatação inteligente (opcional)

Com dica de idioma

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

Com opções da Deepgram

{
  tools: {
    media: {
      audio: {
        enabled: true,
        providerOptions: {
          deepgram: {
            detect_language: true,
            punctuate: true,
            smart_format: true,
          },
        },
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

STT em streaming do Voice Call

O Plugin empacotado deepgram também registra um provedor de transcrição em tempo real para o Plugin Voice Call.

Configuração	Caminho de configuração	Padrão
Chave de API	`plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey`	Usa `DEEPGRAM_API_KEY` como fallback
Modelo	`...deepgram.model`	`nova-3`
Idioma	`...deepgram.language`	(não definido)
Codificação	`...deepgram.encoding`	`mulaw`
Taxa de amostra	`...deepgram.sampleRate`	`8000`
Endpointing	`...deepgram.endpointingMs`	`800`
Resultados parciais	`...deepgram.interimResults`	`true`

{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "deepgram",
            providers: {
              deepgram: {
                apiKey: "${DEEPGRAM_API_KEY}",
                model: "nova-3",
                endpointingMs: 800,
                language: "en-US",
              },
            },
          },
        },
      },
    },
  },
}

Observações

Autenticação

A autenticação segue a ordem padrão de autenticação de provedor. DEEPGRAM_API_KEY é o caminho mais simples.

Proxy e endpoints personalizados

Substitua endpoints ou cabeçalhos com tools.media.audio.baseUrl e tools.media.audio.headers ao usar um proxy.

Comportamento da saída

A saída segue as mesmas regras de áudio dos outros provedores (limites de tamanho, timeouts, injeção de transcrição).

Relacionado

Media tools

Visão geral do pipeline de processamento de áudio, imagem e vídeo.

Configuration

Referência completa de configuração, incluindo ajustes de ferramentas de mídia.

Troubleshooting

Problemas comuns e etapas de depuração.

FAQ

Perguntas frequentes sobre a configuração do OpenClaw.

# Primeiros passos

Defina sua chave de API

Ative o provedor de áudio

Envie uma nota de voz

# Opções de configuração

Com dica de idioma

Com opções da Deepgram

# STT em streaming do Voice Call

# Observações

# Relacionado

Primeiros passos

Opções de configuração

STT em streaming do Voice Call

Observações

Relacionado