Providers
Inworld
Inworld é um provedor de texto para fala (TTS) por streaming. No OpenClaw, ele sintetiza o áudio de respostas de saída (MP3 por padrão, OGG_OPUS para notas de voz) e áudio PCM para canais de telefonia, como Chamada de voz.
O OpenClaw envia requisições para o endpoint de TTS por streaming da Inworld, concatena os fragmentos de áudio em base64 retornados em um único buffer e entrega o resultado ao pipeline padrão de áudio de resposta.
| Propriedade | Valor |
|---|---|
| ID do provedor | inworld |
| Plugin | incluído, enabledByDefault: true |
| Contrato | speechProviders (somente TTS) |
| Variável de ambiente de autenticação | INWORLD_API_KEY (HTTP Basic, credencial Base64 do painel) |
| URL base | https://api.inworld.ai |
| Voz padrão | Sarah |
| Modelo padrão | inworld-tts-1.5-max |
| Saída | MP3 (padrão), OGG_OPUS (notas de voz), PCM 22050 Hz (telefonia) |
| Site | inworld.ai |
| Documentação | docs.inworld.ai/tts/tts |
Primeiros passos
Defina sua chave de API
Copie a credencial do seu painel da Inworld (Workspace > API Keys) e defina-a como uma variável de ambiente. O valor é enviado literalmente como a credencial HTTP Basic, portanto não o codifique em Base64 novamente nem o converta em um token bearer.
INWORLD_API_KEY=<base64-credential-from-dashboard>
Selecione Inworld em messages.tts
{
messages: {
tts: {
auto: "always",
provider: "inworld",
providers: {
inworld: {
voiceId: "Sarah",
modelId: "inworld-tts-1.5-max",
},
},
},
},
}
Envie uma mensagem
Envie uma resposta por qualquer canal conectado. O OpenClaw sintetiza o áudio com a Inworld e o entrega como MP3 (ou OGG_OPUS quando o canal espera uma nota de voz).
Opções de configuração
| Opção | Caminho | Descrição |
|---|---|---|
apiKey |
messages.tts.providers.inworld.apiKey |
Credencial Base64 do painel. Usa INWORLD_API_KEY como fallback. |
baseUrl |
messages.tts.providers.inworld.baseUrl |
Substitui a URL base da API da Inworld (padrão https://api.inworld.ai). |
voiceId |
messages.tts.providers.inworld.voiceId |
Identificador de voz (padrão Sarah). |
modelId |
messages.tts.providers.inworld.modelId |
ID do modelo TTS (padrão inworld-tts-1.5-max). |
temperature |
messages.tts.providers.inworld.temperature |
Temperatura de amostragem 0..2 (opcional). |
Observações
Autenticação
A Inworld usa autenticação HTTP Basic com uma única string de credencial
codificada em Base64. Copie-a literalmente do painel da Inworld. O provedor a envia
como Authorization: Basic <apiKey> sem nenhuma codificação adicional, portanto
não a codifique em Base64 você mesmo e não passe um token no estilo bearer.
Consulte observações de autenticação de TTS para o mesmo destaque.
Modelos
IDs de modelo compatíveis: inworld-tts-1.5-max (padrão),
inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.
Saídas de áudio
As respostas usam MP3 por padrão. Quando o destino do canal é voice-note,
o OpenClaw solicita OGG_OPUS à Inworld para que o áudio seja reproduzido como uma
bolha de voz nativa. A síntese de telefonia usa PCM bruto a 22050 Hz para alimentar
a ponte de telefonia.
Endpoints personalizados
Substitua o host da API com messages.tts.providers.inworld.baseUrl.
Barras finais são removidas antes do envio das requisições.