Providers

Inworld

Inworld è un provider di sintesi vocale (TTS) in streaming. In OpenClaw sintetizza l'audio delle risposte in uscita (MP3 per impostazione predefinita, OGG_OPUS per le note vocali) e audio PCM per canali di telefonia come Voice Call.

OpenClaw invia richieste all'endpoint TTS in streaming di Inworld, concatena i chunk audio base64 restituiti in un unico buffer e passa il risultato alla pipeline standard dell'audio di risposta.

Proprietà	Valore
ID provider	`inworld`
Plugin	in bundle, `enabledByDefault: true`
Contratto	`speechProviders` (solo TTS)
Var env auth	`INWORLD_API_KEY` (HTTP Basic, credenziale dashboard Base64)
URL base	`https://api.inworld.ai`
Voce predefinita	`Sarah`
Modello predefinito	`inworld-tts-1.5-max`
Uscita	MP3 (predefinita), OGG_OPUS (note vocali), PCM 22050 Hz (telefonia)
Sito web	inworld.ai
Documentazione	docs.inworld.ai/tts/tts

Per iniziare

Imposta la tua chiave API

Copia la credenziale dalla dashboard Inworld (Workspace > API Keys) e impostala come variabile env. Il valore viene inviato letteralmente come credenziale HTTP Basic, quindi non codificarlo di nuovo in Base64 né convertirlo in un token bearer.

INWORLD_API_KEY=<base64-credential-from-dashboard>

Seleziona Inworld in messages.tts

{
  messages: {
    tts: {
      auto: "always",
      provider: "inworld",
      providers: {
        inworld: {
          voiceId: "Sarah",
          modelId: "inworld-tts-1.5-max",
        },
      },
    },
  },
}

Invia un messaggio

Invia una risposta tramite qualsiasi canale connesso. OpenClaw sintetizza l'audio con Inworld e lo consegna come MP3 (o OGG_OPUS quando il canale richiede una nota vocale).

Opzioni di configurazione

Opzione	Percorso	Descrizione
`apiKey`	`messages.tts.providers.inworld.apiKey`	Credenziale dashboard Base64. Ripiega su `INWORLD_API_KEY`.
`baseUrl`	`messages.tts.providers.inworld.baseUrl`	Sovrascrive l'URL base dell'API Inworld (predefinito `https://api.inworld.ai`).
`voiceId`	`messages.tts.providers.inworld.voiceId`	Identificatore della voce (predefinito `Sarah`).
`modelId`	`messages.tts.providers.inworld.modelId`	ID modello TTS (predefinito `inworld-tts-1.5-max`).
`temperature`	`messages.tts.providers.inworld.temperature`	Temperatura di campionamento `0..2` (opzionale).

Note

Autenticazione

Inworld usa l'autenticazione HTTP Basic con una singola stringa di credenziale codificata in Base64. Copiala letteralmente dalla dashboard Inworld. Il provider la invia come Authorization: Basic <apiKey> senza alcuna ulteriore codifica, quindi non codificarla tu stesso in Base64 e non passare un token in stile bearer. Vedi le note sull'autenticazione TTS per lo stesso richiamo.

Modelli

ID modello supportati: inworld-tts-1.5-max (predefinito), inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.

Output audio

Le risposte usano MP3 per impostazione predefinita. Quando il target del canale è voice-note, OpenClaw chiede a Inworld OGG_OPUS affinché l'audio venga riprodotto come una bolla vocale nativa. La sintesi per telefonia usa PCM grezzo a 22050 Hz per alimentare il bridge di telefonia.

Endpoint personalizzati

Sovrascrivi l'host API con messages.tts.providers.inworld.baseUrl. Le barre finali vengono rimosse prima dell'invio delle richieste.

Correlati

Sintesi vocale

Panoramica TTS, provider e configurazione messages.tts.

Configurazione

Riferimento completo alla configurazione, incluse le impostazioni messages.tts.

Provider

Tutti i provider OpenClaw in bundle.

Risoluzione dei problemi

Problemi comuni e passaggi di debug.

# Per iniziare