Providers

Inworld

Inworld è un provider di sintesi vocale (TTS) in streaming. In OpenClaw sintetizza l'audio delle risposte in uscita (MP3 per impostazione predefinita, OGG_OPUS per le note vocali) e audio PCM per canali di telefonia come Voice Call.

OpenClaw invia richieste all'endpoint TTS in streaming di Inworld, concatena i chunk audio base64 restituiti in un unico buffer e passa il risultato alla pipeline standard dell'audio di risposta.

Proprietà Valore
ID provider inworld
Plugin in bundle, enabledByDefault: true
Contratto speechProviders (solo TTS)
Var env auth INWORLD_API_KEY (HTTP Basic, credenziale dashboard Base64)
URL base https://api.inworld.ai
Voce predefinita Sarah
Modello predefinito inworld-tts-1.5-max
Uscita MP3 (predefinita), OGG_OPUS (note vocali), PCM 22050 Hz (telefonia)
Sito web inworld.ai
Documentazione docs.inworld.ai/tts/tts

Per iniziare

  • Imposta la tua chiave API

    Copia la credenziale dalla dashboard Inworld (Workspace > API Keys) e impostala come variabile env. Il valore viene inviato letteralmente come credenziale HTTP Basic, quindi non codificarlo di nuovo in Base64 né convertirlo in un token bearer.

    INWORLD_API_KEY=<base64-credential-from-dashboard>
    
  • Seleziona Inworld in messages.tts

    {
      messages: {
        tts: {
          auto: "always",
          provider: "inworld",
          providers: {
            inworld: {
              voiceId: "Sarah",
              modelId: "inworld-tts-1.5-max",
            },
          },
        },
      },
    }
    
  • Invia un messaggio

    Invia una risposta tramite qualsiasi canale connesso. OpenClaw sintetizza l'audio con Inworld e lo consegna come MP3 (o OGG_OPUS quando il canale richiede una nota vocale).

  • Opzioni di configurazione

    Opzione Percorso Descrizione
    apiKey messages.tts.providers.inworld.apiKey Credenziale dashboard Base64. Ripiega su INWORLD_API_KEY.
    baseUrl messages.tts.providers.inworld.baseUrl Sovrascrive l'URL base dell'API Inworld (predefinito https://api.inworld.ai).
    voiceId messages.tts.providers.inworld.voiceId Identificatore della voce (predefinito Sarah).
    modelId messages.tts.providers.inworld.modelId ID modello TTS (predefinito inworld-tts-1.5-max).
    temperature messages.tts.providers.inworld.temperature Temperatura di campionamento 0..2 (opzionale).

    Note

    Autenticazione

    Inworld usa l'autenticazione HTTP Basic con una singola stringa di credenziale codificata in Base64. Copiala letteralmente dalla dashboard Inworld. Il provider la invia come Authorization: Basic <apiKey> senza alcuna ulteriore codifica, quindi non codificarla tu stesso in Base64 e non passare un token in stile bearer. Vedi le note sull'autenticazione TTS per lo stesso richiamo.

    Modelli

    ID modello supportati: inworld-tts-1.5-max (predefinito), inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.

    Output audio

    Le risposte usano MP3 per impostazione predefinita. Quando il target del canale è voice-note, OpenClaw chiede a Inworld OGG_OPUS affinché l'audio venga riprodotto come una bolla vocale nativa. La sintesi per telefonia usa PCM grezzo a 22050 Hz per alimentare il bridge di telefonia.

    Endpoint personalizzati

    Sovrascrivi l'host API con messages.tts.providers.inworld.baseUrl. Le barre finali vengono rimosse prima dell'invio delle richieste.

    Correlati