Providers

Inworld

Inworld jest dostawcą strumieniowego przetwarzania tekstu na mowę (TTS). W OpenClaw syntetyzuje wychodzący dźwięk odpowiedzi (domyślnie MP3, OGG_OPUS dla notatek głosowych) oraz dźwięk PCM dla kanałów telefonicznych, takich jak Voice Call.

OpenClaw wysyła żądania do strumieniowego punktu końcowego TTS Inworld, łączy zwrócone fragmenty audio base64 w pojedynczy bufor i przekazuje wynik do standardowego potoku dźwięku odpowiedzi.

Właściwość	Wartość
Identyfikator dostawcy	`inworld`
Plugin	wbudowany, `enabledByDefault: true`
Kontrakt	`speechProviders` (tylko TTS)
Zmienna środowiskowa uwierzytelniania	`INWORLD_API_KEY` (HTTP Basic, poświadczenie Base64 z panelu)
Bazowy URL	`https://api.inworld.ai`
Domyślny głos	`Sarah`
Domyślny model	`inworld-tts-1.5-max`
Wyjście	MP3 (domyślnie), OGG_OPUS (notatki głosowe), PCM 22050 Hz (telefonia)
Witryna	inworld.ai
Dokumentacja	docs.inworld.ai/tts/tts

Pierwsze kroki

Ustaw klucz API

Skopiuj poświadczenie z panelu Inworld (Workspace > API Keys) i ustaw je jako zmienną środowiskową. Wartość jest wysyłana dosłownie jako poświadczenie HTTP Basic, więc nie koduj jej ponownie w Base64 ani nie konwertuj jej na token bearer.

INWORLD_API_KEY=<base64-credential-from-dashboard>

Wybierz Inworld w messages.tts

{
  messages: {
    tts: {
      auto: "always",
      provider: "inworld",
      providers: {
        inworld: {
          voiceId: "Sarah",
          modelId: "inworld-tts-1.5-max",
        },
      },
    },
  },
}

Wyślij wiadomość

Wyślij odpowiedź przez dowolny połączony kanał. OpenClaw syntetyzuje dźwięk za pomocą Inworld i dostarcza go jako MP3 (lub OGG_OPUS, gdy kanał oczekuje notatki głosowej).

Opcje konfiguracji

Opcja	Ścieżka	Opis
`apiKey`	`messages.tts.providers.inworld.apiKey`	Poświadczenie Base64 z panelu. Używa zastępczo `INWORLD_API_KEY`.
`baseUrl`	`messages.tts.providers.inworld.baseUrl`	Nadpisuje bazowy URL API Inworld (domyślnie `https://api.inworld.ai`).
`voiceId`	`messages.tts.providers.inworld.voiceId`	Identyfikator głosu (domyślnie `Sarah`).
`modelId`	`messages.tts.providers.inworld.modelId`	Identyfikator modelu TTS (domyślnie `inworld-tts-1.5-max`).
`temperature`	`messages.tts.providers.inworld.temperature`	Temperatura próbkowania `0..2` (opcjonalnie).

Uwagi

Uwierzytelnianie

Inworld używa uwierzytelniania HTTP Basic z pojedynczym ciągiem poświadczenia zakodowanym w Base64. Skopiuj go dosłownie z panelu Inworld. Dostawca wysyła go jako Authorization: Basic <apiKey> bez żadnego dalszego kodowania, więc nie koduj go samodzielnie w Base64 i nie przekazuj tokenu w stylu bearer. Zobacz uwagi dotyczące uwierzytelniania TTS, aby uzyskać to samo ostrzeżenie.

Modele

Obsługiwane identyfikatory modeli: inworld-tts-1.5-max (domyślnie), inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.

Wyjścia audio

Odpowiedzi domyślnie używają MP3. Gdy docelowym typem kanału jest voice-note, OpenClaw prosi Inworld o OGG_OPUS, aby dźwięk był odtwarzany jako natywna dymka głosowa. Synteza telefoniczna używa surowego PCM przy 22050 Hz, aby zasilać most telefoniczny.

Niestandardowe punkty końcowe

Nadpisz host API za pomocą messages.tts.providers.inworld.baseUrl. Końcowe ukośniki są usuwane przed wysłaniem żądań.

Powiązane

Tekst na mowę

Przegląd TTS, dostawcy i konfiguracja messages.tts.

Konfiguracja

Pełna dokumentacja konfiguracji, w tym ustawienia messages.tts.

Dostawcy

Wszyscy wbudowani dostawcy OpenClaw.

Rozwiązywanie problemów

Typowe problemy i kroki debugowania.

# Pierwsze kroki