Providers
Inworld
Inworld jest dostawcą strumieniowego przetwarzania tekstu na mowę (TTS). W OpenClaw syntetyzuje wychodzący dźwięk odpowiedzi (domyślnie MP3, OGG_OPUS dla notatek głosowych) oraz dźwięk PCM dla kanałów telefonicznych, takich jak Voice Call.
OpenClaw wysyła żądania do strumieniowego punktu końcowego TTS Inworld, łączy zwrócone fragmenty audio base64 w pojedynczy bufor i przekazuje wynik do standardowego potoku dźwięku odpowiedzi.
| Właściwość | Wartość |
|---|---|
| Identyfikator dostawcy | inworld |
| Plugin | wbudowany, enabledByDefault: true |
| Kontrakt | speechProviders (tylko TTS) |
| Zmienna środowiskowa uwierzytelniania | INWORLD_API_KEY (HTTP Basic, poświadczenie Base64 z panelu) |
| Bazowy URL | https://api.inworld.ai |
| Domyślny głos | Sarah |
| Domyślny model | inworld-tts-1.5-max |
| Wyjście | MP3 (domyślnie), OGG_OPUS (notatki głosowe), PCM 22050 Hz (telefonia) |
| Witryna | inworld.ai |
| Dokumentacja | docs.inworld.ai/tts/tts |
Pierwsze kroki
Ustaw klucz API
Skopiuj poświadczenie z panelu Inworld (Workspace > API Keys) i ustaw je jako zmienną środowiskową. Wartość jest wysyłana dosłownie jako poświadczenie HTTP Basic, więc nie koduj jej ponownie w Base64 ani nie konwertuj jej na token bearer.
INWORLD_API_KEY=<base64-credential-from-dashboard>
Wybierz Inworld w messages.tts
{
messages: {
tts: {
auto: "always",
provider: "inworld",
providers: {
inworld: {
voiceId: "Sarah",
modelId: "inworld-tts-1.5-max",
},
},
},
},
}
Wyślij wiadomość
Wyślij odpowiedź przez dowolny połączony kanał. OpenClaw syntetyzuje dźwięk za pomocą Inworld i dostarcza go jako MP3 (lub OGG_OPUS, gdy kanał oczekuje notatki głosowej).
Opcje konfiguracji
| Opcja | Ścieżka | Opis |
|---|---|---|
apiKey |
messages.tts.providers.inworld.apiKey |
Poświadczenie Base64 z panelu. Używa zastępczo INWORLD_API_KEY. |
baseUrl |
messages.tts.providers.inworld.baseUrl |
Nadpisuje bazowy URL API Inworld (domyślnie https://api.inworld.ai). |
voiceId |
messages.tts.providers.inworld.voiceId |
Identyfikator głosu (domyślnie Sarah). |
modelId |
messages.tts.providers.inworld.modelId |
Identyfikator modelu TTS (domyślnie inworld-tts-1.5-max). |
temperature |
messages.tts.providers.inworld.temperature |
Temperatura próbkowania 0..2 (opcjonalnie). |
Uwagi
Uwierzytelnianie
Inworld używa uwierzytelniania HTTP Basic z pojedynczym ciągiem
poświadczenia zakodowanym w Base64. Skopiuj go dosłownie z panelu
Inworld. Dostawca wysyła go jako Authorization: Basic <apiKey> bez
żadnego dalszego kodowania, więc nie koduj go samodzielnie w Base64 i nie
przekazuj tokenu w stylu bearer. Zobacz uwagi dotyczące uwierzytelniania TTS,
aby uzyskać to samo ostrzeżenie.
Modele
Obsługiwane identyfikatory modeli: inworld-tts-1.5-max (domyślnie),
inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.
Wyjścia audio
Odpowiedzi domyślnie używają MP3. Gdy docelowym typem kanału jest voice-note,
OpenClaw prosi Inworld o OGG_OPUS, aby dźwięk był odtwarzany jako natywna
dymka głosowa. Synteza telefoniczna używa surowego PCM przy 22050 Hz, aby
zasilać most telefoniczny.
Niestandardowe punkty końcowe
Nadpisz host API za pomocą messages.tts.providers.inworld.baseUrl.
Końcowe ukośniki są usuwane przed wysłaniem żądań.