Providers
Inworld
Inworld ist ein Streaming-Text-to-Speech-Provider (TTS). In OpenClaw synthetisiert er ausgehendes Antwort-Audio (standardmäßig MP3, OGG_OPUS für Sprachnachrichten) und PCM-Audio für Telefoniekanäle wie Voice Call.
OpenClaw sendet Anfragen an den Streaming-TTS-Endpunkt von Inworld, verkettet die zurückgegebenen Base64-Audio-Chunks zu einem einzelnen Puffer und übergibt das Ergebnis an die standardmäßige Antwort-Audio-Pipeline.
| Eigenschaft | Wert |
|---|---|
| Provider-ID | inworld |
| Plugin | mitgeliefert, enabledByDefault: true |
| Kontrakt | speechProviders (nur TTS) |
| Auth-Env-Var | INWORLD_API_KEY (HTTP Basic, Base64-Dashboard-Zugangsdaten) |
| Basis-URL | https://api.inworld.ai |
| Standardstimme | Sarah |
| Standardmodell | inworld-tts-1.5-max |
| Ausgabe | MP3 (Standard), OGG_OPUS (Sprachnachrichten), PCM 22050 Hz (Telefonie) |
| Website | inworld.ai |
| Dokumentation | docs.inworld.ai/tts/tts |
Erste Schritte
API-Schlüssel festlegen
Kopieren Sie die Zugangsdaten aus Ihrem Inworld-Dashboard (Workspace > API Keys) und legen Sie sie als Env-Var fest. Der Wert wird unverändert als HTTP-Basic- Zugangsdaten gesendet. Kodieren Sie ihn daher nicht erneut mit Base64 und wandeln Sie ihn nicht in ein Bearer-Token um.
INWORLD_API_KEY=<base64-credential-from-dashboard>
Inworld in messages.tts auswählen
{
messages: {
tts: {
auto: "always",
provider: "inworld",
providers: {
inworld: {
voiceId: "Sarah",
modelId: "inworld-tts-1.5-max",
},
},
},
},
}
Nachricht senden
Senden Sie eine Antwort über einen beliebigen verbundenen Kanal. OpenClaw synthetisiert das Audio mit Inworld und liefert es als MP3 aus (oder als OGG_OPUS, wenn der Kanal eine Sprachnachricht erwartet).
Konfigurationsoptionen
| Option | Pfad | Beschreibung |
|---|---|---|
apiKey |
messages.tts.providers.inworld.apiKey |
Base64-Dashboard-Zugangsdaten. Fällt auf INWORLD_API_KEY zurück. |
baseUrl |
messages.tts.providers.inworld.baseUrl |
Überschreibt die Inworld-API-Basis-URL (Standard https://api.inworld.ai). |
voiceId |
messages.tts.providers.inworld.voiceId |
Stimmkennung (Standard Sarah). |
modelId |
messages.tts.providers.inworld.modelId |
TTS-Modell-ID (Standard inworld-tts-1.5-max). |
temperature |
messages.tts.providers.inworld.temperature |
Sampling-Temperatur 0..2 (optional). |
Hinweise
Authentifizierung
Inworld verwendet HTTP-Basic-Authentifizierung mit einer einzelnen Base64-kodierten
Zeichenfolge für Zugangsdaten. Kopieren Sie sie unverändert aus dem Inworld-Dashboard. Der Provider sendet
sie als Authorization: Basic <apiKey> ohne weitere Kodierung. Kodieren Sie sie daher
nicht selbst mit Base64 und übergeben Sie kein Bearer-artiges Token.
Siehe TTS-Authentifizierungshinweise für denselben Hinweis.
Modelle
Unterstützte Modell-IDs: inworld-tts-1.5-max (Standard),
inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.
Audioausgaben
Antworten verwenden standardmäßig MP3. Wenn das Kanalziel voice-note ist,
fordert OpenClaw bei Inworld OGG_OPUS an, damit das Audio als native
Sprachblase abgespielt wird. Die Telefoniesynthese verwendet rohes PCM mit 22050 Hz, um
die Telefonie-Bridge zu speisen.
Benutzerdefinierte Endpunkte
Überschreiben Sie den API-Host mit messages.tts.providers.inworld.baseUrl.
Abschließende Schrägstriche werden entfernt, bevor Anfragen gesendet werden.