Providers
Inworld
Inworld es un proveedor de texto a voz (TTS) en streaming. En OpenClaw sintetiza audio de respuesta saliente (MP3 de forma predeterminada, OGG_OPUS para notas de voz) y audio PCM para canales de telefonía como Voice Call.
OpenClaw publica en el endpoint de TTS en streaming de Inworld, concatena los fragmentos de audio base64 devueltos en un único búfer y pasa el resultado al pipeline estándar de audio de respuesta.
| Propiedad | Valor |
|---|---|
| ID del proveedor | inworld |
| Plugin | incluido, enabledByDefault: true |
| Contrato | speechProviders (solo TTS) |
| Variable de entorno de autenticación | INWORLD_API_KEY (HTTP Basic, credencial Base64 del panel) |
| URL base | https://api.inworld.ai |
| Voz predeterminada | Sarah |
| Modelo predeterminado | inworld-tts-1.5-max |
| Salida | MP3 (predeterminado), OGG_OPUS (notas de voz), PCM 22050 Hz (telefonía) |
| Sitio web | inworld.ai |
| Documentación | docs.inworld.ai/tts/tts |
Primeros pasos
Configura tu clave de API
Copia la credencial desde tu panel de Inworld (Workspace > API Keys) y configúrala como una variable de entorno. El valor se envía literalmente como la credencial HTTP Basic, así que no vuelvas a codificarlo en Base64 ni lo conviertas en un token bearer.
INWORLD_API_KEY=<base64-credential-from-dashboard>
Selecciona Inworld en messages.tts
{
messages: {
tts: {
auto: "always",
provider: "inworld",
providers: {
inworld: {
voiceId: "Sarah",
modelId: "inworld-tts-1.5-max",
},
},
},
},
}
Envía un mensaje
Envía una respuesta a través de cualquier canal conectado. OpenClaw sintetiza el audio con Inworld y lo entrega como MP3 (u OGG_OPUS cuando el canal espera una nota de voz).
Opciones de configuración
| Opción | Ruta | Descripción |
|---|---|---|
apiKey |
messages.tts.providers.inworld.apiKey |
Credencial Base64 del panel. Recurre a INWORLD_API_KEY si no está configurada. |
baseUrl |
messages.tts.providers.inworld.baseUrl |
Sobrescribe la URL base de la API de Inworld (predeterminada https://api.inworld.ai). |
voiceId |
messages.tts.providers.inworld.voiceId |
Identificador de voz (predeterminado Sarah). |
modelId |
messages.tts.providers.inworld.modelId |
ID del modelo TTS (predeterminado inworld-tts-1.5-max). |
temperature |
messages.tts.providers.inworld.temperature |
Temperatura de muestreo 0..2 (opcional). |
Notas
Autenticación
Inworld usa autenticación HTTP Basic con una única cadena de credencial
codificada en Base64. Cópiala literalmente desde el panel de Inworld. El proveedor la envía
como Authorization: Basic <apiKey> sin ninguna codificación adicional, así que
no la codifiques en Base64 tú mismo y no pases un token de estilo bearer.
Consulta notas de autenticación de TTS para ver el mismo aviso.
Modelos
IDs de modelo admitidos: inworld-tts-1.5-max (predeterminado),
inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.
Salidas de audio
Las respuestas usan MP3 de forma predeterminada. Cuando el destino del canal es voice-note,
OpenClaw solicita a Inworld OGG_OPUS para que el audio se reproduzca como una
burbuja de voz nativa. La síntesis de telefonía usa PCM sin procesar a 22050 Hz para alimentar
el puente de telefonía.
Endpoints personalizados
Sobrescribe el host de la API con messages.tts.providers.inworld.baseUrl.
Las barras finales se eliminan antes de enviar las solicitudes.