Providers
Inworld
Inworld는 스트리밍 텍스트 음성 변환(TTS) 제공자입니다. OpenClaw에서는 아웃바운드 답장 오디오(기본값은 MP3, 음성 메모는 OGG_OPUS)와 Voice Call 같은 전화 통신 채널용 PCM 오디오를 합성합니다.
OpenClaw는 Inworld의 스트리밍 TTS 엔드포인트에 게시하고, 반환된 base64 오디오 청크를 단일 버퍼로 이어 붙인 뒤 그 결과를 표준 답장 오디오 파이프라인에 전달합니다.
| 속성 | 값 |
|---|---|
| 제공자 ID | inworld |
| Plugin | 번들됨, enabledByDefault: true |
| 계약 | speechProviders (TTS 전용) |
| 인증 환경 변수 | INWORLD_API_KEY (HTTP Basic, Base64 대시보드 자격 증명) |
| 기본 URL | https://api.inworld.ai |
| 기본 음성 | Sarah |
| 기본 모델 | inworld-tts-1.5-max |
| 출력 | MP3 (기본값), OGG_OPUS (음성 메모), PCM 22050 Hz (전화 통신) |
| 웹사이트 | inworld.ai |
| 문서 | docs.inworld.ai/tts/tts |
시작하기
Set your API key
Inworld 대시보드(Workspace > API Keys)에서 자격 증명을 복사하고 환경 변수로 설정합니다. 값은 HTTP Basic 자격 증명으로 그대로 전송되므로, 다시 Base64로 인코딩하거나 bearer 토큰으로 변환하지 마세요.
INWORLD_API_KEY=<base64-credential-from-dashboard>
Select Inworld in messages.tts
{
messages: {
tts: {
auto: "always",
provider: "inworld",
providers: {
inworld: {
voiceId: "Sarah",
modelId: "inworld-tts-1.5-max",
},
},
},
},
}
Send a message
연결된 아무 채널을 통해 답장을 보냅니다. OpenClaw는 Inworld로 오디오를 합성하고 MP3로 전달합니다(또는 채널이 음성 메모를 기대하는 경우 OGG_OPUS로 전달).
구성 옵션
| 옵션 | 경로 | 설명 |
|---|---|---|
apiKey |
messages.tts.providers.inworld.apiKey |
Base64 대시보드 자격 증명. INWORLD_API_KEY로 대체됩니다. |
baseUrl |
messages.tts.providers.inworld.baseUrl |
Inworld API 기본 URL 재정의(기본값 https://api.inworld.ai). |
voiceId |
messages.tts.providers.inworld.voiceId |
음성 식별자(기본값 Sarah). |
modelId |
messages.tts.providers.inworld.modelId |
TTS 모델 ID(기본값 inworld-tts-1.5-max). |
temperature |
messages.tts.providers.inworld.temperature |
샘플링 온도 0..2(선택 사항). |
참고
Authentication
Inworld는 단일 Base64 인코딩 자격 증명 문자열로 HTTP Basic 인증을
사용합니다. Inworld 대시보드에서 그대로 복사하세요. 제공자는 추가 인코딩
없이 이를 Authorization: Basic <apiKey>로 보내므로, 직접 Base64로
인코딩하지 말고 bearer 스타일 토큰도 전달하지 마세요. 동일한 주의 사항은
TTS 인증 참고 사항을 참조하세요.
Models
지원되는 모델 ID: inworld-tts-1.5-max(기본값),
inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.
Audio outputs
답장은 기본적으로 MP3를 사용합니다. 채널 대상이 voice-note이면
OpenClaw는 오디오가 네이티브 음성 말풍선으로 재생되도록 Inworld에
OGG_OPUS를 요청합니다. 전화 통신 합성은 전화 통신 브리지에 공급하기
위해 22050 Hz의 원시 PCM을 사용합니다.
Custom endpoints
messages.tts.providers.inworld.baseUrl로 API 호스트를 재정의합니다.
요청을 보내기 전에 후행 슬래시가 제거됩니다.