Providers

Inworld

Inworld는 스트리밍 텍스트 음성 변환(TTS) 제공자입니다. OpenClaw에서는 아웃바운드 답장 오디오(기본값은 MP3, 음성 메모는 OGG_OPUS)와 Voice Call 같은 전화 통신 채널용 PCM 오디오를 합성합니다.

OpenClaw는 Inworld의 스트리밍 TTS 엔드포인트에 게시하고, 반환된 base64 오디오 청크를 단일 버퍼로 이어 붙인 뒤 그 결과를 표준 답장 오디오 파이프라인에 전달합니다.

속성
제공자 ID inworld
Plugin 번들됨, enabledByDefault: true
계약 speechProviders (TTS 전용)
인증 환경 변수 INWORLD_API_KEY (HTTP Basic, Base64 대시보드 자격 증명)
기본 URL https://api.inworld.ai
기본 음성 Sarah
기본 모델 inworld-tts-1.5-max
출력 MP3 (기본값), OGG_OPUS (음성 메모), PCM 22050 Hz (전화 통신)
웹사이트 inworld.ai
문서 docs.inworld.ai/tts/tts

시작하기

  • Set your API key

    Inworld 대시보드(Workspace > API Keys)에서 자격 증명을 복사하고 환경 변수로 설정합니다. 값은 HTTP Basic 자격 증명으로 그대로 전송되므로, 다시 Base64로 인코딩하거나 bearer 토큰으로 변환하지 마세요.

    INWORLD_API_KEY=<base64-credential-from-dashboard>
    
  • Select Inworld in messages.tts

    {
      messages: {
        tts: {
          auto: "always",
          provider: "inworld",
          providers: {
            inworld: {
              voiceId: "Sarah",
              modelId: "inworld-tts-1.5-max",
            },
          },
        },
      },
    }
    
  • Send a message

    연결된 아무 채널을 통해 답장을 보냅니다. OpenClaw는 Inworld로 오디오를 합성하고 MP3로 전달합니다(또는 채널이 음성 메모를 기대하는 경우 OGG_OPUS로 전달).

  • 구성 옵션

    옵션 경로 설명
    apiKey messages.tts.providers.inworld.apiKey Base64 대시보드 자격 증명. INWORLD_API_KEY로 대체됩니다.
    baseUrl messages.tts.providers.inworld.baseUrl Inworld API 기본 URL 재정의(기본값 https://api.inworld.ai).
    voiceId messages.tts.providers.inworld.voiceId 음성 식별자(기본값 Sarah).
    modelId messages.tts.providers.inworld.modelId TTS 모델 ID(기본값 inworld-tts-1.5-max).
    temperature messages.tts.providers.inworld.temperature 샘플링 온도 0..2(선택 사항).

    참고

    Authentication

    Inworld는 단일 Base64 인코딩 자격 증명 문자열로 HTTP Basic 인증을 사용합니다. Inworld 대시보드에서 그대로 복사하세요. 제공자는 추가 인코딩 없이 이를 Authorization: Basic <apiKey>로 보내므로, 직접 Base64로 인코딩하지 말고 bearer 스타일 토큰도 전달하지 마세요. 동일한 주의 사항은 TTS 인증 참고 사항을 참조하세요.

    Models

    지원되는 모델 ID: inworld-tts-1.5-max(기본값), inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.

    Audio outputs

    답장은 기본적으로 MP3를 사용합니다. 채널 대상이 voice-note이면 OpenClaw는 오디오가 네이티브 음성 말풍선으로 재생되도록 Inworld에 OGG_OPUS를 요청합니다. 전화 통신 합성은 전화 통신 브리지에 공급하기 위해 22050 Hz의 원시 PCM을 사용합니다.

    Custom endpoints

    messages.tts.providers.inworld.baseUrl로 API 호스트를 재정의합니다. 요청을 보내기 전에 후행 슬래시가 제거됩니다.

    관련 항목