Providers

Azure Speech

Azure Speech is een Azure AI Speech-provider voor tekst-naar-spraak. In OpenClaw synthetiseert het standaard uitgaande antwoordaudio als MP3, native Ogg/Opus voor spraaknotities, en 8 kHz mulaw-audio voor telefoniekanalen zoals Voice Call.

OpenClaw gebruikt de Azure Speech REST API rechtstreeks met SSML en verzendt de uitvoerindeling die eigendom is van de provider via X-Microsoft-OutputFormat.

Detail Waarde
Website Azure AI Speech
Docs Speech REST tekst-naar-spraak
Auth AZURE_SPEECH_KEY plus AZURE_SPEECH_REGION
Default voice en-US-JennyNeural
Default file output audio-24khz-48kbitrate-mono-mp3
Default voice-note file ogg-24khz-16bit-mono-opus

Aan de slag

  • Create an Azure Speech resource

    Maak in de Azure-portal een Speech-resource. Kopieer KEY 1 uit Resource Management > Keys and Endpoint, en kopieer de resourcelocatie, zoals eastus.

    AZURE_SPEECH_KEY=<speech-resource-key>
    AZURE_SPEECH_REGION=eastus
    
  • Select Azure Speech in messages.tts

    {
      messages: {
        tts: {
          auto: "always",
          provider: "azure-speech",
          providers: {
            "azure-speech": {
              voice: "en-US-JennyNeural",
              lang: "en-US",
            },
          },
        },
      },
    }
    
  • Send a message

    Verzend een antwoord via een willekeurig verbonden kanaal. OpenClaw synthetiseert de audio met Azure Speech en levert MP3 voor standaardaudio, of Ogg/Opus wanneer het kanaal een spraaknotitie verwacht.

  • Configuratieopties

    Optie Pad Beschrijving
    apiKey messages.tts.providers.azure-speech.apiKey Azure Speech-resourcesleutel. Valt terug op AZURE_SPEECH_KEY, AZURE_SPEECH_API_KEY of SPEECH_KEY.
    region messages.tts.providers.azure-speech.region Azure Speech-resourceregio. Valt terug op AZURE_SPEECH_REGION of SPEECH_REGION.
    endpoint messages.tts.providers.azure-speech.endpoint Optionele override voor Azure Speech-eindpunt/basis-URL.
    baseUrl messages.tts.providers.azure-speech.baseUrl Optionele override voor Azure Speech-basis-URL.
    voice messages.tts.providers.azure-speech.voice Azure-spraakstem ShortName (standaard en-US-JennyNeural).
    lang messages.tts.providers.azure-speech.lang SSML-taalcode (standaard en-US).
    outputFormat messages.tts.providers.azure-speech.outputFormat Uitvoerindeling voor audiobestanden (standaard audio-24khz-48kbitrate-mono-mp3).
    voiceNoteOutputFormat messages.tts.providers.azure-speech.voiceNoteOutputFormat Uitvoerindeling voor spraaknotities (standaard ogg-24khz-16bit-mono-opus).

    Notities

    Authentication

    Azure Speech gebruikt een Speech-resourcesleutel, geen Azure OpenAI-sleutel. De sleutel wordt verzonden als Ocp-Apim-Subscription-Key; OpenClaw leidt https://<region>.tts.speech.microsoft.com af uit region, tenzij je endpoint of baseUrl opgeeft.

    Voice names

    Gebruik de Azure Speech-spraakwaarde ShortName, bijvoorbeeld en-US-JennyNeural. De gebundelde provider kan stemmen weergeven via dezelfde Speech-resource en filtert stemmen die als verouderd of uitgefaseerd zijn gemarkeerd.

    Audio outputs

    Azure accepteert uitvoerindelingen zoals audio-24khz-48kbitrate-mono-mp3, ogg-24khz-16bit-mono-opus en riff-24khz-16bit-mono-pcm. OpenClaw vraagt Ogg/Opus aan voor voice-note-doelen, zodat kanalen native spraakballonnen kunnen verzenden zonder extra MP3-conversie.

    Alias

    azure wordt geaccepteerd als provideralias voor bestaande PR's en gebruikersconfiguratie, maar nieuwe configuratie moet azure-speech gebruiken om verwarring met Azure OpenAI-modelproviders te voorkomen.

    Gerelateerd