Providers

Azure Speech

Azure Speech is een Azure AI Speech-provider voor tekst-naar-spraak. In OpenClaw synthetiseert het standaard uitgaande antwoordaudio als MP3, native Ogg/Opus voor spraaknotities, en 8 kHz mulaw-audio voor telefoniekanalen zoals Voice Call.

OpenClaw gebruikt de Azure Speech REST API rechtstreeks met SSML en verzendt de uitvoerindeling die eigendom is van de provider via X-Microsoft-OutputFormat.

Detail	Waarde
Website	Azure AI Speech
Docs	Speech REST tekst-naar-spraak
Auth	`AZURE_SPEECH_KEY` plus `AZURE_SPEECH_REGION`
Default voice	`en-US-JennyNeural`
Default file output	`audio-24khz-48kbitrate-mono-mp3`
Default voice-note file	`ogg-24khz-16bit-mono-opus`

Aan de slag

Create an Azure Speech resource

Maak in de Azure-portal een Speech-resource. Kopieer KEY 1 uit Resource Management > Keys and Endpoint, en kopieer de resourcelocatie, zoals eastus.

AZURE_SPEECH_KEY=<speech-resource-key>
AZURE_SPEECH_REGION=eastus

Select Azure Speech in messages.tts

{
  messages: {
    tts: {
      auto: "always",
      provider: "azure-speech",
      providers: {
        "azure-speech": {
          voice: "en-US-JennyNeural",
          lang: "en-US",
        },
      },
    },
  },
}

Send a message

Verzend een antwoord via een willekeurig verbonden kanaal. OpenClaw synthetiseert de audio met Azure Speech en levert MP3 voor standaardaudio, of Ogg/Opus wanneer het kanaal een spraaknotitie verwacht.

Configuratieopties

Optie	Pad	Beschrijving
`apiKey`	`messages.tts.providers.azure-speech.apiKey`	Azure Speech-resourcesleutel. Valt terug op `AZURE_SPEECH_KEY`, `AZURE_SPEECH_API_KEY` of `SPEECH_KEY`.
`region`	`messages.tts.providers.azure-speech.region`	Azure Speech-resourceregio. Valt terug op `AZURE_SPEECH_REGION` of `SPEECH_REGION`.
`endpoint`	`messages.tts.providers.azure-speech.endpoint`	Optionele override voor Azure Speech-eindpunt/basis-URL.
`baseUrl`	`messages.tts.providers.azure-speech.baseUrl`	Optionele override voor Azure Speech-basis-URL.
`voice`	`messages.tts.providers.azure-speech.voice`	Azure-spraakstem ShortName (standaard `en-US-JennyNeural`).
`lang`	`messages.tts.providers.azure-speech.lang`	SSML-taalcode (standaard `en-US`).
`outputFormat`	`messages.tts.providers.azure-speech.outputFormat`	Uitvoerindeling voor audiobestanden (standaard `audio-24khz-48kbitrate-mono-mp3`).
`voiceNoteOutputFormat`	`messages.tts.providers.azure-speech.voiceNoteOutputFormat`	Uitvoerindeling voor spraaknotities (standaard `ogg-24khz-16bit-mono-opus`).

Notities

Authentication

Azure Speech gebruikt een Speech-resourcesleutel, geen Azure OpenAI-sleutel. De sleutel wordt verzonden als Ocp-Apim-Subscription-Key; OpenClaw leidt https://<region>.tts.speech.microsoft.com af uit region, tenzij je endpoint of baseUrl opgeeft.

Voice names

Gebruik de Azure Speech-spraakwaarde ShortName, bijvoorbeeld en-US-JennyNeural. De gebundelde provider kan stemmen weergeven via dezelfde Speech-resource en filtert stemmen die als verouderd of uitgefaseerd zijn gemarkeerd.

Audio outputs

Azure accepteert uitvoerindelingen zoals audio-24khz-48kbitrate-mono-mp3, ogg-24khz-16bit-mono-opus en riff-24khz-16bit-mono-pcm. OpenClaw vraagt Ogg/Opus aan voor voice-note-doelen, zodat kanalen native spraakballonnen kunnen verzenden zonder extra MP3-conversie.

Alias

azure wordt geaccepteerd als provideralias voor bestaande PR's en gebruikersconfiguratie, maar nieuwe configuratie moet azure-speech gebruiken om verwarring met Azure OpenAI-modelproviders te voorkomen.