Providers
Azure Speech
Azure Speech is een Azure AI Speech-provider voor tekst-naar-spraak. In OpenClaw synthetiseert het standaard uitgaande antwoordaudio als MP3, native Ogg/Opus voor spraaknotities, en 8 kHz mulaw-audio voor telefoniekanalen zoals Voice Call.
OpenClaw gebruikt de Azure Speech REST API rechtstreeks met SSML en verzendt de
uitvoerindeling die eigendom is van de provider via X-Microsoft-OutputFormat.
| Detail | Waarde |
|---|---|
| Website | Azure AI Speech |
| Docs | Speech REST tekst-naar-spraak |
| Auth | AZURE_SPEECH_KEY plus AZURE_SPEECH_REGION |
| Default voice | en-US-JennyNeural |
| Default file output | audio-24khz-48kbitrate-mono-mp3 |
| Default voice-note file | ogg-24khz-16bit-mono-opus |
Aan de slag
Create an Azure Speech resource
Maak in de Azure-portal een Speech-resource. Kopieer KEY 1 uit
Resource Management > Keys and Endpoint, en kopieer de resourcelocatie,
zoals eastus.
AZURE_SPEECH_KEY=<speech-resource-key>
AZURE_SPEECH_REGION=eastus
Select Azure Speech in messages.tts
{
messages: {
tts: {
auto: "always",
provider: "azure-speech",
providers: {
"azure-speech": {
voice: "en-US-JennyNeural",
lang: "en-US",
},
},
},
},
}
Send a message
Verzend een antwoord via een willekeurig verbonden kanaal. OpenClaw synthetiseert de audio met Azure Speech en levert MP3 voor standaardaudio, of Ogg/Opus wanneer het kanaal een spraaknotitie verwacht.
Configuratieopties
| Optie | Pad | Beschrijving |
|---|---|---|
apiKey |
messages.tts.providers.azure-speech.apiKey |
Azure Speech-resourcesleutel. Valt terug op AZURE_SPEECH_KEY, AZURE_SPEECH_API_KEY of SPEECH_KEY. |
region |
messages.tts.providers.azure-speech.region |
Azure Speech-resourceregio. Valt terug op AZURE_SPEECH_REGION of SPEECH_REGION. |
endpoint |
messages.tts.providers.azure-speech.endpoint |
Optionele override voor Azure Speech-eindpunt/basis-URL. |
baseUrl |
messages.tts.providers.azure-speech.baseUrl |
Optionele override voor Azure Speech-basis-URL. |
voice |
messages.tts.providers.azure-speech.voice |
Azure-spraakstem ShortName (standaard en-US-JennyNeural). |
lang |
messages.tts.providers.azure-speech.lang |
SSML-taalcode (standaard en-US). |
outputFormat |
messages.tts.providers.azure-speech.outputFormat |
Uitvoerindeling voor audiobestanden (standaard audio-24khz-48kbitrate-mono-mp3). |
voiceNoteOutputFormat |
messages.tts.providers.azure-speech.voiceNoteOutputFormat |
Uitvoerindeling voor spraaknotities (standaard ogg-24khz-16bit-mono-opus). |
Notities
Authentication
Azure Speech gebruikt een Speech-resourcesleutel, geen Azure OpenAI-sleutel.
De sleutel wordt verzonden als Ocp-Apim-Subscription-Key; OpenClaw leidt
https://<region>.tts.speech.microsoft.com af uit region, tenzij je
endpoint of baseUrl opgeeft.
Voice names
Gebruik de Azure Speech-spraakwaarde ShortName, bijvoorbeeld
en-US-JennyNeural. De gebundelde provider kan stemmen weergeven via
dezelfde Speech-resource en filtert stemmen die als verouderd of uitgefaseerd
zijn gemarkeerd.
Audio outputs
Azure accepteert uitvoerindelingen zoals audio-24khz-48kbitrate-mono-mp3,
ogg-24khz-16bit-mono-opus en riff-24khz-16bit-mono-pcm. OpenClaw
vraagt Ogg/Opus aan voor voice-note-doelen, zodat kanalen native
spraakballonnen kunnen verzenden zonder extra MP3-conversie.
Alias
azure wordt geaccepteerd als provideralias voor bestaande PR's en
gebruikersconfiguratie, maar nieuwe configuratie moet azure-speech
gebruiken om verwarring met Azure OpenAI-modelproviders te voorkomen.