Providers
Azure Speech
Azure Speech, bir Azure AI Speech text-to-speech sağlayıcısıdır. OpenClaw içinde giden yanıt sesini varsayılan olarak MP3, sesli notlar için yerel Ogg/Opus ve Voice Call gibi telefon kanalları için 8 kHz mulaw ses olarak sentezler.
OpenClaw, Azure Speech REST API'sini doğrudan SSML ile kullanır ve
sağlayıcı sahipli çıktı biçimini X-Microsoft-OutputFormat üzerinden gönderir.
| Ayrıntı | Değer |
|---|---|
| Website | Azure AI Speech |
| Dokümanlar | Speech REST text-to-speech |
| Kimlik doğrulama | AZURE_SPEECH_KEY artı AZURE_SPEECH_REGION |
| Varsayılan ses | en-US-JennyNeural |
| Varsayılan dosya çıktısı | audio-24khz-48kbitrate-mono-mp3 |
| Varsayılan sesli not dosyası | ogg-24khz-16bit-mono-opus |
Başlarken
Bir Azure Speech kaynağı oluşturun
Azure portalında bir Speech kaynağı oluşturun. Resource Management > Keys and Endpoint bölümünden KEY 1 değerini kopyalayın ve eastus gibi kaynak konumunu da kopyalayın.
AZURE_SPEECH_KEY=<speech-resource-key>
AZURE_SPEECH_REGION=eastus
messages.tts içinde Azure Speech'i seçin
{
messages: {
tts: {
auto: "always",
provider: "azure-speech",
providers: {
"azure-speech": {
voice: "en-US-JennyNeural",
lang: "en-US",
},
},
},
},
}
Bir mesaj gönderin
Bağlı herhangi bir kanal üzerinden bir yanıt gönderin. OpenClaw sesi Azure Speech ile sentezler ve standart ses için MP3, kanal sesli not beklediğinde ise Ogg/Opus teslim eder.
Yapılandırma seçenekleri
| Seçenek | Yol | Açıklama |
|---|---|---|
apiKey |
messages.tts.providers.azure-speech.apiKey |
Azure Speech kaynak anahtarı. AZURE_SPEECH_KEY, AZURE_SPEECH_API_KEY veya SPEECH_KEY değerlerine fallback yapar. |
region |
messages.tts.providers.azure-speech.region |
Azure Speech kaynak bölgesi. AZURE_SPEECH_REGION veya SPEECH_REGION değerlerine fallback yapar. |
endpoint |
messages.tts.providers.azure-speech.endpoint |
İsteğe bağlı Azure Speech uç noktası/base URL geçersiz kılması. |
baseUrl |
messages.tts.providers.azure-speech.baseUrl |
İsteğe bağlı Azure Speech base URL geçersiz kılması. |
voice |
messages.tts.providers.azure-speech.voice |
Azure ses ShortName değeri (varsayılan en-US-JennyNeural). |
lang |
messages.tts.providers.azure-speech.lang |
SSML dil kodu (varsayılan en-US). |
outputFormat |
messages.tts.providers.azure-speech.outputFormat |
Ses dosyası çıktı biçimi (varsayılan audio-24khz-48kbitrate-mono-mp3). |
voiceNoteOutputFormat |
messages.tts.providers.azure-speech.voiceNoteOutputFormat |
Sesli not çıktı biçimi (varsayılan ogg-24khz-16bit-mono-opus). |
Notlar
Kimlik doğrulama
Azure Speech, Azure OpenAI anahtarı değil, bir Speech kaynak anahtarı kullanır. Anahtar
Ocp-Apim-Subscription-Key olarak gönderilir; OpenClaw, siz
endpoint veya baseUrl sağlamadığınız sürece region değerinden
https://<region>.tts.speech.microsoft.com türetir.
Ses adları
Azure Speech ses ShortName değerini kullanın; örneğin
en-US-JennyNeural. Paketlenmiş sağlayıcı sesleri aynı Speech kaynağı üzerinden listeleyebilir
ve kullanımdan kaldırılmış veya emekliye ayrılmış olarak işaretlenen sesleri filtreler.
Ses çıktıları
Azure; audio-24khz-48kbitrate-mono-mp3,
ogg-24khz-16bit-mono-opus ve riff-24khz-16bit-mono-pcm gibi çıktı biçimlerini kabul eder. OpenClaw,
voice-note hedefleri için Ogg/Opus ister; böylece kanallar ekstra MP3 dönüştürmesi olmadan
yerel ses baloncukları gönderebilir.
Takma ad
azure, mevcut PR'ler ve kullanıcı config'i için sağlayıcı takma adı olarak kabul edilir,
ancak yeni config, Azure
OpenAI model sağlayıcılarıyla karışıklığı önlemek için azure-speech kullanmalıdır.