Providers

Azure Speech

Azure Speech, bir Azure AI Speech text-to-speech sağlayıcısıdır. OpenClaw içinde giden yanıt sesini varsayılan olarak MP3, sesli notlar için yerel Ogg/Opus ve Voice Call gibi telefon kanalları için 8 kHz mulaw ses olarak sentezler.

OpenClaw, Azure Speech REST API'sini doğrudan SSML ile kullanır ve sağlayıcı sahipli çıktı biçimini X-Microsoft-OutputFormat üzerinden gönderir.

Ayrıntı	Değer
Website	Azure AI Speech
Dokümanlar	Speech REST text-to-speech
Kimlik doğrulama	`AZURE_SPEECH_KEY` artı `AZURE_SPEECH_REGION`
Varsayılan ses	`en-US-JennyNeural`
Varsayılan dosya çıktısı	`audio-24khz-48kbitrate-mono-mp3`
Varsayılan sesli not dosyası	`ogg-24khz-16bit-mono-opus`

Başlarken

Bir Azure Speech kaynağı oluşturun

Azure portalında bir Speech kaynağı oluşturun. Resource Management > Keys and Endpoint bölümünden KEY 1 değerini kopyalayın ve eastus gibi kaynak konumunu da kopyalayın.

AZURE_SPEECH_KEY=<speech-resource-key>
AZURE_SPEECH_REGION=eastus

messages.tts içinde Azure Speech'i seçin

{
  messages: {
    tts: {
      auto: "always",
      provider: "azure-speech",
      providers: {
        "azure-speech": {
          voice: "en-US-JennyNeural",
          lang: "en-US",
        },
      },
    },
  },
}

Bir mesaj gönderin

Bağlı herhangi bir kanal üzerinden bir yanıt gönderin. OpenClaw sesi Azure Speech ile sentezler ve standart ses için MP3, kanal sesli not beklediğinde ise Ogg/Opus teslim eder.

Yapılandırma seçenekleri

Seçenek	Yol	Açıklama
`apiKey`	`messages.tts.providers.azure-speech.apiKey`	Azure Speech kaynak anahtarı. `AZURE_SPEECH_KEY`, `AZURE_SPEECH_API_KEY` veya `SPEECH_KEY` değerlerine fallback yapar.
`region`	`messages.tts.providers.azure-speech.region`	Azure Speech kaynak bölgesi. `AZURE_SPEECH_REGION` veya `SPEECH_REGION` değerlerine fallback yapar.
`endpoint`	`messages.tts.providers.azure-speech.endpoint`	İsteğe bağlı Azure Speech uç noktası/base URL geçersiz kılması.
`baseUrl`	`messages.tts.providers.azure-speech.baseUrl`	İsteğe bağlı Azure Speech base URL geçersiz kılması.
`voice`	`messages.tts.providers.azure-speech.voice`	Azure ses `ShortName` değeri (varsayılan `en-US-JennyNeural`).
`lang`	`messages.tts.providers.azure-speech.lang`	SSML dil kodu (varsayılan `en-US`).
`outputFormat`	`messages.tts.providers.azure-speech.outputFormat`	Ses dosyası çıktı biçimi (varsayılan `audio-24khz-48kbitrate-mono-mp3`).
`voiceNoteOutputFormat`	`messages.tts.providers.azure-speech.voiceNoteOutputFormat`	Sesli not çıktı biçimi (varsayılan `ogg-24khz-16bit-mono-opus`).

Notlar

Kimlik doğrulama

Azure Speech, Azure OpenAI anahtarı değil, bir Speech kaynak anahtarı kullanır. Anahtar Ocp-Apim-Subscription-Key olarak gönderilir; OpenClaw, siz endpoint veya baseUrl sağlamadığınız sürece region değerinden https://<region>.tts.speech.microsoft.com türetir.

Ses adları

Azure Speech ses ShortName değerini kullanın; örneğin en-US-JennyNeural. Paketlenmiş sağlayıcı sesleri aynı Speech kaynağı üzerinden listeleyebilir ve kullanımdan kaldırılmış veya emekliye ayrılmış olarak işaretlenen sesleri filtreler.

Ses çıktıları

Azure; audio-24khz-48kbitrate-mono-mp3, ogg-24khz-16bit-mono-opus ve riff-24khz-16bit-mono-pcm gibi çıktı biçimlerini kabul eder. OpenClaw, voice-note hedefleri için Ogg/Opus ister; böylece kanallar ekstra MP3 dönüştürmesi olmadan yerel ses baloncukları gönderebilir.

Takma ad

azure, mevcut PR'ler ve kullanıcı config'i için sağlayıcı takma adı olarak kabul edilir, ancak yeni config, Azure OpenAI model sağlayıcılarıyla karışıklığı önlemek için azure-speech kullanmalıdır.