Providers
Deepgram
Deepgram to API speech-to-text. W OpenClaw jest używane do transkrypcji
przychodzącego audio/notatek głosowych przez tools.media.audio oraz do
strumieniowego STT Voice Call przez plugins.entries.voice-call.config.streaming.
W przypadku transkrypcji wsadowej OpenClaw przesyła cały plik audio do Deepgram
i wstrzykuje transkrypt do potoku odpowiedzi ({{Transcript}} +
blok [Audio]). W przypadku strumieniowego Voice Call OpenClaw przekazuje na żywo ramki G.711
u-law przez endpoint WebSocket listen Deepgram i emituje transkrypty częściowe albo
końcowe, gdy Deepgram je zwraca.
| Szczegół | Wartość |
|---|---|
| Strona WWW | deepgram.com |
| Dokumentacja | developers.deepgram.com |
| Uwierzytelnianie | DEEPGRAM_API_KEY |
| Model domyślny | nova-3 |
Pierwsze kroki
Ustaw klucz API
Dodaj klucz API Deepgram do środowiska:
DEEPGRAM_API_KEY=dg_...
Włącz providera audio
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
Wyślij notatkę głosową
Wyślij wiadomość audio przez dowolny połączony kanał. OpenClaw transkrybuje ją przez Deepgram i wstrzykuje transkrypt do potoku odpowiedzi.
Opcje konfiguracji
| Opcja | Ścieżka | Opis |
|---|---|---|
model |
tools.media.audio.models[].model |
Identyfikator modelu Deepgram (domyślnie: nova-3) |
language |
tools.media.audio.models[].language |
Wskazówka języka (opcjonalnie) |
detect_language |
tools.media.audio.providerOptions.deepgram.detect_language |
Włącz wykrywanie języka (opcjonalnie) |
punctuate |
tools.media.audio.providerOptions.deepgram.punctuate |
Włącz interpunkcję (opcjonalnie) |
smart_format |
tools.media.audio.providerOptions.deepgram.smart_format |
Włącz inteligentne formatowanie (opcjonalnie) |
Ze wskazówką języka
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
},
},
},
}
Z opcjami Deepgram
{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true,
},
},
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
Strumieniowe STT Voice Call
Dołączony Plugin deepgram rejestruje również providera transkrypcji w czasie rzeczywistym
dla Plugin Voice Call.
| Ustawienie | Ścieżka konfiguracji | Domyślnie |
|---|---|---|
| Klucz API | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey |
Fallback do DEEPGRAM_API_KEY |
| Model | ...deepgram.model |
nova-3 |
| Język | ...deepgram.language |
(nieustawione) |
| Kodowanie | ...deepgram.encoding |
mulaw |
| Częstotliwość próbkowania | ...deepgram.sampleRate |
8000 |
| Endpointing | ...deepgram.endpointingMs |
800 |
| Wyniki pośrednie | ...deepgram.interimResults |
true |
{
plugins: {
entries: {
"voice-call": {
config: {
streaming: {
enabled: true,
provider: "deepgram",
providers: {
deepgram: {
apiKey: "${DEEPGRAM_API_KEY}",
model: "nova-3",
endpointingMs: 800,
language: "en-US",
},
},
},
},
},
},
},
}
Uwagi
Uwierzytelnianie
Uwierzytelnianie przebiega według standardowej kolejności uwierzytelniania providera. DEEPGRAM_API_KEY to
najprostsza ścieżka.
Proxy i własne endpointy
Nadpisz endpointy lub nagłówki przez tools.media.audio.baseUrl i
tools.media.audio.headers, gdy używasz proxy.
Zachowanie wyjścia
Wyjście podlega tym samym zasadom audio co u innych providerów (limity rozmiaru, timeouty, wstrzykiwanie transkryptu).