Providers
Deepgram
Deepgram — це API перетворення мовлення на текст. В OpenClaw він використовується для транскрипції вхідних
аудіо/голосових повідомлень через tools.media.audio і для потокового STT у Voice Call
через plugins.entries.voice-call.config.streaming.
Для пакетної транскрипції OpenClaw завантажує повний аудіофайл у Deepgram
і інжектує транскрипт у конвеєр відповіді ({{Transcript}} +
блок [Audio]). Для потокового Voice Call OpenClaw пересилає live кадри G.711
u-law через WebSocket-кінцеву точку Deepgram listen і надсилає часткові або
фінальні транскрипти в міру того, як Deepgram їх повертає.
| Деталь | Значення |
|---|---|
| Вебсайт | deepgram.com |
| Документація | developers.deepgram.com |
| Автентифікація | DEEPGRAM_API_KEY |
| Типова модель | nova-3 |
Початок роботи
Установіть свій API-ключ
Додайте свій API-ключ Deepgram до середовища:
DEEPGRAM_API_KEY=dg_...
Увімкніть provider аудіо
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
Надішліть голосове повідомлення
Надішліть аудіоповідомлення через будь-який підключений канал. OpenClaw транскрибує його через Deepgram і інжектує транскрипт у конвеєр відповіді.
Параметри конфігурації
| Параметр | Шлях | Опис |
|---|---|---|
model |
tools.media.audio.models[].model |
id моделі Deepgram (типово: nova-3) |
language |
tools.media.audio.models[].language |
Підказка мови (необов’язково) |
detect_language |
tools.media.audio.providerOptions.deepgram.detect_language |
Увімкнути визначення мови (необов’язково) |
punctuate |
tools.media.audio.providerOptions.deepgram.punctuate |
Увімкнути пунктуацію (необов’язково) |
smart_format |
tools.media.audio.providerOptions.deepgram.smart_format |
Увімкнути smart formatting (необов’язково) |
Із підказкою мови
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
},
},
},
}
З параметрами Deepgram
{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true,
},
},
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
Потоковий STT для Voice Call
Вбудований Plugin deepgram також реєструє provider транскрипції в реальному часі
для Plugin Voice Call.
| Налаштування | Шлях конфігурації | Типове значення |
|---|---|---|
| API-ключ | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey |
Резервно використовує DEEPGRAM_API_KEY |
| Модель | ...deepgram.model |
nova-3 |
| Мова | ...deepgram.language |
(не задано) |
| Кодування | ...deepgram.encoding |
mulaw |
| Частота дискретизації | ...deepgram.sampleRate |
8000 |
| Endpointing | ...deepgram.endpointingMs |
800 |
| Проміжні результати | ...deepgram.interimResults |
true |
{
plugins: {
entries: {
"voice-call": {
config: {
streaming: {
enabled: true,
provider: "deepgram",
providers: {
deepgram: {
apiKey: "${DEEPGRAM_API_KEY}",
model: "nova-3",
endpointingMs: 800,
language: "en-US",
},
},
},
},
},
},
},
}
Примітки
Автентифікація
Автентифікація дотримується стандартного порядку автентифікації provider. DEEPGRAM_API_KEY —
найпростіший шлях.
Проксі та власні кінцеві точки
Перевизначайте кінцеві точки або заголовки через tools.media.audio.baseUrl і
tools.media.audio.headers, якщо використовуєте проксі.
Поведінка виведення
Виведення дотримується тих самих правил для аудіо, що й в інших provider (обмеження розміру, тайм-аути, інжекція транскрипту).