Providers
Deepgram
Deepgram은 speech-to-text API입니다. OpenClaw에서는
tools.media.audio를 통한 인바운드 오디오/음성 노트 transcription과
plugins.entries.voice-call.config.streaming을 통한 Voice Call 스트리밍 STT에 사용됩니다.
배치 transcription의 경우, OpenClaw는 전체 오디오 파일을 Deepgram에 업로드하고
transcript를 응답 파이프라인에 주입합니다({{Transcript}} +
[Audio] 블록). Voice Call 스트리밍의 경우, OpenClaw는 실시간 G.711
u-law 프레임을 Deepgram의 WebSocket listen 엔드포인트로 전달하고,
Deepgram이 반환하는 partial 또는 final transcript를 내보냅니다.
| 상세 | 값 |
|---|---|
| 웹사이트 | deepgram.com |
| 문서 | developers.deepgram.com |
| 인증 | DEEPGRAM_API_KEY |
| 기본 모델 | nova-3 |
시작하기
API 키 설정
Deepgram API 키를 환경 변수에 추가하세요:
DEEPGRAM_API_KEY=dg_...
오디오 provider 활성화
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
음성 노트 보내기
연결된 아무 채널에서나 오디오 메시지를 보내세요. OpenClaw가 이를 Deepgram으로 transcription한 뒤 transcript를 응답 파이프라인에 주입합니다.
구성 옵션
| 옵션 | 경로 | 설명 |
|---|---|---|
model |
tools.media.audio.models[].model |
Deepgram 모델 id (기본값: nova-3) |
language |
tools.media.audio.models[].language |
언어 힌트 (선택 사항) |
detect_language |
tools.media.audio.providerOptions.deepgram.detect_language |
언어 감지 활성화 (선택 사항) |
punctuate |
tools.media.audio.providerOptions.deepgram.punctuate |
문장 부호 활성화 (선택 사항) |
smart_format |
tools.media.audio.providerOptions.deepgram.smart_format |
스마트 서식 활성화 (선택 사항) |
언어 힌트 포함
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
},
},
},
}
Deepgram 옵션 포함
{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true,
},
},
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
Voice Call 스트리밍 STT
번들 deepgram Plugin은 Voice Call Plugin용 실시간 transcription provider도 등록합니다.
| 설정 | config 경로 | 기본값 |
|---|---|---|
| API 키 | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey |
DEEPGRAM_API_KEY로 폴백 |
| 모델 | ...deepgram.model |
nova-3 |
| 언어 | ...deepgram.language |
(unset) |
| 인코딩 | ...deepgram.encoding |
mulaw |
| 샘플 레이트 | ...deepgram.sampleRate |
8000 |
| Endpointing | ...deepgram.endpointingMs |
800 |
| Interim 결과 | ...deepgram.interimResults |
true |
{
plugins: {
entries: {
"voice-call": {
config: {
streaming: {
enabled: true,
provider: "deepgram",
providers: {
deepgram: {
apiKey: "${DEEPGRAM_API_KEY}",
model: "nova-3",
endpointingMs: 800,
language: "en-US",
},
},
},
},
},
},
},
}
참고
인증
인증은 표준 provider auth 순서를 따릅니다. 가장 간단한 경로는 DEEPGRAM_API_KEY입니다.
프록시 및 사용자 지정 엔드포인트
proxy를 사용하는 경우 tools.media.audio.baseUrl과
tools.media.audio.headers로 엔드포인트나 헤더를 override하세요.
출력 동작
출력은 다른 provider와 동일한 오디오 규칙(크기 제한, 타임아웃, transcript 주입)을 따릅니다.