Providers

Deepgram

Deepgram은 speech-to-text API입니다. OpenClaw에서는 tools.media.audio를 통한 인바운드 오디오/음성 노트 transcription과 plugins.entries.voice-call.config.streaming을 통한 Voice Call 스트리밍 STT에 사용됩니다.

배치 transcription의 경우, OpenClaw는 전체 오디오 파일을 Deepgram에 업로드하고 transcript를 응답 파이프라인에 주입합니다({{Transcript}} + [Audio] 블록). Voice Call 스트리밍의 경우, OpenClaw는 실시간 G.711 u-law 프레임을 Deepgram의 WebSocket listen 엔드포인트로 전달하고, Deepgram이 반환하는 partial 또는 final transcript를 내보냅니다.

상세
웹사이트 deepgram.com
문서 developers.deepgram.com
인증 DEEPGRAM_API_KEY
기본 모델 nova-3

시작하기

  • API 키 설정

    Deepgram API 키를 환경 변수에 추가하세요:

    DEEPGRAM_API_KEY=dg_...
    
  • 오디오 provider 활성화

    {
      tools: {
        media: {
          audio: {
            enabled: true,
            models: [{ provider: "deepgram", model: "nova-3" }],
          },
        },
      },
    }
    
  • 음성 노트 보내기

    연결된 아무 채널에서나 오디오 메시지를 보내세요. OpenClaw가 이를 Deepgram으로 transcription한 뒤 transcript를 응답 파이프라인에 주입합니다.

  • 구성 옵션

    옵션 경로 설명
    model tools.media.audio.models[].model Deepgram 모델 id (기본값: nova-3)
    language tools.media.audio.models[].language 언어 힌트 (선택 사항)
    detect_language tools.media.audio.providerOptions.deepgram.detect_language 언어 감지 활성화 (선택 사항)
    punctuate tools.media.audio.providerOptions.deepgram.punctuate 문장 부호 활성화 (선택 사항)
    smart_format tools.media.audio.providerOptions.deepgram.smart_format 스마트 서식 활성화 (선택 사항)

    언어 힌트 포함

    {
      tools: {
        media: {
          audio: {
            enabled: true,
            models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
          },
        },
      },
    }
    

    Deepgram 옵션 포함

    {
      tools: {
        media: {
          audio: {
            enabled: true,
            providerOptions: {
              deepgram: {
                detect_language: true,
                punctuate: true,
                smart_format: true,
              },
            },
            models: [{ provider: "deepgram", model: "nova-3" }],
          },
        },
      },
    }
    

    Voice Call 스트리밍 STT

    번들 deepgram Plugin은 Voice Call Plugin용 실시간 transcription provider도 등록합니다.

    설정 config 경로 기본값
    API 키 plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey DEEPGRAM_API_KEY로 폴백
    모델 ...deepgram.model nova-3
    언어 ...deepgram.language (unset)
    인코딩 ...deepgram.encoding mulaw
    샘플 레이트 ...deepgram.sampleRate 8000
    Endpointing ...deepgram.endpointingMs 800
    Interim 결과 ...deepgram.interimResults true
    {
      plugins: {
        entries: {
          "voice-call": {
            config: {
              streaming: {
                enabled: true,
                provider: "deepgram",
                providers: {
                  deepgram: {
                    apiKey: "${DEEPGRAM_API_KEY}",
                    model: "nova-3",
                    endpointingMs: 800,
                    language: "en-US",
                  },
                },
              },
            },
          },
        },
      },
    }
    

    참고

    인증

    인증은 표준 provider auth 순서를 따릅니다. 가장 간단한 경로는 DEEPGRAM_API_KEY입니다.

    프록시 및 사용자 지정 엔드포인트

    proxy를 사용하는 경우 tools.media.audio.baseUrltools.media.audio.headers로 엔드포인트나 헤더를 override하세요.

    출력 동작

    출력은 다른 provider와 동일한 오디오 규칙(크기 제한, 타임아웃, transcript 주입)을 따릅니다.

    관련 항목