Providers

Deepgram

Deepgram là một API chuyển giọng nói thành văn bản. Trong OpenClaw, nó được dùng để phiên âm âm thanh/ghi chú thoại gửi đến thông qua tools.media.audio và cho STT phát trực tuyến của Voice Call thông qua plugins.entries.voice-call.config.streaming.

Đối với phiên âm theo lô, OpenClaw tải toàn bộ tệp âm thanh lên Deepgram và chèn bản phiên âm vào quy trình trả lời ({{Transcript}} + khối [Audio]). Đối với phát trực tuyến Voice Call, OpenClaw chuyển tiếp các khung G.711 u-law trực tiếp qua endpoint WebSocket listen của Deepgram và phát ra bản phiên âm một phần hoặc cuối cùng khi Deepgram trả về.

Chi tiết Giá trị
Trang web deepgram.com
Tài liệu developers.deepgram.com
Xác thực DEEPGRAM_API_KEY
Mô hình mặc định nova-3

Bắt đầu

  • Set your API key

    Thêm khóa API Deepgram của bạn vào môi trường:

    DEEPGRAM_API_KEY=dg_...
    
  • Enable the audio provider

    {
      tools: {
        media: {
          audio: {
            enabled: true,
            models: [{ provider: "deepgram", model: "nova-3" }],
          },
        },
      },
    }
    
  • Send a voice note

    Gửi một tin nhắn âm thanh qua bất kỳ kênh nào đã kết nối. OpenClaw phiên âm tin nhắn đó qua Deepgram và chèn bản phiên âm vào quy trình trả lời.

  • Tùy chọn cấu hình

    Tùy chọn Đường dẫn Mô tả
    model tools.media.audio.models[].model ID mô hình Deepgram (mặc định: nova-3)
    language tools.media.audio.models[].language Gợi ý ngôn ngữ (tùy chọn)
    detect_language tools.media.audio.providerOptions.deepgram.detect_language Bật phát hiện ngôn ngữ (tùy chọn)
    punctuate tools.media.audio.providerOptions.deepgram.punctuate Bật dấu câu (tùy chọn)
    smart_format tools.media.audio.providerOptions.deepgram.smart_format Bật định dạng thông minh (tùy chọn)

    With language hint

    {
      tools: {
        media: {
          audio: {
            enabled: true,
            models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
          },
        },
      },
    }
    

    With Deepgram options

    {
      tools: {
        media: {
          audio: {
            enabled: true,
            providerOptions: {
              deepgram: {
                detect_language: true,
                punctuate: true,
                smart_format: true,
              },
            },
            models: [{ provider: "deepgram", model: "nova-3" }],
          },
        },
      },
    }
    

    STT phát trực tuyến Voice Call

    Plugin deepgram đi kèm cũng đăng ký một nhà cung cấp phiên âm thời gian thực cho Plugin Voice Call.

    Thiết lập Đường dẫn cấu hình Mặc định
    Khóa API plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey Dự phòng về DEEPGRAM_API_KEY
    Mô hình ...deepgram.model nova-3
    Ngôn ngữ ...deepgram.language (chưa đặt)
    Mã hóa ...deepgram.encoding mulaw
    Tốc độ mẫu ...deepgram.sampleRate 8000
    Ngắt cuối đoạn ...deepgram.endpointingMs 800
    Kết quả tạm thời ...deepgram.interimResults true
    {
      plugins: {
        entries: {
          "voice-call": {
            config: {
              streaming: {
                enabled: true,
                provider: "deepgram",
                providers: {
                  deepgram: {
                    apiKey: "${DEEPGRAM_API_KEY}",
                    model: "nova-3",
                    endpointingMs: 800,
                    language: "en-US",
                  },
                },
              },
            },
          },
        },
      },
    }
    

    Ghi chú

    Authentication

    Xác thực tuân theo thứ tự xác thực nhà cung cấp tiêu chuẩn. DEEPGRAM_API_KEY là cách đơn giản nhất.

    Proxy and custom endpoints

    Ghi đè endpoint hoặc header bằng tools.media.audio.baseUrltools.media.audio.headers khi dùng proxy.

    Output behavior

    Đầu ra tuân theo cùng các quy tắc âm thanh như những nhà cung cấp khác (giới hạn kích thước, thời gian chờ, chèn bản phiên âm).

    Liên quan