Providers

Deepgram

Deepgram est une API de reconnaissance vocale. Dans OpenClaw, elle est utilisée pour la transcription des fichiers audio/notes vocales entrants via tools.media.audio et pour la reconnaissance vocale en streaming de Voice Call via plugins.entries.voice-call.config.streaming.

Pour la transcription par lot, OpenClaw téléverse le fichier audio complet vers Deepgram et injecte la transcription dans le pipeline de réponse ({{Transcript}} + bloc [Audio]). Pour la transcription en streaming Voice Call, OpenClaw transfère des trames G.711 u-law live via le point de terminaison WebSocket listen de Deepgram et émet des transcriptions partielles ou finales à mesure que Deepgram les renvoie.

Détail Valeur
Site web deepgram.com
Documentation developers.deepgram.com
Authentification DEEPGRAM_API_KEY
Modèle par défaut nova-3

Démarrage

  • Définir votre clé API

    Ajoutez votre clé API Deepgram à l’environnement :

    DEEPGRAM_API_KEY=dg_...
    
  • Activer le fournisseur audio

    {
      tools: {
        media: {
          audio: {
            enabled: true,
            models: [{ provider: "deepgram", model: "nova-3" }],
          },
        },
      },
    }
    
  • Envoyer une note vocale

    Envoyez un message audio via n’importe quel canal connecté. OpenClaw le transcrit via Deepgram et injecte la transcription dans le pipeline de réponse.

  • Options de configuration

    Option Chemin Description
    model tools.media.audio.models[].model Identifiant du modèle Deepgram (par défaut : nova-3)
    language tools.media.audio.models[].language Indice de langue (facultatif)
    detect_language tools.media.audio.providerOptions.deepgram.detect_language Activer la détection de langue (facultatif)
    punctuate tools.media.audio.providerOptions.deepgram.punctuate Activer la ponctuation (facultatif)
    smart_format tools.media.audio.providerOptions.deepgram.smart_format Activer le formatage intelligent (facultatif)

    Avec un indice de langue

    {
      tools: {
        media: {
          audio: {
            enabled: true,
            models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
          },
        },
      },
    }
    

    Avec les options Deepgram

    {
      tools: {
        media: {
          audio: {
            enabled: true,
            providerOptions: {
              deepgram: {
                detect_language: true,
                punctuate: true,
                smart_format: true,
              },
            },
            models: [{ provider: "deepgram", model: "nova-3" }],
          },
        },
      },
    }
    

    Reconnaissance vocale en streaming Voice Call

    Le Plugin intégré deepgram enregistre aussi un fournisseur de transcription temps réel pour le Plugin Voice Call.

    Paramètre Chemin de configuration Par défaut
    Clé API plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey Se replie sur DEEPGRAM_API_KEY
    Modèle ...deepgram.model nova-3
    Langue ...deepgram.language (non défini)
    Encodage ...deepgram.encoding mulaw
    Taux d’échantillonnage ...deepgram.sampleRate 8000
    Endpointing ...deepgram.endpointingMs 800
    Résultats intermédiaires ...deepgram.interimResults true
    {
      plugins: {
        entries: {
          "voice-call": {
            config: {
              streaming: {
                enabled: true,
                provider: "deepgram",
                providers: {
                  deepgram: {
                    apiKey: "${DEEPGRAM_API_KEY}",
                    model: "nova-3",
                    endpointingMs: 800,
                    language: "en-US",
                  },
                },
              },
            },
          },
        },
      },
    }
    

    Remarques

    Authentification

    L’authentification suit l’ordre standard d’authentification des fournisseurs. DEEPGRAM_API_KEY est le chemin le plus simple.

    Proxy et points de terminaison personnalisés

    Remplacez les points de terminaison ou les en-têtes avec tools.media.audio.baseUrl et tools.media.audio.headers lors de l’utilisation d’un proxy.

    Comportement de sortie

    La sortie suit les mêmes règles audio que les autres fournisseurs (plafonds de taille, délais, injection de transcription).

    Liens associés