Providers

Deepgram

Deepgram هي واجهة API لتحويل الكلام إلى نص. وفي OpenClaw تُستخدم لنسخ الصوت/الملاحظات الصوتية الواردة عبر tools.media.audio، وللنسخ المتدفق في Voice Call عبر plugins.entries.voice-call.config.streaming.

في النسخ الدفعي، يرفع OpenClaw ملف الصوت كاملًا إلى Deepgram ويحقن النص المنسوخ في مسار الرد ({{Transcript}} + كتلة [Audio]). أما في النسخ المتدفق لـ Voice Call، فيمرّر OpenClaw إطارات G.711 u-law الحية عبر نقطة نهاية WebSocket ‏listen الخاصة بـ Deepgram ويصدر نصوصًا جزئية أو نهائية عندما تعيدها Deepgram.

التفصيل القيمة
الموقع deepgram.com
المستندات developers.deepgram.com
المصادقة DEEPGRAM_API_KEY
النموذج الافتراضي nova-3

البدء

  • عيّن مفتاح API الخاص بك

    أضف مفتاح Deepgram API إلى البيئة:

    DEEPGRAM_API_KEY=dg_...
    
  • فعّل موفّر الصوت

    {
      tools: {
        media: {
          audio: {
            enabled: true,
            models: [{ provider: "deepgram", model: "nova-3" }],
          },
        },
      },
    }
    
  • أرسل ملاحظة صوتية

    أرسل رسالة صوتية عبر أي قناة متصلة. سيقوم OpenClaw بنسخها عبر Deepgram وحقن النص في مسار الرد.

  • خيارات التهيئة

    الخيار المسار الوصف
    model tools.media.audio.models[].model معرّف نموذج Deepgram (الافتراضي: nova-3)
    language tools.media.audio.models[].language تلميح اللغة (اختياري)
    detect_language tools.media.audio.providerOptions.deepgram.detect_language تمكين اكتشاف اللغة (اختياري)
    punctuate tools.media.audio.providerOptions.deepgram.punctuate تمكين علامات الترقيم (اختياري)
    smart_format tools.media.audio.providerOptions.deepgram.smart_format تمكين التنسيق الذكي (اختياري)

    مع تلميح اللغة

    {
      tools: {
        media: {
          audio: {
            enabled: true,
            models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
          },
        },
      },
    }
    

    مع خيارات Deepgram

    {
      tools: {
        media: {
          audio: {
            enabled: true,
            providerOptions: {
              deepgram: {
                detect_language: true,
                punctuate: true,
                smart_format: true,
              },
            },
            models: [{ provider: "deepgram", model: "nova-3" }],
          },
        },
      },
    }
    

    النسخ المتدفق في Voice Call

    تسجّل Plugin المجمّعة deepgram أيضًا موفّر نسخ فوري لـ Plugin الخاصة بـ Voice Call.

    الإعداد مسار التهيئة الافتراضي
    مفتاح API plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey يعود إلى DEEPGRAM_API_KEY
    النموذج ...deepgram.model nova-3
    اللغة ...deepgram.language (غير معيّنة)
    الترميز ...deepgram.encoding mulaw
    معدل العينة ...deepgram.sampleRate 8000
    Endpointing ...deepgram.endpointingMs 800
    النتائج المرحلية ...deepgram.interimResults true
    {
      plugins: {
        entries: {
          "voice-call": {
            config: {
              streaming: {
                enabled: true,
                provider: "deepgram",
                providers: {
                  deepgram: {
                    apiKey: "${DEEPGRAM_API_KEY}",
                    model: "nova-3",
                    endpointingMs: 800,
                    language: "en-US",
                  },
                },
              },
            },
          },
        },
      },
    }
    

    ملاحظات

    المصادقة

    تتبع المصادقة ترتيب auth القياسي الخاص بالموفّر. ويُعد DEEPGRAM_API_KEY أبسط مسار.

    Proxy ونقاط النهاية المخصصة

    تجاوز نقاط النهاية أو الرؤوس باستخدام tools.media.audio.baseUrl و tools.media.audio.headers عند استخدام proxy.

    سلوك الإخراج

    يتبع الإخراج قواعد الصوت نفسها كما في الموفّرين الآخرين (حدود الحجم، والمهلات، وحقن النص المنسوخ).

    ذو صلة