Providers
Deepgram
Deepgram هي واجهة API لتحويل الكلام إلى نص. وفي OpenClaw تُستخدم لنسخ
الصوت/الملاحظات الصوتية الواردة عبر tools.media.audio، وللنسخ المتدفق في Voice Call
عبر plugins.entries.voice-call.config.streaming.
في النسخ الدفعي، يرفع OpenClaw ملف الصوت كاملًا إلى Deepgram
ويحقن النص المنسوخ في مسار الرد ({{Transcript}} +
كتلة [Audio]). أما في النسخ المتدفق لـ Voice Call، فيمرّر OpenClaw
إطارات G.711 u-law الحية عبر نقطة نهاية WebSocket listen الخاصة بـ Deepgram
ويصدر نصوصًا جزئية أو نهائية عندما تعيدها Deepgram.
| التفصيل | القيمة |
|---|---|
| الموقع | deepgram.com |
| المستندات | developers.deepgram.com |
| المصادقة | DEEPGRAM_API_KEY |
| النموذج الافتراضي | nova-3 |
البدء
عيّن مفتاح API الخاص بك
أضف مفتاح Deepgram API إلى البيئة:
DEEPGRAM_API_KEY=dg_...
فعّل موفّر الصوت
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
أرسل ملاحظة صوتية
أرسل رسالة صوتية عبر أي قناة متصلة. سيقوم OpenClaw بنسخها عبر Deepgram وحقن النص في مسار الرد.
خيارات التهيئة
| الخيار | المسار | الوصف |
|---|---|---|
model |
tools.media.audio.models[].model |
معرّف نموذج Deepgram (الافتراضي: nova-3) |
language |
tools.media.audio.models[].language |
تلميح اللغة (اختياري) |
detect_language |
tools.media.audio.providerOptions.deepgram.detect_language |
تمكين اكتشاف اللغة (اختياري) |
punctuate |
tools.media.audio.providerOptions.deepgram.punctuate |
تمكين علامات الترقيم (اختياري) |
smart_format |
tools.media.audio.providerOptions.deepgram.smart_format |
تمكين التنسيق الذكي (اختياري) |
مع تلميح اللغة
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
},
},
},
}
مع خيارات Deepgram
{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true,
},
},
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
النسخ المتدفق في Voice Call
تسجّل Plugin المجمّعة deepgram أيضًا موفّر نسخ فوري
لـ Plugin الخاصة بـ Voice Call.
| الإعداد | مسار التهيئة | الافتراضي |
|---|---|---|
| مفتاح API | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey |
يعود إلى DEEPGRAM_API_KEY |
| النموذج | ...deepgram.model |
nova-3 |
| اللغة | ...deepgram.language |
(غير معيّنة) |
| الترميز | ...deepgram.encoding |
mulaw |
| معدل العينة | ...deepgram.sampleRate |
8000 |
| Endpointing | ...deepgram.endpointingMs |
800 |
| النتائج المرحلية | ...deepgram.interimResults |
true |
{
plugins: {
entries: {
"voice-call": {
config: {
streaming: {
enabled: true,
provider: "deepgram",
providers: {
deepgram: {
apiKey: "${DEEPGRAM_API_KEY}",
model: "nova-3",
endpointingMs: 800,
language: "en-US",
},
},
},
},
},
},
},
}
ملاحظات
المصادقة
تتبع المصادقة ترتيب auth القياسي الخاص بالموفّر. ويُعد DEEPGRAM_API_KEY
أبسط مسار.
Proxy ونقاط النهاية المخصصة
تجاوز نقاط النهاية أو الرؤوس باستخدام tools.media.audio.baseUrl و
tools.media.audio.headers عند استخدام proxy.
سلوك الإخراج
يتبع الإخراج قواعد الصوت نفسها كما في الموفّرين الآخرين (حدود الحجم، والمهلات، وحقن النص المنسوخ).