Tools
توليد الفيديو
يمكن لوكلاء OpenClaw إنشاء مقاطع فيديو من مطالبات نصية، أو صور مرجعية، أو مقاطع فيديو موجودة. تُدعَم ستة عشر واجهة خلفية للموفرين، ولكل منها خيارات نماذج وأوضاع إدخال ومجموعات ميزات مختلفة. يختار الوكيل الموفر المناسب تلقائيًا بناءً على إعداداتك ومفاتيح API المتاحة.
يتعامل OpenClaw مع إنشاء الفيديو كثلاثة أوضاع تشغيل:
generate- طلبات تحويل النص إلى فيديو من دون وسائط مرجعية.imageToVideo- يتضمن الطلب صورة مرجعية واحدة أو أكثر.videoToVideo- يتضمن الطلب فيديو مرجعيًا واحدًا أو أكثر.
يمكن للموفرين دعم أي مجموعة فرعية من هذه الأوضاع. تتحقق الأداة من
الوضع النشط قبل الإرسال وتعرض الأوضاع المدعومة في action=list.
البدء السريع
إعداد المصادقة
عيّن مفتاح API لأي موفر مدعوم:
export GEMINI_API_KEY="your-key"
اختيار نموذج افتراضي (اختياري)
openclaw config set agents.defaults.videoGenerationModel.primary "google/veo-3.1-fast-generate-preview"
اطلب من الوكيل
أنشئ فيديو سينمائيًا مدته 5 ثوانٍ لجراد بحر ودود يركب الأمواج عند الغروب.
يستدعي الوكيل video_generate تلقائيًا. لا حاجة إلى إدراج الأداة
في قائمة السماح.
كيف يعمل الإنشاء غير المتزامن
إنشاء الفيديو غير متزامن. عندما يستدعي الوكيل video_generate في
جلسة:
- يرسل OpenClaw الطلب إلى الموفر ويعيد معرّف مهمة فورًا.
- يعالج الموفر المهمة في الخلفية (عادةً من 30 ثانية إلى عدة دقائق حسب الموفر والدقة؛ ويمكن للموفرين البطيئين المعتمدين على قوائم الانتظار العمل حتى انتهاء المهلة المضبوطة).
- عندما يصبح الفيديو جاهزًا، يوقظ OpenClaw الجلسة نفسها بحدث إكمال داخلي.
- يخبر الوكيل المستخدم ويرفق الفيديو النهائي. في محادثات المجموعات/القنوات التي تستخدم تسليمًا مرئيًا عبر أداة الرسائل فقط، يمرر الوكيل النتيجة عبر أداة الرسائل بدلًا من أن ينشرها OpenClaw مباشرةً.
أثناء تنفيذ مهمة، تعيد استدعاءات video_generate المكررة في الجلسة
نفسها حالة المهمة الحالية بدلًا من بدء عملية إنشاء أخرى. استخدم
openclaw tasks list أو openclaw tasks show <taskId> للتحقق من
التقدم من CLI.
خارج تشغيلات الوكيل المدعومة بجلسة (على سبيل المثال، استدعاءات الأدوات المباشرة)، تعود الأداة إلى الإنشاء المضمّن وتعيد مسار الوسائط النهائي في الدور نفسه.
تُحفظ ملفات الفيديو المُنشأة ضمن مساحة تخزين الوسائط التي يديرها OpenClaw عندما
يعيد الموفر بايتات. يتبع حد الحفظ الافتراضي للفيديو المُنشأ
حد وسائط الفيديو، ويرفعه agents.defaults.mediaMaxMb للتصييرات
الأكبر. عندما يعيد الموفر أيضًا عنوان URL لمخرَج مستضاف، يمكن لـ OpenClaw
تسليم ذلك العنوان بدلًا من إفشال المهمة إذا رفض الحفظ المحلي
ملفًا زائد الحجم.
دورة حياة المهمة
| الحالة | المعنى |
|---|---|
queued |
تم إنشاء المهمة وهي تنتظر قبول الموفر لها. |
running |
يعالج الموفر المهمة (عادةً من 30 ثانية إلى عدة دقائق حسب الموفر والدقة). |
succeeded |
الفيديو جاهز؛ يوقظ الوكيل وينشره في المحادثة. |
failed |
خطأ من الموفر أو انتهاء المهلة؛ يوقظ الوكيل مع تفاصيل الخطأ. |
تحقق من الحالة من CLI:
openclaw tasks list
openclaw tasks show <taskId>
openclaw tasks cancel <taskId>
إذا كانت مهمة فيديو بالفعل في حالة queued أو running للجلسة الحالية،
فإن video_generate يعيد حالة المهمة الحالية بدلًا من بدء مهمة جديدة.
استخدم action: "status" للتحقق صراحةً من دون تشغيل إنشاء جديد.
الموفرون المدعومون
| الموفر | النموذج الافتراضي | نص | مرجع الصورة | مرجع الفيديو | المصادقة |
|---|---|---|---|---|---|
| Alibaba | wan2.6-t2v |
✓ | نعم (عنوان URL بعيد) | نعم (عنوان URL بعيد) | MODELSTUDIO_API_KEY |
| BytePlus (1.0) | seedance-1-0-pro-250528 |
✓ | حتى صورتين (نماذج I2V فقط؛ الإطار الأول + الأخير) | - | BYTEPLUS_API_KEY |
| BytePlus Seedance 1.5 | seedance-1-5-pro-251215 |
✓ | حتى صورتين (الإطار الأول + الأخير عبر الدور) | - | BYTEPLUS_API_KEY |
| BytePlus Seedance 2.0 | dreamina-seedance-2-0-260128 |
✓ | حتى 9 صور مرجعية | حتى 3 مقاطع فيديو | BYTEPLUS_API_KEY |
| ComfyUI | workflow |
✓ | صورة واحدة | - | COMFY_API_KEY أو COMFY_CLOUD_API_KEY |
| DeepInfra | Pixverse/Pixverse-T2V |
✓ | - | - | DEEPINFRA_API_KEY |
| fal | fal-ai/minimax/video-01-live |
✓ | صورة واحدة؛ حتى 9 مع Seedance reference-to-video | حتى 3 مقاطع فيديو مع Seedance reference-to-video | FAL_KEY |
veo-3.1-fast-generate-preview |
✓ | صورة واحدة | فيديو واحد | GEMINI_API_KEY |
|
| MiniMax | MiniMax-Hailuo-2.3 |
✓ | صورة واحدة | - | MINIMAX_API_KEY أو MiniMax OAuth |
| OpenAI | sora-2 |
✓ | صورة واحدة | فيديو واحد | OPENAI_API_KEY |
| OpenRouter | google/veo-3.1-fast |
✓ | حتى 4 صور (الإطار الأول/الأخير أو مراجع) | - | OPENROUTER_API_KEY |
| Qwen | wan2.6-t2v |
✓ | نعم (عنوان URL بعيد) | نعم (عنوان URL بعيد) | QWEN_API_KEY |
| Runway | gen4.5 |
✓ | صورة واحدة | فيديو واحد | RUNWAYML_API_SECRET |
| Together | Wan-AI/Wan2.2-T2V-A14B |
✓ | صورة واحدة | - | TOGETHER_API_KEY |
| Vydra | veo3 |
✓ | صورة واحدة (kling) |
- | VYDRA_API_KEY |
| xAI | grok-imagine-video |
✓ | صورة إطار أول واحدة أو حتى 7 reference_images |
فيديو واحد | XAI_API_KEY |
يقبل بعض الموفرين متغيرات بيئة إضافية أو بديلة لمفاتيح API. راجع صفحات الموفرين الفردية لمزيد من التفاصيل.
شغّل video_generate action=list لفحص الموفرين والنماذج وأوضاع
التشغيل المتاحة وقت التشغيل.
مصفوفة الإمكانات
عقد الوضع الصريح المستخدم بواسطة video_generate، واختبارات العقود،
والفحص الحي المشترك:
| الموفر | generate |
imageToVideo |
videoToVideo |
المسارات الحية المشتركة اليوم |
|---|---|---|---|---|
| Alibaba | ✓ | ✓ | ✓ | generate، imageToVideo؛ تم تخطي videoToVideo لأن هذا الموفر يحتاج إلى عناوين URL فيديو بعيدة من نوع http(s) |
| BytePlus | ✓ | ✓ | - | generate، imageToVideo |
| ComfyUI | ✓ | ✓ | - | غير موجود في الفحص المشترك؛ توجد التغطية الخاصة بسير العمل مع اختبارات Comfy |
| DeepInfra | ✓ | - | - | generate؛ مخططات فيديو DeepInfra الأصلية هي تحويل النص إلى فيديو في العقد المضمّن |
| fal | ✓ | ✓ | ✓ | generate، imageToVideo؛ يعمل videoToVideo فقط عند استخدام Seedance reference-to-video |
| ✓ | ✓ | ✓ | generate، imageToVideo؛ تم تخطي videoToVideo المشترك لأن فحص Gemini/Veo الحالي المدعوم بالمخزن المؤقت لا يقبل ذلك الإدخال |
|
| MiniMax | ✓ | ✓ | - | generate، imageToVideo |
| OpenAI | ✓ | ✓ | ✓ | generate، imageToVideo؛ تم تخطي videoToVideo المشترك لأن مسار المؤسسة/الإدخال هذا يحتاج حاليًا إلى وصول inpaint/remix من جهة الموفر |
| OpenRouter | ✓ | ✓ | - | generate، imageToVideo |
| Qwen | ✓ | ✓ | ✓ | generate، imageToVideo؛ تم تخطي videoToVideo لأن هذا الموفر يحتاج إلى عناوين URL فيديو بعيدة من نوع http(s) |
| Runway | ✓ | ✓ | ✓ | generate، imageToVideo؛ يعمل videoToVideo فقط عندما يكون النموذج المحدد هو runway/gen4_aleph |
| Together | ✓ | ✓ | - | generate، imageToVideo |
| Vydra | ✓ | ✓ | - | generate؛ تم تخطي imageToVideo المشترك لأن veo3 المضمّن نصي فقط وkling المضمّن يتطلب عنوان URL بعيدًا للصورة |
| xAI | ✓ | ✓ | ✓ | generate، imageToVideo؛ تم تخطي videoToVideo لأن هذا الموفر يحتاج حاليًا إلى عنوان URL بعيد لملف MP4 |
معلمات الأداة
مطلوب
promptstringrequiredوصف نصي للفيديو المراد إنشاؤه. مطلوب من أجل action: "generate".
مدخلات المحتوى
imagestringimagesstring[]imageRolesstring[]تلميحات أدوار اختيارية لكل موضع، موازية لقائمة الصور المجمعة.
القيم القياسية: first_frame, last_frame, reference_image.
videostringvideosstring[]videoRolesstring[]تلميحات أدوار اختيارية لكل موضع، موازية لقائمة الفيديوهات المجمعة.
القيمة القياسية: reference_video.
audioRefstringصوت مرجعي واحد (مسار أو URL). يُستخدم لموسيقى الخلفية أو مرجع الصوت عندما يدعم المزوّد إدخالات الصوت.
audioRefsstring[]audioRolesstring[]تلميحات أدوار اختيارية لكل موضع، موازية لقائمة الصوت المجمعة.
القيمة القياسية: reference_audio.
عناصر التحكم في النمط
aspectRatiostringتلميح نسبة العرض إلى الارتفاع مثل 1:1 أو 16:9 أو 9:16 أو adaptive أو قيمة خاصة بالمزوّد. يطبّع OpenClaw القيم غير المدعومة أو يتجاهلها حسب المزوّد.
OPENCLAW_DOCS_MARKER:paramOpen:IHBhdGg9InJlc29sdXRpb24iIHR5cGU9InN0cmluZyI
تلميح الدقة مثل 480P أو 720P أو 768P أو 1080P أو 4K أو قيمة خاصة بالمزوّد. يطبّع OpenClaw القيم غير المدعومة أو يتجاهلها حسب المزوّد.
OPENCLAW_DOCS_MARKER:paramClose:
durationSecondsnumberالمدة المستهدفة بالثواني (تُقرَّب إلى أقرب قيمة يدعمها المزوّد).
sizestringaudiobooleanفعّل الصوت المُولَّد في الناتج عندما يكون مدعومًا. يختلف هذا عن audioRef* (الإدخالات).
watermarkbooleanadaptive قيمة حارسة خاصة بالمزوّد: تُمرَّر كما هي إلى
المزوّدات التي تعلن adaptive ضمن قدراتها (مثل BytePlus
Seedance الذي يستخدمها لاكتشاف النسبة تلقائيًا من أبعاد صورة الإدخال).
تعرض المزوّدات التي لا تعلنها القيمة عبر
details.ignoredOverrides في نتيجة الأداة بحيث يكون الإسقاط ظاهرًا.
متقدم
action"generate" | "status" | "list"يعيد "status" مهمة الجلسة الحالية؛ ويفحص "list" المزوّدات.
OPENCLAW_DOCS_MARKER:paramOpen:IHBhdGg9Im1vZGVsIiB0eXBlPSJzdHJpbmci
تجاوز المزوّد/النموذج (مثل runway/gen4.5).
OPENCLAW_DOCS_MARKER:paramClose:
filenamestringtimeoutMsnumberproviderOptionsobjectخيارات خاصة بالمزوّد ككائن JSON (مثل {"seed": 42, "draft": true}).
تتحقق المزوّدات التي تعلن مخططًا مكتوبًا من المفاتيح والأنواع؛ أما المفاتيح
غير المعروفة أو عدم التطابق فتتسبب في تخطي المرشح أثناء الرجوع الاحتياطي. تتلقى المزوّدات التي لا
تعلن مخططًا الخيارات كما هي. شغّل video_generate action=list
لمعرفة ما يقبله كل مزوّد.
تحدد إدخالات المراجع وضع وقت التشغيل:
- لا توجد وسائط مرجعية →
generate - أي مرجع صورة →
imageToVideo - أي مرجع فيديو →
videoToVideo - إدخالات الصوت المرجعية لا تغيّر الوضع المحسوم؛ فهي تُطبَّق
فوق أي وضع تختاره مراجع الصورة/الفيديو، ولا تعمل إلا
مع المزوّدات التي تعلن
maxInputAudios.
لا تُعد مراجع الصور والفيديو المختلطة سطح قدرات مشتركة مستقرًا. فضّل نوع مرجع واحدًا لكل طلب.
الرجوع الاحتياطي والخيارات المكتوبة
تُطبَّق بعض فحوصات القدرات في طبقة الرجوع الاحتياطي بدلًا من حدود الأداة، لذلك يمكن لطلب يتجاوز حدود المزوّد الأساسي أن يعمل رغم ذلك على مزوّد احتياطي قادر:
- يُتخطى المرشح النشط الذي لا يعلن
maxInputAudios(أو يعلن0) عندما يحتوي الطلب على مراجع صوتية؛ ثم يُجرَّب المرشح التالي. maxDurationSecondsلدى المرشح النشط أقل منdurationSecondsالمطلوبة مع عدم وجود قائمةsupportedDurationSecondsمعلنة → يُتخطى.- يحتوي الطلب على
providerOptionsويعلن المرشح النشط صراحة مخططproviderOptionsمكتوبًا → يُتخطى إذا كانت المفاتيح المقدمة غير موجودة في المخطط أو إذا لم تتطابق أنواع القيم. تتلقى المزوّدات التي لا تعلن مخططًا الخيارات كما هي (تمرير متوافق مع الإصدارات السابقة). يمكن للمزوّد إلغاء كل خيارات المزوّد بإعلان مخطط فارغ (capabilities.providerOptions: {})، مما يتسبب في التخطي نفسه كما في حالة عدم تطابق النوع.
يُسجَّل أول سبب تخطٍ في الطلب عند warn حتى يرى المشغلون متى
تم تجاوز مزوّدهم الأساسي؛ وتُسجَّل حالات التخطي اللاحقة عند debug من أجل
إبقاء سلاسل الرجوع الاحتياطي الطويلة هادئة. إذا تم تخطي كل مرشح،
يتضمن الخطأ المجمّع سبب التخطي لكل واحد.
الإجراءات
| الإجراء | ما يفعله |
|---|---|
generate |
الافتراضي. ينشئ فيديو من الموجه المعطى وإدخالات المراجع الاختيارية. |
status |
يتحقق من حالة مهمة الفيديو الجارية للجلسة الحالية دون بدء توليد آخر. |
list |
يعرض المزوّدات والنماذج المتاحة وقدراتها. |
اختيار النموذج
يحسم OpenClaw النموذج بهذا الترتيب:
- معلمة الأداة
model- إذا حدد الوكيل واحدة في الاستدعاء. videoGenerationModel.primaryمن الإعدادات.videoGenerationModel.fallbacksبالترتيب.- الاكتشاف التلقائي - المزوّدات التي لديها مصادقة صالحة، بدءًا من المزوّد الافتراضي الحالي، ثم بقية المزوّدات بالترتيب الأبجدي.
إذا فشل مزوّد، يُجرَّب المرشح التالي تلقائيًا. إذا فشل جميع المرشحين، يتضمن الخطأ تفاصيل من كل محاولة.
اضبط agents.defaults.mediaGenerationAutoProviderFallback: false لاستخدام
إدخالات model وprimary وfallbacks الصريحة فقط.
{
agents: {
defaults: {
videoGenerationModel: {
primary: "google/veo-3.1-fast-generate-preview",
fallbacks: ["runway/gen4.5", "qwen/wan2.6-t2v"],
},
},
},
}
ملاحظات المزوّدين
Alibaba
يستخدم نقطة النهاية غير المتزامنة في DashScope / Model Studio. يجب أن تكون الصور
والفيديوهات المرجعية عناوين URL بعيدة من نوع http(s).
BytePlus (1.0)
معرف المزوّد: byteplus.
النماذج: seedance-1-0-pro-250528 (الافتراضي)،
seedance-1-0-pro-t2v-250528، seedance-1-0-pro-fast-251015،
seedance-1-0-lite-t2v-250428، seedance-1-0-lite-i2v-250428.
لا تقبل نماذج T2V (*-t2v-*) إدخالات الصور؛ تدعم نماذج I2V
ونماذج *-pro-* العامة صورة مرجعية واحدة (الإطار الأول).
مرّر الصورة موضعيًا أو اضبط role: "first_frame".
تُبدَّل معرفات نماذج T2V تلقائيًا إلى متغير I2V
المقابل عند توفير صورة.
مفاتيح providerOptions المدعومة: seed (رقم)، draft (منطقي -
يفرض 480p)، camera_fixed (منطقي).
BytePlus Seedance 1.5
يتطلب Plugin @openclaw/byteplus-modelark.
معرف المزوّد: byteplus-seedance15. النموذج:
seedance-1-5-pro-251215.
يستخدم API الموحّد content[]. يدعم صورتَي إدخال على الأكثر
(first_frame + last_frame). يجب أن تكون كل الإدخالات عناوين URL بعيدة من نوع https://.
اضبط role: "first_frame" / "last_frame" على كل صورة، أو
مرّر الصور موضعيًا.
يكتشف aspectRatio: "adaptive" النسبة تلقائيًا من صورة الإدخال.
يُربط audio: true بـ generate_audio. يُمرَّر providerOptions.seed
(رقم).
BytePlus Seedance 2.0
يتطلب Plugin @openclaw/byteplus-modelark.
معرف المزوّد: byteplus-seedance2. النماذج:
dreamina-seedance-2-0-260128,
dreamina-seedance-2-0-fast-260128.
يستخدم API الموحّد content[]. يدعم حتى 9 صور مرجعية،
و3 فيديوهات مرجعية، و3 ملفات صوتية مرجعية. يجب أن تكون كل الإدخالات عناوين URL بعيدة
من نوع https://. اضبط role على كل أصل - القيم المدعومة:
"first_frame"، "last_frame"، "reference_image"،
"reference_video"، "reference_audio".
يكتشف aspectRatio: "adaptive" النسبة تلقائيًا من صورة الإدخال.
يُربط audio: true بـ generate_audio. يُمرَّر providerOptions.seed
(رقم).
ComfyUI
تنفيذ محلي أو سحابي قائم على سير العمل. يدعم تحويل النص إلى فيديو وتحويل الصورة إلى فيديو عبر المخطط المكوّن.
fal
يستخدم تدفقًا مدعومًا بطابور للمهام طويلة التشغيل. ينتظر OpenClaw حتى 20 دقيقة افتراضيًا قبل اعتبار مهمة طابور fal قيد التنفيذ منتهية المهلة. تقبل معظم نماذج فيديو fal مرجع صورة واحدًا. تقبل نماذج Seedance 2.0 من مرجع إلى فيديو حتى 9 صور و3 فيديوهات و3 مراجع صوتية، وبحد أقصى 12 ملفًا مرجعيًا إجمالًا.
Google (Gemini / Veo)
يدعم مرجع صورة واحدًا أو مرجع فيديو واحدًا. يتم تجاهل طلبات الصوت المولّد
مع تحذير في مسار واجهة Gemini البرمجية لأن تلك الواجهة ترفض معامل
generateAudio لتوليد فيديو Veo الحالي.
MiniMax
مرجع صورة واحد فقط. يقبل MiniMax دقتي 768P و1080P؛ وتتم تسوية طلبات
مثل 720P إلى أقرب قيمة مدعومة قبل الإرسال.
OpenAI
يتم تمرير تجاوز size فقط. يتم تجاهل تجاوزات النمط الأخرى
(aspectRatio، resolution، audio، watermark) مع تحذير.
OpenRouter
يستخدم واجهة /videos غير المتزامنة الخاصة بـ OpenRouter. يرسل OpenClaw
المهمة، ويستطلع polling_url، وينزّل إما unsigned_urls أو نقطة نهاية
محتوى المهمة الموثّقة. يعلن الإعداد الافتراضي المضمّن google/veo-3.1-fast
مددًا قدرها 4/6/8 ثوانٍ، ودقتي 720P/1080P، ونسبتي عرض إلى ارتفاع
16:9/9:16.
Qwen
نفس خلفية DashScope مثل Alibaba. يجب أن تكون مدخلات المراجع عناوين URL
بعيدة بصيغة http(s)؛ يتم رفض الملفات المحلية مسبقًا.
Runway
يدعم الملفات المحلية عبر معرّفات موارد البيانات. يتطلب تحويل الفيديو إلى
فيديو runway/gen4_aleph. تعرض عمليات النص فقط نسبتي عرض إلى ارتفاع
16:9 و9:16.
Together
مرجع صورة واحد فقط.
Vydra
يستخدم https://www.vydra.ai/api/v1 مباشرة لتجنب عمليات إعادة التوجيه
التي تسقط المصادقة. يتم تضمين veo3 كتحويل نص إلى فيديو فقط؛ ويتطلب
kling عنوان URL بعيدًا لصورة.
xAI
يدعم تحويل النص إلى فيديو، وتحويل صورة إطار أول واحدة إلى فيديو، وما يصل
إلى 7 مدخلات reference_image عبر reference_images في xAI، وتدفقات
تعديل/تمديد الفيديو البعيد.
أوضاع قدرات المزوّد
يدعم عقد توليد الفيديو المشترك قدرات خاصة بالأوضاع بدلًا من حدود إجمالية مسطحة فقط. ينبغي لتطبيقات المزوّدين الجديدة تفضيل كتل أوضاع صريحة:
capabilities: {
generate: {
maxVideos: 1,
maxDurationSeconds: 10,
supportsResolution: true,
},
imageToVideo: {
enabled: true,
maxVideos: 1,
maxInputImages: 1,
maxInputImagesByModel: { "provider/reference-to-video": 9 },
maxDurationSeconds: 5,
},
videoToVideo: {
enabled: true,
maxVideos: 1,
maxInputVideos: 1,
maxDurationSeconds: 5,
},
}
الحقول الإجمالية المسطحة مثل maxInputImages وmaxInputVideos ليست
كافية للإعلان عن دعم وضع التحويل. ينبغي للمزوّدين التصريح بـ generate و
imageToVideo وvideoToVideo صراحة حتى تتمكن الاختبارات الحية واختبارات
العقد وأداة video_generate المشتركة من التحقق من دعم الوضع بشكل حتمي.
عندما يكون نموذج واحد لدى مزوّد ما ذا دعم أوسع لمدخلات المراجع من البقية،
استخدم maxInputImagesByModel أو maxInputVideosByModel أو
maxInputAudiosByModel بدلًا من رفع الحد على مستوى الوضع.
الاختبارات الحية
تغطية حية اختيارية للمزوّدين المضمّنين المشتركين:
OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/video-generation-providers.live.test.ts
غلاف المستودع:
pnpm test:live:media video
يحمّل هذا الملف الحي متغيرات بيئة المزوّدين الناقصة من ~/.profile، ويفضّل
افتراضيًا مفاتيح واجهة برمجة التطبيقات الحية/البيئية على ملفات تعريف المصادقة
المخزنة، ويشغّل افتراضيًا اختبار دخان آمنًا للإصدار:
generateلكل مزوّد غير FAL في المسح.- موجه جراد بحر مدته ثانية واحدة.
- حد عمليات لكل مزوّد من
OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS(180000افتراضيًا).
FAL اختياري لأن زمن انتظار الطابور من جهة المزوّد قد يهيمن على وقت الإصدار:
pnpm test:live:media video --video-providers fal
اضبط OPENCLAW_LIVE_VIDEO_GENERATION_FULL_MODES=1 لتشغيل أوضاع التحويل
المعلنة أيضًا التي يستطيع المسح المشترك تمرينها بأمان باستخدام وسائط محلية:
imageToVideoعندما تكونcapabilities.imageToVideo.enabled.videoToVideoعندما تكونcapabilities.videoToVideo.enabledويقبل المزوّد/النموذج إدخال فيديو محليًا مدعومًا بمخزن مؤقت في المسح المشترك.
اليوم يغطي مسار videoToVideo الحي المشترك runway فقط عندما تختار
runway/gen4_aleph.
التكوين
اضبط نموذج توليد الفيديو الافتراضي في تكوين OpenClaw لديك:
{
agents: {
defaults: {
videoGenerationModel: {
primary: "qwen/wan2.6-t2v",
fallbacks: ["qwen/wan2.6-r2v-flash"],
},
},
},
}
أو عبر CLI:
openclaw config set agents.defaults.videoGenerationModel.primary "qwen/wan2.6-t2v"
ذات صلة
- Alibaba Model Studio
- المهام الخلفية - تتبع المهام لتوليد الفيديو غير المتزامن
- BytePlus
- ComfyUI
- مرجع التكوين
- fal
- Google (Gemini)
- MiniMax
- النماذج
- OpenAI
- Qwen
- Runway
- Together AI
- نظرة عامة على الأدوات
- Vydra
- xAI