Tools
أداة PDF
pdf يحلل مستندا واحدا أو أكثر من مستندات PDF ويعيد النص.
السلوك السريع:
- وضع المزوّد الأصلي لمزوّدي نماذج Anthropic وGoogle.
- وضع الاستخراج الاحتياطي للمزوّدين الآخرين (استخراج النص أولا، ثم صور الصفحات عند الحاجة).
- يدعم إدخالا واحدا (
pdf) أو متعدد الإدخالات (pdfs)، بحد أقصى 10 ملفات PDF لكل استدعاء.
التوفر
لا تُسجَّل الأداة إلا عندما يتمكن OpenClaw من حل إعداد نموذج قادر على PDF للوكيل:
agents.defaults.pdfModel- الرجوع احتياطيا إلى
agents.defaults.imageModel - الرجوع احتياطيا إلى نموذج الجلسة/النموذج الافتراضي المحلول للوكيل
- إذا كان مزوّدو PDF الأصليون مدعومين بالمصادقة، ففضّلهم قبل مرشحي الرجوع الاحتياطي العام للصور
إذا لم يمكن حل أي نموذج قابل للاستخدام، فلن تُعرض أداة pdf.
ملاحظات التوفر:
- سلسلة الرجوع الاحتياطي واعية بالمصادقة. لا يُحتسب
provider/modelمضبوط إلا إذا استطاع OpenClaw فعليا مصادقة ذلك المزوّد للوكيل. - مزوّدو PDF الأصليون حاليا هم Anthropic وGoogle.
- إذا كان مزوّد الجلسة/المزوّد الافتراضي المحلول لديه بالفعل نموذج رؤية/PDF مضبوط، فتعيد أداة PDF استخدامه قبل الرجوع احتياطيا إلى مزوّدين آخرين مدعومين بالمصادقة.
مرجع الإدخال
pdfstringمسار PDF واحد أو URL واحد.
pdfsstring[]مسارات PDF أو URLs متعددة، حتى 10 إجمالا.
promptstringمطالبة التحليل.
pagesstringمرشح صفحات مثل 1-5 أو 1,3,7-9.
modelstringتجاوز اختياري للنموذج بصيغة provider/model.
maxBytesMbnumberحد الحجم لكل PDF بالميغابايت. يكون افتراضيا agents.defaults.pdfMaxBytesMb أو 10.
ملاحظات الإدخال:
- يتم دمج
pdfوpdfsوإزالة التكرارات منهما قبل التحميل. - إذا لم يُقدَّم أي إدخال PDF، تعيد الأداة خطأ.
- يتم تحليل
pagesكأرقام صفحات تبدأ من 1، مع إزالة التكرارات والفرز والتقييد إلى الحد الأقصى المضبوط للصفحات. - يكون
maxBytesMbافتراضياagents.defaults.pdfMaxBytesMbأو10.
مراجع PDF المدعومة
- مسار ملف محلي (بما في ذلك توسيع
~) - URL من نوع
file:// - URL من نوع
http://وhttps:// - مراجع واردة يديرها OpenClaw مثل
media://inbound/<id>
ملاحظات المراجع:
- تُرفض مخططات URI الأخرى (مثل
ftp://) معunsupported_pdf_reference. - في وضع sandbox، تُرفض URLs البعيدة
http(s). - عند تفعيل سياسة الملفات الخاصة بمساحة العمل فقط، تُرفض مسارات الملفات المحلية خارج الجذور المسموح بها.
- يُسمح بالمراجع الواردة المُدارة والمسارات المعاد تشغيلها ضمن مخزن وسائط OpenClaw الواردة مع سياسة الملفات الخاصة بمساحة العمل فقط.
أوضاع التنفيذ
وضع المزوّد الأصلي
يُستخدم الوضع الأصلي للمزوّدين anthropic وgoogle.
ترسل الأداة بايتات PDF الخام مباشرة إلى APIs المزوّدين.
حدود الوضع الأصلي:
pagesغير مدعوم. إذا تم تعيينه، تعيد الأداة خطأ.- إدخال ملفات PDF متعددة مدعوم؛ يُرسل كل PDF ككتلة مستند أصلية / جزء PDF مضمّن قبل المطالبة.
وضع الاستخراج الاحتياطي
يُستخدم الوضع الاحتياطي للمزوّدين غير الأصليين.
التدفق:
- استخراج النص من الصفحات المحددة (حتى
agents.defaults.pdfMaxPages، افتراضيا20). - إذا كان طول النص المستخرج أقل من
200حرف، تُعرض الصفحات المحددة إلى صور PNG وتُضمّن. - إرسال المحتوى المستخرج مع المطالبة إلى النموذج المحدد.
تفاصيل الرجوع الاحتياطي:
- يستخدم استخراج صور الصفحات ميزانية بكسلات قدرها
4,000,000. - إذا كان النموذج الهدف لا يدعم إدخال الصور ولا يوجد نص قابل للاستخراج، تعيد الأداة خطأ.
- إذا نجح استخراج النص لكن استخراج الصور كان سيتطلب رؤية على نموذج نصي فقط، يسقط OpenClaw الصور المعروضة ويتابع باستخدام النص المستخرج.
- يستخدم الاستخراج الاحتياطي Plugin المضمّن
document-extract. يملك Plugin pdfjs-dist؛ ولا يُستخدم@napi-rs/canvasإلا عندما يكون الرجوع الاحتياطي لعرض الصور متاحا.
الإعداد
{
agents: {
defaults: {
pdfModel: {
primary: "anthropic/claude-opus-4-6",
fallbacks: ["openai/gpt-5.4-mini"],
},
pdfMaxBytesMb: 10,
pdfMaxPages: 20,
},
},
}
راجع مرجع الإعداد للتفاصيل الكاملة للحقول.
تفاصيل الإخراج
تعيد الأداة نصا في content[0].text وبيانات وصفية منظمة في details.
حقول details الشائعة:
model: مرجع النموذج المحلول (provider/model)native: trueلوضع المزوّد الأصلي، وfalseللرجوع الاحتياطيattempts: محاولات الرجوع الاحتياطي التي فشلت قبل النجاح
حقول المسار:
- إدخال PDF واحد:
details.pdf - إدخالات PDF متعددة:
details.pdfs[]مع مدخلاتpdf - بيانات وصفية لإعادة كتابة مسار sandbox (عند الانطباق):
rewrittenFrom
سلوك الأخطاء
- إدخال PDF مفقود: يطرح
pdf required: provide a path or URL to a PDF document - عدد ملفات PDF زائد: يعيد خطأ منظما في
details.error = "too_many_pdfs" - مخطط مرجع غير مدعوم: يعيد
details.error = "unsupported_pdf_reference" - الوضع الأصلي مع
pages: يطرح خطأ واضحاpages is not supported with native PDF providers
أمثلة
ملف PDF واحد:
{
"pdf": "/tmp/report.pdf",
"prompt": "Summarize this report in 5 bullets"
}
ملفات PDF متعددة:
{
"pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"],
"prompt": "Compare risks and timeline changes across both documents"
}
نموذج احتياطي بمرشح صفحات:
{
"pdf": "https://example.com/report.pdf",
"pages": "1-3,7",
"model": "openai/gpt-5.4-mini",
"prompt": "Extract only customer-impacting incidents"
}
ذات صلة
- نظرة عامة على الأدوات - كل أدوات الوكيل المتاحة
- مرجع الإعداد - إعداد pdfMaxBytesMb وpdfMaxPages