Tools

Firecrawl

يمكن لـ OpenClaw استخدام Firecrawl بثلاث طرق:

بصفته موفر web_search
كأدوات Plugin صريحة: firecrawl_search وfirecrawl_scrape
كمستخرج احتياطي لـ web_fetch

إنه خدمة مستضافة للاستخراج/البحث تدعم تجاوز البوتات والتخزين المؤقت، ما يساعد مع المواقع كثيفة JS أو الصفحات التي تحظر عمليات الجلب العادية عبر HTTP.

الحصول على مفتاح API

أنشئ حساب Firecrawl وولّد مفتاح API.
خزّنه في الإعدادات أو عيّن FIRECRAWL_API_KEY في بيئة Gateway.

تكوين بحث Firecrawl

{
  tools: {
    web: {
      search: {
        provider: "firecrawl",
      },
    },
  },
  plugins: {
    entries: {
      firecrawl: {
        enabled: true,
        config: {
          webSearch: {
            apiKey: "FIRECRAWL_API_KEY_HERE",
            baseUrl: "https://api.firecrawl.dev",
          },
        },
      },
    },
  },
}

ملاحظات:

يؤدي اختيار Firecrawl في الإعداد الأولي أو openclaw configure --section web إلى تفعيل Plugin Firecrawl المضمّن تلقائيًا.
يدعم web_search مع Firecrawl المعلمتين query وcount.
لعناصر التحكم الخاصة بـ Firecrawl مثل sources أو categories أو استخراج النتائج، استخدم firecrawl_search.
تكون القيمة الافتراضية لـ baseUrl هي Firecrawl المستضاف على https://api.firecrawl.dev. لا يُسمح بالتجاوزات ذاتية الاستضافة إلا لنقاط النهاية الخاصة/الداخلية؛ ولا يُقبل HTTP إلا لتلك الأهداف الخاصة.
FIRECRAWL_BASE_URL هو بديل البيئة المشترك لعناوين URL الأساسية لبحث Firecrawl والاستخراج.

تكوين استخراج Firecrawl + احتياطي web_fetch

{
  plugins: {
    entries: {
      firecrawl: {
        enabled: true,
        config: {
          webFetch: {
            apiKey: "FIRECRAWL_API_KEY_HERE",
            baseUrl: "https://api.firecrawl.dev",
            onlyMainContent: true,
            maxAgeMs: 172800000,
            timeoutSeconds: 60,
          },
        },
      },
    },
  },
}

ملاحظات:

لا تُشغَّل محاولات احتياطي Firecrawl إلا عند توفر مفتاح API (plugins.entries.firecrawl.config.webFetch.apiKey أو FIRECRAWL_API_KEY).
يتحكم maxAgeMs في مدى قِدم النتائج المخزنة مؤقتًا المسموح به (بالمللي ثانية). القيمة الافتراضية هي يومان.
يتم ترحيل إعدادات tools.web.fetch.firecrawl.* القديمة تلقائيًا بواسطة openclaw doctor --fix.
تتبع تجاوزات عنوان URL الأساسي/الاستخراج في Firecrawl قاعدة الاستضافة/الخصوصية نفسها مثل البحث: تستخدم حركة المرور العامة المستضافة https://api.firecrawl.dev؛ ويجب أن تشير التجاوزات ذاتية الاستضافة إلى نقاط نهاية خاصة/داخلية.
يرفض firecrawl_scrape عناوين URL المستهدفة الواضحة الخاصة، وloopback، والبيانات الوصفية، وغير HTTP(S) قبل تمريرها إلى Firecrawl، بما يطابق عقد سلامة الهدف في web_fetch لاستدعاءات استخراج Firecrawl الصريحة.

يعيد firecrawl_scrape استخدام إعدادات plugins.entries.firecrawl.config.webFetch.* نفسها ومتغيرات البيئة نفسها.

Firecrawl ذاتي الاستضافة

عيّن plugins.entries.firecrawl.config.webSearch.baseUrl، أو plugins.entries.firecrawl.config.webFetch.baseUrl، أو FIRECRAWL_BASE_URL عند تشغيل Firecrawl بنفسك. يقبل OpenClaw ‏http:// فقط لأهداف loopback أو الشبكة الخاصة أو .local أو .internal أو .localhost. تُرفض المضيفات العامة المخصصة حتى لا تُرسل مفاتيح Firecrawl API إلى نقاط نهاية عشوائية عن طريق الخطأ.

أدوات Plugin في Firecrawl

`firecrawl_search`

استخدم هذا عندما تريد عناصر تحكم بحث خاصة بـ Firecrawl بدلًا من web_search العام.

المعلمات الأساسية:

query
count
sources
categories
scrapeResults
timeoutSeconds

`firecrawl_scrape`

استخدم هذا للصفحات كثيفة JS أو المحمية من البوتات حيث يكون web_fetch العادي ضعيفًا.

المعلمات الأساسية:

url
extractMode
maxChars
onlyMainContent
maxAgeMs
proxy
storeInCache
timeoutSeconds

التخفي / تجاوز البوتات

يعرض Firecrawl معلمة وضع proxy لتجاوز البوتات (basic أو stealth أو auto). يستخدم OpenClaw دائمًا proxy: "auto" بالإضافة إلى storeInCache: true لطلبات Firecrawl. إذا تم حذف proxy، يستخدم Firecrawl القيمة الافتراضية auto. يعيد auto المحاولة باستخدام وكلاء التخفي إذا فشلت محاولة أساسية، ما قد يستخدم رصيدًا أكثر من الاستخراج الأساسي فقط.

كيف يستخدم `web_fetch` Firecrawl

ترتيب استخراج web_fetch:

Readability (محلي)
Firecrawl (إذا تم اختياره أو اكتشافه تلقائيًا بصفته احتياطي جلب الويب النشط)
تنظيف HTML الأساسي (آخر احتياطي)

مفتاح الاختيار هو tools.web.fetch.provider. إذا حذفته، يكتشف OpenClaw تلقائيًا أول موفر جاهز لجلب الويب من بيانات الاعتماد المتاحة. حاليًا، الموفر المضمّن هو Firecrawl.

ذو صلة

نظرة عامة على بحث الويب -- جميع الموفرين والاكتشاف التلقائي
جلب الويب -- أداة web_fetch مع احتياطي Firecrawl
Tavily -- أدوات البحث + الاستخراج

# الحصول على مفتاح API

# تكوين بحث Firecrawl

# تكوين استخراج Firecrawl + احتياطي web_fetch

# Firecrawl ذاتي الاستضافة

# أدوات Plugin في Firecrawl

# firecrawl_search

# firecrawl_scrape

# التخفي / تجاوز البوتات

# كيف يستخدم web_fetch Firecrawl

# ذو صلة