Tools
Firecrawl
OpenClaw میتواند از Firecrawl به سه روش استفاده کند:
- بهعنوان ارائهدهنده
web_search - بهعنوان ابزارهای صریح Plugin:
firecrawl_searchوfirecrawl_scrape - بهعنوان استخراجکننده جایگزین برای
web_fetch
این یک سرویس میزبانیشده برای استخراج/جستوجو است که از دور زدن محدودیتهای ضدربات و کش پشتیبانی میکند، که برای سایتهای سنگین از نظر JS یا صفحههایی که واکشیهای ساده HTTP را مسدود میکنند مفید است.
دریافت کلید API
- یک حساب Firecrawl ایجاد کنید و یک کلید API بسازید.
- آن را در پیکربندی ذخیره کنید یا
FIRECRAWL_API_KEYرا در محیط Gateway تنظیم کنید.
پیکربندی جستوجوی Firecrawl
{
tools: {
web: {
search: {
provider: "firecrawl",
},
},
},
plugins: {
entries: {
firecrawl: {
enabled: true,
config: {
webSearch: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
},
},
},
},
},
}
نکتهها:
- انتخاب Firecrawl در فرایند راهاندازی اولیه یا
openclaw configure --section web، Plugin همراه Firecrawl را بهصورت خودکار فعال میکند. web_searchبا Firecrawl ازqueryوcountپشتیبانی میکند.- برای کنترلهای ویژه Firecrawl مانند
sources،categories، یا استخراج نتایج، ازfirecrawl_searchاستفاده کنید. - مقدار پیشفرض
baseUrlبرابر Firecrawl میزبانیشده درhttps://api.firecrawl.devاست. بازنویسیهای خودمیزبان فقط برای endpointهای خصوصی/داخلی مجاز هستند؛ HTTP فقط برای همان مقصدهای خصوصی پذیرفته میشود. FIRECRAWL_BASE_URLجایگزین محیطی مشترک برای نشانیهای پایه جستوجو و استخراج Firecrawl است.
پیکربندی استخراج Firecrawl + جایگزین web_fetch
{
plugins: {
entries: {
firecrawl: {
enabled: true,
config: {
webFetch: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
onlyMainContent: true,
maxAgeMs: 172800000,
timeoutSeconds: 60,
},
},
},
},
},
}
نکتهها:
- تلاشهای جایگزین Firecrawl فقط زمانی اجرا میشوند که یک کلید API در دسترس باشد (
plugins.entries.firecrawl.config.webFetch.apiKeyیاFIRECRAWL_API_KEY). maxAgeMsکنترل میکند نتایج کششده چقدر میتوانند قدیمی باشند (ms). مقدار پیشفرض ۲ روز است.- پیکربندی قدیمی
tools.web.fetch.firecrawl.*باopenclaw doctor --fixبهصورت خودکار مهاجرت داده میشود. - بازنویسیهای نشانی استخراج/پایه Firecrawl همان قاعده میزبانیشده/خصوصی جستوجو را دنبال میکنند: ترافیک عمومی میزبانیشده از
https://api.firecrawl.devاستفاده میکند؛ بازنویسیهای خودمیزبان باید به endpointهای خصوصی/داخلی resolve شوند. firecrawl_scrapeپیش از ارسال URLهای مقصد به Firecrawl، URLهای آشکارا خصوصی، loopback، metadata و غیر HTTP(S) را رد میکند، و با قرارداد ایمنی مقصدweb_fetchبرای فراخوانیهای صریح استخراج Firecrawl همخوان است.
firecrawl_scrape از همان تنظیمات و متغیرهای محیطی plugins.entries.firecrawl.config.webFetch.* دوباره استفاده میکند.
Firecrawl خودمیزبان
وقتی Firecrawl را خودتان اجرا میکنید، plugins.entries.firecrawl.config.webSearch.baseUrl،
plugins.entries.firecrawl.config.webFetch.baseUrl، یا FIRECRAWL_BASE_URL
را تنظیم کنید. OpenClaw فقط برای مقصدهای loopback،
شبکه خصوصی، .local، .internal، یا .localhost مقدار http:// را میپذیرد. میزبانهای سفارشی عمومی رد میشوند تا کلیدهای API Firecrawl بهطور
تصادفی به endpointهای دلخواه ارسال نشوند.
ابزارهای Plugin Firecrawl
firecrawl_search
وقتی بهجای web_search عمومی، کنترلهای جستوجوی ویژه Firecrawl را میخواهید از این استفاده کنید.
پارامترهای اصلی:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
از این برای صفحههای سنگین از نظر JS یا محافظتشده در برابر ربات استفاده کنید که web_fetch ساده در آنها ضعیف است.
پارامترهای اصلی:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
پنهانکاری / دور زدن ضدربات
Firecrawl یک پارامتر حالت proxy برای دور زدن ضدربات ارائه میکند (basic، stealth، یا auto).
OpenClaw همیشه برای درخواستهای Firecrawl از proxy: "auto" بههمراه storeInCache: true استفاده میکند.
اگر proxy حذف شود، Firecrawl بهصورت پیشفرض از auto استفاده میکند. اگر تلاش basic شکست بخورد، auto با proxyهای stealth دوباره تلاش میکند، که ممکن است نسبت به استخراج فقط basic اعتبار بیشتری مصرف کند.
نحوه استفاده web_fetch از Firecrawl
ترتیب استخراج web_fetch:
- Readability (محلی)
- Firecrawl (اگر انتخاب شده باشد یا بهصورت خودکار بهعنوان جایگزین فعال web-fetch شناسایی شده باشد)
- پاکسازی پایه HTML (آخرین جایگزین)
دکمه انتخاب tools.web.fetch.provider است. اگر آن را حذف کنید، OpenClaw
اولین ارائهدهنده آماده web-fetch را از اعتبارنامههای موجود بهصورت خودکار شناسایی میکند.
امروز ارائهدهنده همراه، Firecrawl است.
مرتبط
- نمای کلی Web Search -- همه ارائهدهندهها و شناسایی خودکار
- Web Fetch -- ابزار web_fetch با جایگزین Firecrawl
- Tavily -- ابزارهای جستوجو + استخراج