Tools
Firecrawl
OpenClaw dapat menggunakan Firecrawl dalam tiga cara:
- sebagai penyedia
web_search - sebagai alat Plugin eksplisit:
firecrawl_searchdanfirecrawl_scrape - sebagai ekstraktor fallback untuk
web_fetch
Ini adalah layanan ekstraksi/pencarian terhosting yang mendukung pengelakan bot dan caching, yang membantu untuk situs berat JS atau halaman yang memblokir fetch HTTP biasa.
Dapatkan API key
- Buat akun Firecrawl dan hasilkan API key.
- Simpan di konfigurasi atau setel
FIRECRAWL_API_KEYdi lingkungan gateway.
Konfigurasi pencarian Firecrawl
{
tools: {
web: {
search: {
provider: "firecrawl",
},
},
},
plugins: {
entries: {
firecrawl: {
enabled: true,
config: {
webSearch: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
},
},
},
},
},
}
Catatan:
- Memilih Firecrawl saat onboarding atau
openclaw configure --section webmengaktifkan Plugin Firecrawl bawaan secara otomatis. web_searchdengan Firecrawl mendukungquerydancount.- Untuk kontrol khusus Firecrawl seperti
sources,categories, atau scraping hasil, gunakanfirecrawl_search. baseUrldefault ke Firecrawl terhosting dihttps://api.firecrawl.dev. Override yang dihosting sendiri hanya diizinkan untuk endpoint privat/internal; HTTP hanya diterima untuk target privat tersebut.FIRECRAWL_BASE_URLadalah fallback env bersama untuk URL dasar pencarian dan scrape Firecrawl.
Konfigurasi scrape Firecrawl + fallback web_fetch
{
plugins: {
entries: {
firecrawl: {
enabled: true,
config: {
webFetch: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
onlyMainContent: true,
maxAgeMs: 172800000,
timeoutSeconds: 60,
},
},
},
},
},
}
Catatan:
- Upaya fallback Firecrawl hanya berjalan ketika API key tersedia (
plugins.entries.firecrawl.config.webFetch.apiKeyatauFIRECRAWL_API_KEY). maxAgeMsmengontrol seberapa lama hasil cache dapat digunakan (ms). Default-nya adalah 2 hari.- Konfigurasi lama
tools.web.fetch.firecrawl.*dimigrasikan otomatis olehopenclaw doctor --fix. - Override URL scrape/dasar Firecrawl mengikuti aturan terhosting/privat yang sama seperti pencarian: lalu lintas terhosting publik menggunakan
https://api.firecrawl.dev; override yang dihosting sendiri harus resolve ke endpoint privat/internal. firecrawl_scrapemenolak URL target privat, loopback, metadata, dan non-HTTP(S) yang jelas sebelum meneruskannya ke Firecrawl, sesuai dengan kontrak keamanan targetweb_fetchuntuk panggilan scrape Firecrawl eksplisit.
firecrawl_scrape menggunakan kembali pengaturan plugins.entries.firecrawl.config.webFetch.* dan env var yang sama.
Firecrawl yang dihosting sendiri
Setel plugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl, atau FIRECRAWL_BASE_URL
ketika Anda menjalankan Firecrawl sendiri. OpenClaw menerima http:// hanya untuk target loopback,
jaringan privat, .local, .internal, atau .localhost. Host kustom publik
ditolak agar API key Firecrawl tidak terkirim ke endpoint sembarang secara
tidak sengaja.
Alat Plugin Firecrawl
firecrawl_search
Gunakan ini ketika Anda menginginkan kontrol pencarian khusus Firecrawl, bukan web_search generik.
Parameter inti:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Gunakan ini untuk halaman berat JS atau dilindungi bot ketika web_fetch biasa kurang memadai.
Parameter inti:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Stealth / pengelakan bot
Firecrawl mengekspos parameter mode proxy untuk pengelakan bot (basic, stealth, atau auto).
OpenClaw selalu menggunakan proxy: "auto" plus storeInCache: true untuk permintaan Firecrawl.
Jika proxy dihilangkan, Firecrawl default ke auto. auto mencoba ulang dengan proxy stealth jika upaya dasar gagal, yang dapat menggunakan lebih banyak kredit
daripada scraping basic-only.
Bagaimana web_fetch menggunakan Firecrawl
Urutan ekstraksi web_fetch:
- Readability (lokal)
- Firecrawl (jika dipilih atau terdeteksi otomatis sebagai fallback web-fetch aktif)
- Pembersihan HTML dasar (fallback terakhir)
Tombol pemilihan adalah tools.web.fetch.provider. Jika Anda menghilangkannya, OpenClaw
mendeteksi otomatis penyedia web-fetch pertama yang siap dari kredensial yang tersedia.
Saat ini penyedia bawaan adalah Firecrawl.
Terkait
- Ikhtisar Web Search -- semua penyedia dan deteksi otomatis
- Web Fetch -- alat web_fetch dengan fallback Firecrawl
- Tavily -- alat pencarian + ekstraksi