Tools
Firecrawl
OpenClaw สามารถใช้ Firecrawl ได้สามวิธี:
- เป็นผู้ให้บริการ
web_search - เป็นเครื่องมือ Plugin แบบระบุชัด:
firecrawl_searchและfirecrawl_scrape - เป็นตัวแยกข้อมูลสำรองสำหรับ
web_fetch
Firecrawl เป็นบริการแยกข้อมูล/ค้นหาแบบโฮสต์ที่รองรับการหลบเลี่ยงบอตและการแคช ซึ่งช่วยกับเว็บไซต์ที่ใช้ JS หนักหรือหน้าที่บล็อกการ fetch ผ่าน HTTP แบบธรรมดา
รับ API key
- สร้างบัญชี Firecrawl และสร้าง API key
- เก็บไว้ในการกำหนดค่า หรือตั้งค่า
FIRECRAWL_API_KEYในสภาพแวดล้อมของ Gateway
กำหนดค่าการค้นหาของ Firecrawl
{
tools: {
web: {
search: {
provider: "firecrawl",
},
},
},
plugins: {
entries: {
firecrawl: {
enabled: true,
config: {
webSearch: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
},
},
},
},
},
}
หมายเหตุ:
- การเลือก Firecrawl ในการเริ่มต้นใช้งานหรือ
openclaw configure --section webจะเปิดใช้ Plugin Firecrawl ที่มาพร้อมกับระบบโดยอัตโนมัติ web_searchที่ใช้ Firecrawl รองรับqueryและcount- สำหรับการควบคุมเฉพาะของ Firecrawl เช่น
sources,categoriesหรือการ scrape ผลลัพธ์ ให้ใช้firecrawl_search - ค่าเริ่มต้นของ
baseUrlคือ Firecrawl แบบโฮสต์ที่https://api.firecrawl.devการ override แบบ self-hosted อนุญาตเฉพาะสำหรับ endpoint ส่วนตัว/ภายในเท่านั้น; HTTP จะยอมรับเฉพาะสำหรับเป้าหมายส่วนตัวเหล่านั้น FIRECRAWL_BASE_URLเป็น env สำรองร่วมสำหรับ URL ฐานของการค้นหาและการ scrape ของ Firecrawl
กำหนดค่า Firecrawl scrape + ตัวสำรองของ web_fetch
{
plugins: {
entries: {
firecrawl: {
enabled: true,
config: {
webFetch: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
onlyMainContent: true,
maxAgeMs: 172800000,
timeoutSeconds: 60,
},
},
},
},
},
}
หมายเหตุ:
- ความพยายามใช้ Firecrawl เป็นตัวสำรองจะทำงานเฉพาะเมื่อมี API key (
plugins.entries.firecrawl.config.webFetch.apiKeyหรือFIRECRAWL_API_KEY) maxAgeMsควบคุมว่าผลลัพธ์ที่แคชไว้มีอายุได้มากเท่าไร (มิลลิวินาที) ค่าเริ่มต้นคือ 2 วัน- การกำหนดค่าเก่า
tools.web.fetch.firecrawl.*จะถูกย้ายโดยอัตโนมัติด้วยopenclaw doctor --fix - การ override URL สำหรับ Firecrawl scrape/base ใช้กฎแบบโฮสต์/ส่วนตัวเดียวกับการค้นหา: ทราฟฟิกแบบโฮสต์สาธารณะใช้
https://api.firecrawl.dev; การ override แบบ self-hosted ต้อง resolve ไปยัง endpoint ส่วนตัว/ภายใน firecrawl_scrapeจะปฏิเสธ URL เป้าหมายที่เห็นได้ชัดว่าเป็นส่วนตัว, loopback, metadata และไม่ใช่ HTTP(S) ก่อนส่งต่อไปยัง Firecrawl โดยตรงตามสัญญาความปลอดภัยของเป้าหมายweb_fetchสำหรับการเรียก Firecrawl scrape แบบระบุชัด
firecrawl_scrape ใช้การตั้งค่าและ env vars ชุดเดียวกันจาก plugins.entries.firecrawl.config.webFetch.*
Firecrawl แบบ self-hosted
ตั้งค่า plugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl หรือ FIRECRAWL_BASE_URL
เมื่อคุณรัน Firecrawl เอง OpenClaw ยอมรับ http:// เฉพาะสำหรับเป้าหมาย loopback,
เครือข่ายส่วนตัว, .local, .internal หรือ .localhost เท่านั้น โฮสต์แบบกำหนดเองสาธารณะ
จะถูกปฏิเสธเพื่อไม่ให้ API key ของ Firecrawl ถูกส่งไปยัง endpoint ใด ๆ โดย
ไม่ตั้งใจ
เครื่องมือ Plugin ของ Firecrawl
firecrawl_search
ใช้รายการนี้เมื่อคุณต้องการการควบคุมการค้นหาเฉพาะของ Firecrawl แทน web_search ทั่วไป
พารามิเตอร์หลัก:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
ใช้รายการนี้สำหรับหน้าที่ใช้ JS หนักหรือมีการป้องกันบอต ซึ่ง web_fetch แบบธรรมดายังทำงานได้ไม่ดี
พารามิเตอร์หลัก:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Stealth / การหลบเลี่ยงบอต
Firecrawl เปิดเผยพารามิเตอร์ โหมดพร็อกซี สำหรับการหลบเลี่ยงบอต (basic, stealth หรือ auto)
OpenClaw ใช้ proxy: "auto" พร้อมกับ storeInCache: true สำหรับคำขอ Firecrawl เสมอ
หากละเว้น proxy Firecrawl จะใช้ค่าเริ่มต้นเป็น auto auto จะลองซ้ำด้วยพร็อกซี stealth หากความพยายามแบบ basic ล้มเหลว ซึ่งอาจใช้เครดิตมากกว่า
การ scrape แบบ basic เท่านั้น
web_fetch ใช้ Firecrawl อย่างไร
ลำดับการแยกข้อมูลของ web_fetch:
- Readability (ภายในเครื่อง)
- Firecrawl (หากเลือกไว้หรือถูกตรวจพบอัตโนมัติว่าเป็นตัวสำรอง web-fetch ที่ใช้งานอยู่)
- การล้าง HTML แบบพื้นฐาน (ตัวสำรองสุดท้าย)
ตัวเลือกสำหรับการเลือกคือ tools.web.fetch.provider หากคุณละเว้น OpenClaw
จะตรวจพบผู้ให้บริการ web-fetch รายแรกที่พร้อมใช้งานจากข้อมูลรับรองที่มีอยู่โดยอัตโนมัติ
ปัจจุบันผู้ให้บริการที่มาพร้อมกับระบบคือ Firecrawl
ที่เกี่ยวข้อง
- ภาพรวม Web Search -- ผู้ให้บริการทั้งหมดและการตรวจพบอัตโนมัติ
- Web Fetch -- เครื่องมือ web_fetch พร้อมตัวสำรอง Firecrawl
- Tavily -- เครื่องมือค้นหา + แยกข้อมูล