Tools
Firecrawl
OpenClaw kann Firecrawl auf drei Arten verwenden:
- als
web_search-Provider - als explizite Plugin-Tools:
firecrawl_searchundfirecrawl_scrape - als Fallback-Extractor für
web_fetch
Es ist ein gehosteter Extraktions-/Suchdienst, der Bot-Umgehung und Caching unterstützt, was bei JS-lastigen Websites oder Seiten hilft, die einfache HTTP-Abrufe blockieren.
API-Schlüssel abrufen
- Erstellen Sie ein Firecrawl-Konto und generieren Sie einen API-Schlüssel.
- Speichern Sie ihn in der Konfiguration oder setzen Sie
FIRECRAWL_API_KEYin der Gateway-Umgebung.
Firecrawl-Suche konfigurieren
{
tools: {
web: {
search: {
provider: "firecrawl",
},
},
},
plugins: {
entries: {
firecrawl: {
enabled: true,
config: {
webSearch: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
},
},
},
},
},
}
Hinweise:
- Wenn Sie Firecrawl im Onboarding oder mit
openclaw configure --section webauswählen, wird das gebündelte Firecrawl-Plugin automatisch aktiviert. web_searchmit Firecrawl unterstütztqueryundcount.- Für Firecrawl-spezifische Steuerungen wie
sources,categoriesoder Ergebnis-Scraping verwenden Siefirecrawl_search. baseUrlist standardmäßig das gehostete Firecrawl unterhttps://api.firecrawl.dev. Selbst gehostete Overrides sind nur für private/interne Endpunkte erlaubt; HTTP wird nur für diese privaten Ziele akzeptiert.FIRECRAWL_BASE_URList der gemeinsame Env-Fallback für die Basis-URLs von Firecrawl-Suche und -Scrape.
Firecrawl-Scrape + web_fetch-Fallback konfigurieren
{
plugins: {
entries: {
firecrawl: {
enabled: true,
config: {
webFetch: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
onlyMainContent: true,
maxAgeMs: 172800000,
timeoutSeconds: 60,
},
},
},
},
},
}
Hinweise:
- Firecrawl-Fallback-Versuche werden nur ausgeführt, wenn ein API-Schlüssel verfügbar ist (
plugins.entries.firecrawl.config.webFetch.apiKeyoderFIRECRAWL_API_KEY). maxAgeMssteuert, wie alt gecachte Ergebnisse sein dürfen (ms). Der Standardwert beträgt 2 Tage.- Die Legacy-Konfiguration
tools.web.fetch.firecrawl.*wird vonopenclaw doctor --fixautomatisch migriert. - Overrides für Firecrawl-Scrape-/Basis-URLs folgen derselben Gehostet/Privat-Regel wie die Suche: Öffentlicher gehosteter Traffic verwendet
https://api.firecrawl.dev; selbst gehostete Overrides müssen zu privaten/internen Endpunkten auflösen. firecrawl_scrapelehnt offensichtliche private, Loopback-, Metadaten- und Nicht-HTTP(S)-Ziel-URLs ab, bevor sie an Firecrawl weitergeleitet werden, und entspricht damit dem Ziel-Sicherheitsvertrag vonweb_fetchfür explizite Firecrawl-Scrape-Aufrufe.
firecrawl_scrape verwendet dieselben Einstellungen und Env-Variablen aus plugins.entries.firecrawl.config.webFetch.* erneut.
Selbst gehostetes Firecrawl
Setzen Sie plugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl oder FIRECRAWL_BASE_URL,
wenn Sie Firecrawl selbst betreiben. OpenClaw akzeptiert http:// nur für Loopback-,
private Netzwerk-, .local-, .internal- oder .localhost-Ziele. Öffentliche benutzerdefinierte
Hosts werden abgelehnt, damit Firecrawl-API-Schlüssel nicht versehentlich an beliebige Endpunkte
gesendet werden.
Firecrawl-Plugin-Tools
firecrawl_search
Verwenden Sie dies, wenn Sie Firecrawl-spezifische Suchsteuerungen statt generischem web_search möchten.
Kernparameter:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Verwenden Sie dies für JS-lastige oder botgeschützte Seiten, bei denen einfaches web_fetch schwach ist.
Kernparameter:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Stealth / Bot-Umgehung
Firecrawl stellt einen Parameter für den Proxy-Modus zur Bot-Umgehung bereit (basic, stealth oder auto).
OpenClaw verwendet für Firecrawl-Anfragen immer proxy: "auto" plus storeInCache: true.
Wenn proxy ausgelassen wird, verwendet Firecrawl standardmäßig auto. auto wiederholt den Versuch mit Stealth-Proxys, wenn ein grundlegender Versuch fehlschlägt, was mehr Credits
als reines Basic-Scraping verbrauchen kann.
Wie web_fetch Firecrawl verwendet
web_fetch-Extraktionsreihenfolge:
- Readability (lokal)
- Firecrawl (wenn ausgewählt oder automatisch als aktiver Web-Fetch-Fallback erkannt)
- Grundlegende HTML-Bereinigung (letzter Fallback)
Der Auswahlregler ist tools.web.fetch.provider. Wenn Sie ihn auslassen, erkennt OpenClaw
automatisch den ersten bereiten Web-Fetch-Provider aus den verfügbaren Zugangsdaten.
Derzeit ist der gebündelte Provider Firecrawl.
Verwandte Themen
- Web-Search-Übersicht -- alle Provider und automatische Erkennung
- Web Fetch --
web_fetch-Tool mit Firecrawl-Fallback - Tavily -- Such- + Extraktionstools