Tools

Firecrawl

OpenClaw può usare Firecrawl in tre modi:

come provider web_search
come strumenti Plugin espliciti: firecrawl_search e firecrawl_scrape
come estrattore di fallback per web_fetch

È un servizio ospitato di estrazione/ricerca che supporta l'aggiramento dei bot e la cache, utile con siti ricchi di JS o pagine che bloccano i recuperi HTTP semplici.

Ottieni una chiave API

Crea un account Firecrawl e genera una chiave API.
Salvala nella configurazione oppure imposta FIRECRAWL_API_KEY nell'ambiente del gateway.

Configura la ricerca Firecrawl

{
  tools: {
    web: {
      search: {
        provider: "firecrawl",
      },
    },
  },
  plugins: {
    entries: {
      firecrawl: {
        enabled: true,
        config: {
          webSearch: {
            apiKey: "FIRECRAWL_API_KEY_HERE",
            baseUrl: "https://api.firecrawl.dev",
          },
        },
      },
    },
  },
}

Note:

Scegliere Firecrawl durante l'onboarding o con openclaw configure --section web abilita automaticamente il Plugin Firecrawl incluso.
web_search con Firecrawl supporta query e count.
Per controlli specifici di Firecrawl come sources, categories o scraping dei risultati, usa firecrawl_search.
baseUrl usa come predefinito Firecrawl ospitato su https://api.firecrawl.dev. Gli override self-hosted sono consentiti solo per endpoint privati/interni; HTTP è accettato solo per quei target privati.
FIRECRAWL_BASE_URL è il fallback env condiviso per gli URL di base di ricerca e scrape Firecrawl.

Configura scrape Firecrawl + fallback web_fetch

{
  plugins: {
    entries: {
      firecrawl: {
        enabled: true,
        config: {
          webFetch: {
            apiKey: "FIRECRAWL_API_KEY_HERE",
            baseUrl: "https://api.firecrawl.dev",
            onlyMainContent: true,
            maxAgeMs: 172800000,
            timeoutSeconds: 60,
          },
        },
      },
    },
  },
}

Note:

I tentativi di fallback Firecrawl vengono eseguiti solo quando è disponibile una chiave API (plugins.entries.firecrawl.config.webFetch.apiKey o FIRECRAWL_API_KEY).
maxAgeMs controlla quanto possono essere vecchi i risultati in cache (ms). Il valore predefinito è 2 giorni.
La configurazione legacy tools.web.fetch.firecrawl.* viene migrata automaticamente da openclaw doctor --fix.
Gli override dell'URL di scrape/base Firecrawl seguono la stessa regola hosted/privata della ricerca: il traffico pubblico ospitato usa https://api.firecrawl.dev; gli override self-hosted devono risolversi in endpoint privati/interni.
firecrawl_scrape rifiuta URL di target evidentemente privati, loopback, metadata e non HTTP(S) prima di inoltrarli a Firecrawl, rispettando il contratto di sicurezza dei target di web_fetch per le chiamate esplicite di scrape Firecrawl.

firecrawl_scrape riutilizza le stesse impostazioni plugins.entries.firecrawl.config.webFetch.* e le stesse variabili env.

Firecrawl self-hosted

Imposta plugins.entries.firecrawl.config.webSearch.baseUrl, plugins.entries.firecrawl.config.webFetch.baseUrl o FIRECRAWL_BASE_URL quando esegui Firecrawl autonomamente. OpenClaw accetta http:// solo per target loopback, su rete privata, .local, .internal o .localhost. Gli host pubblici personalizzati vengono rifiutati in modo che le chiavi API Firecrawl non vengano inviate per errore a endpoint arbitrari.

Strumenti Plugin Firecrawl

`firecrawl_search`

Usalo quando vuoi controlli di ricerca specifici di Firecrawl invece di web_search generico.

Parametri principali:

query
count
sources
categories
scrapeResults
timeoutSeconds

`firecrawl_scrape`

Usalo per pagine ricche di JS o protette da bot dove web_fetch semplice è debole.

Parametri principali:

url
extractMode
maxChars
onlyMainContent
maxAgeMs
proxy
storeInCache
timeoutSeconds

Stealth / aggiramento dei bot

Firecrawl espone un parametro proxy mode per l'aggiramento dei bot (basic, stealth o auto). OpenClaw usa sempre proxy: "auto" più storeInCache: true per le richieste Firecrawl. Se proxy viene omesso, Firecrawl usa auto per impostazione predefinita. auto ritenta con proxy stealth se un tentativo basic fallisce, il che può usare più crediti rispetto allo scraping solo basic.

Come `web_fetch` usa Firecrawl

Ordine di estrazione di web_fetch:

Readability (locale)
Firecrawl (se selezionato o rilevato automaticamente come fallback web-fetch attivo)
Pulizia HTML di base (ultimo fallback)

Il selettore è tools.web.fetch.provider. Se lo ometti, OpenClaw rileva automaticamente il primo provider web-fetch pronto tra le credenziali disponibili. Oggi il provider incluso è Firecrawl.

Correlati

Panoramica di Web Search -- tutti i provider e rilevamento automatico
Web Fetch -- strumento web_fetch con fallback Firecrawl
Tavily -- strumenti di ricerca + estrazione

# Ottieni una chiave API

# Configura la ricerca Firecrawl

# Configura scrape Firecrawl + fallback web_fetch

# Firecrawl self-hosted

# Strumenti Plugin Firecrawl

# firecrawl_search

# firecrawl_scrape

# Stealth / aggiramento dei bot

# Come web_fetch usa Firecrawl

# Correlati