Tools
Firecrawl
OpenClaw pode usar Firecrawl de três maneiras:
- como o provedor
web_search - como ferramentas explícitas de plugin:
firecrawl_searchefirecrawl_scrape - como extrator de fallback para
web_fetch
Ele é um serviço hospedado de extração/pesquisa que oferece suporte a contorno de bots e cache, o que ajuda com sites pesados em JS ou páginas que bloqueiam buscas HTTP simples.
Obtenha uma chave de API
- Crie uma conta Firecrawl e gere uma chave de API.
- Armazene-a na configuração ou defina
FIRECRAWL_API_KEYno ambiente do gateway.
Configure a pesquisa Firecrawl
{
tools: {
web: {
search: {
provider: "firecrawl",
},
},
},
plugins: {
entries: {
firecrawl: {
enabled: true,
config: {
webSearch: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
},
},
},
},
},
}
Observações:
- Escolher Firecrawl na integração inicial ou em
openclaw configure --section webhabilita automaticamente o Plugin Firecrawl incluído. web_searchcom Firecrawl oferece suporte aqueryecount.- Para controles específicos do Firecrawl, como
sources,categoriesou raspagem de resultados, usefirecrawl_search. baseUrlusa por padrão o Firecrawl hospedado emhttps://api.firecrawl.dev. Substituições auto-hospedadas são permitidas apenas para endpoints privados/internos; HTTP é aceito apenas para esses destinos privados.FIRECRAWL_BASE_URLé o fallback de env compartilhado para URLs base de pesquisa e raspagem do Firecrawl.
Configure a raspagem Firecrawl + fallback de web_fetch
{
plugins: {
entries: {
firecrawl: {
enabled: true,
config: {
webFetch: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
onlyMainContent: true,
maxAgeMs: 172800000,
timeoutSeconds: 60,
},
},
},
},
},
}
Observações:
- Tentativas de fallback do Firecrawl são executadas apenas quando uma chave de API está disponível (
plugins.entries.firecrawl.config.webFetch.apiKeyouFIRECRAWL_API_KEY). maxAgeMscontrola quão antigos os resultados em cache podem ser (ms). O padrão é 2 dias.- A configuração legada
tools.web.fetch.firecrawl.*é migrada automaticamente poropenclaw doctor --fix. - Substituições de URL base/raspagem do Firecrawl seguem a mesma regra hospedado/privado da pesquisa: tráfego público hospedado usa
https://api.firecrawl.dev; substituições auto-hospedadas devem resolver para endpoints privados/internos. firecrawl_scraperejeita URLs de destino obviamente privadas, de loopback, de metadados e não HTTP(S) antes de encaminhá-las ao Firecrawl, correspondendo ao contrato de segurança de destino deweb_fetchpara chamadas explícitas de raspagem do Firecrawl.
firecrawl_scrape reutiliza as mesmas configurações e variáveis de env de plugins.entries.firecrawl.config.webFetch.*.
Firecrawl auto-hospedado
Defina plugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl ou FIRECRAWL_BASE_URL
quando você executa o Firecrawl por conta própria. O OpenClaw aceita http:// apenas para destinos de loopback,
rede privada, .local, .internal ou .localhost. Hosts personalizados públicos
são rejeitados para que chaves de API do Firecrawl não sejam enviadas a endpoints arbitrários por
acidente.
Ferramentas do Plugin Firecrawl
firecrawl_search
Use isto quando quiser controles de pesquisa específicos do Firecrawl em vez do web_search genérico.
Parâmetros principais:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Use isto para páginas pesadas em JS ou protegidas contra bots nas quais o web_fetch simples é fraco.
Parâmetros principais:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Furtividade / contorno de bots
O Firecrawl expõe um parâmetro de modo de proxy para contorno de bots (basic, stealth ou auto).
O OpenClaw sempre usa proxy: "auto" mais storeInCache: true para solicitações Firecrawl.
Se proxy for omitido, o Firecrawl usa auto por padrão. auto tenta novamente com proxies furtivos se uma tentativa básica falhar, o que pode usar mais créditos
do que a raspagem somente básica.
Como web_fetch usa o Firecrawl
Ordem de extração de web_fetch:
- Readability (local)
- Firecrawl (se selecionado ou detectado automaticamente como o fallback ativo de web-fetch)
- Limpeza básica de HTML (último fallback)
O controle de seleção é tools.web.fetch.provider. Se você o omitir, o OpenClaw
detecta automaticamente o primeiro provedor de web-fetch pronto a partir das credenciais disponíveis.
Hoje, o provedor incluído é Firecrawl.
Relacionado
- Visão geral da Pesquisa Web -- todos os provedores e detecção automática
- Web Fetch -- ferramenta web_fetch com fallback do Firecrawl
- Tavily -- ferramentas de pesquisa + extração