Tools
Strumento PDF
pdf analizza uno o più documenti PDF e restituisce testo.
Comportamento rapido:
- Modalità provider nativa per provider di modelli Anthropic e Google.
- Modalità fallback di estrazione per altri provider (estrae prima il testo, poi le immagini delle pagine quando necessario).
- Supporta input singolo (
pdf) o multiplo (pdfs), massimo 10 PDF per chiamata.
Disponibilità
Lo strumento viene registrato solo quando OpenClaw riesce a risolvere una configurazione di modello compatibile con PDF per l'agente:
agents.defaults.pdfModel- fallback a
agents.defaults.imageModel - fallback al modello sessione/predefinito risolto dell'agente
- se i provider PDF nativi sono supportati da autenticazione, preferirli prima dei candidati fallback generici per immagini
Se non è possibile risolvere alcun modello utilizzabile, lo strumento pdf non viene esposto.
Note sulla disponibilità:
- La catena di fallback è consapevole dell'autenticazione. Un
provider/modelconfigurato conta solo se OpenClaw può effettivamente autenticare quel provider per l'agente. - I provider PDF nativi sono attualmente Anthropic e Google.
- Se il provider sessione/predefinito risolto ha già un modello vision/PDF configurato, lo strumento PDF lo riutilizza prima di ricorrere ad altri provider supportati da autenticazione.
Riferimento input
pdfstringUn percorso o URL PDF.
pdfsstring[]Più percorsi o URL PDF, fino a 10 in totale.
promptstringPrompt di analisi.
pagesstringFiltro pagine come 1-5 o 1,3,7-9.
modelstringOverride opzionale del modello nel formato provider/model.
maxBytesMbnumberLimite dimensione per PDF in MB. Valore predefinito: agents.defaults.pdfMaxBytesMb o 10.
Note sull'input:
pdfepdfsvengono uniti e deduplicati prima del caricamento.- Se non viene fornito alcun input PDF, lo strumento restituisce un errore.
pagesviene interpretato come numeri di pagina a base 1, deduplicato, ordinato e limitato al massimo di pagine configurato.maxBytesMbusa come valore predefinitoagents.defaults.pdfMaxBytesMbo10.
Riferimenti PDF supportati
- percorso file locale (inclusa l'espansione di
~) - URL
file:// - URL
http://ehttps:// - riferimenti inbound gestiti da OpenClaw come
media://inbound/<id>
Note sui riferimenti:
- Altri schemi URI (per esempio
ftp://) vengono rifiutati conunsupported_pdf_reference. - In modalità sandbox, gli URL remoti
http(s)vengono rifiutati. - Con la policy file solo workspace abilitata, i percorsi file locali fuori dalle radici consentite vengono rifiutati.
- I riferimenti inbound gestiti e i percorsi riprodotti nell'archivio media inbound di OpenClaw sono consentiti con la policy file solo workspace.
Modalità di esecuzione
Modalità provider nativa
La modalità nativa viene usata per i provider anthropic e google.
Lo strumento invia i byte PDF grezzi direttamente alle API del provider.
Limiti della modalità nativa:
pagesnon è supportato. Se impostato, lo strumento restituisce un errore.- L'input multi-PDF è supportato; ogni PDF viene inviato come blocco documento nativo / parte PDF inline prima del prompt.
Modalità fallback di estrazione
La modalità fallback viene usata per provider non nativi.
Flusso:
- Estrae il testo dalle pagine selezionate (fino a
agents.defaults.pdfMaxPages, valore predefinito20). - Se la lunghezza del testo estratto è inferiore a
200caratteri, renderizza le pagine selezionate come immagini PNG e le include. - Invia il contenuto estratto più il prompt al modello selezionato.
Dettagli del fallback:
- L'estrazione delle immagini delle pagine usa un budget pixel di
4,000,000. - Se il modello di destinazione non supporta input immagine e non c'è testo estraibile, lo strumento restituisce un errore.
- Se l'estrazione del testo riesce ma l'estrazione delle immagini richiederebbe vision su un modello solo testo, OpenClaw elimina le immagini renderizzate e prosegue con il testo estratto.
- Il fallback di estrazione usa il Plugin
document-extractincluso. Il Plugin possiedepdfjs-dist;@napi-rs/canvasviene usato solo quando è disponibile il fallback di rendering immagini.
Configurazione
{
agents: {
defaults: {
pdfModel: {
primary: "anthropic/claude-opus-4-6",
fallbacks: ["openai/gpt-5.4-mini"],
},
pdfMaxBytesMb: 10,
pdfMaxPages: 20,
},
},
}
Consulta Riferimento configurazione per i dettagli completi dei campi.
Dettagli output
Lo strumento restituisce testo in content[0].text e metadati strutturati in details.
Campi details comuni:
model: riferimento modello risolto (provider/model)native:trueper modalità provider nativa,falseper fallbackattempts: tentativi di fallback non riusciti prima del successo
Campi percorso:
- input PDF singolo:
details.pdf - input PDF multiplo:
details.pdfs[]con vocipdf - metadati di riscrittura percorso sandbox (quando applicabile):
rewrittenFrom
Comportamento degli errori
- Input PDF mancante: genera
pdf required: provide a path or URL to a PDF document - Troppi PDF: restituisce errore strutturato in
details.error = "too_many_pdfs" - Schema riferimento non supportato: restituisce
details.error = "unsupported_pdf_reference" - Modalità nativa con
pages: genera un errore chiaropages is not supported with native PDF providers
Esempi
PDF singolo:
{
"pdf": "/tmp/report.pdf",
"prompt": "Summarize this report in 5 bullets"
}
Più PDF:
{
"pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"],
"prompt": "Compare risks and timeline changes across both documents"
}
Modello fallback con filtro pagine:
{
"pdf": "https://example.com/report.pdf",
"pages": "1-3,7",
"model": "openai/gpt-5.4-mini",
"prompt": "Extract only customer-impacting incidents"
}
Correlati
- Panoramica strumenti - tutti gli strumenti disponibili dell'agente
- Riferimento configurazione - configurazione pdfMaxBytesMb e pdfMaxPages