Tools
PDF-tool
pdf analyseert een of meer PDF-documenten en retourneert tekst.
Kort gedrag:
- Native providermodus voor Anthropic- en Google-modelproviders.
- Extractie-terugvalmodus voor andere providers (eerst tekst extraheren, daarna pagina-afbeeldingen wanneer nodig).
- Ondersteunt enkelvoudige (
pdf) of meervoudige (pdfs) invoer, maximaal 10 PDF's per aanroep.
Beschikbaarheid
De tool wordt alleen geregistreerd wanneer OpenClaw een PDF-geschikte modelconfiguratie voor de agent kan vinden:
agents.defaults.pdfModel- terugval naar
agents.defaults.imageModel - terugval naar het opgeloste sessie-/standaardmodel van de agent
- als native-PDF-providers door authenticatie worden ondersteund, krijgen die de voorkeur boven algemene image-terugvalkandidaten
Als er geen bruikbaar model kan worden opgelost, wordt de pdf-tool niet beschikbaar gemaakt.
Beschikbaarheidsopmerkingen:
- De terugvalketen is authenticatiebewust. Een geconfigureerde
provider/modeltelt alleen mee als OpenClaw die provider daadwerkelijk voor de agent kan authenticeren. - Native PDF-providers zijn momenteel Anthropic en Google.
- Als de opgeloste sessie-/standaardprovider al een geconfigureerd vision/PDF- model heeft, hergebruikt de PDF-tool dat voordat wordt teruggevallen op andere door authenticatie ondersteunde providers.
Invoerreferentie
pdfstringEen PDF-pad of URL.
pdfsstring[]Meerdere PDF-paden of URL's, maximaal 10 in totaal.
promptstringAnalyseprompt.
pagesstringPaginafilter zoals 1-5 of 1,3,7-9.
modelstringOptionele model-override in provider/model-vorm.
maxBytesMbnumberGroottelimiet per PDF in MB. Standaard ingesteld op agents.defaults.pdfMaxBytesMb of 10.
Invoeropmerkingen:
pdfenpdfsworden samengevoegd en gededupliceerd voordat ze worden geladen.- Als er geen PDF-invoer wordt opgegeven, geeft de tool een fout.
pageswordt geparseerd als paginanummers op basis van 1, gededupliceerd, gesorteerd en begrensd op het geconfigureerde maximumaantal pagina's.maxBytesMbis standaardagents.defaults.pdfMaxBytesMbof10.
Ondersteunde PDF-referenties
- lokaal bestandspad (inclusief
~-uitbreiding) file://-URLhttp://- enhttps://-URL- door OpenClaw beheerde inkomende refs zoals
media://inbound/<id>
Referentieopmerkingen:
- Andere URI-schema's (bijvoorbeeld
ftp://) worden geweigerd metunsupported_pdf_reference. - In sandboxmodus worden externe
http(s)-URL's geweigerd. - Als workspace-only bestandsbeleid is ingeschakeld, worden lokale bestandspaden buiten toegestane roots geweigerd.
- Beheerde inkomende refs en opnieuw afgespeelde paden onder OpenClaw's opslag voor inkomende media zijn toegestaan met workspace-only bestandsbeleid.
Uitvoeringsmodi
Native providermodus
Native modus wordt gebruikt voor provider anthropic en google.
De tool stuurt ruwe PDF-bytes rechtstreeks naar provider-API's.
Limieten van native modus:
pageswordt niet ondersteund. Als dit is ingesteld, retourneert de tool een fout.- Meervoudige PDF-invoer wordt ondersteund; elke PDF wordt als native documentblok / inline PDF-onderdeel vóór de prompt verzonden.
Extractie-terugvalmodus
Terugvalmodus wordt gebruikt voor niet-native providers.
Proces:
- Extraheer tekst uit geselecteerde pagina's (tot
agents.defaults.pdfMaxPages, standaard20). - Als de lengte van de geëxtraheerde tekst minder dan
200tekens is, render dan geselecteerde pagina's naar PNG-afbeeldingen en voeg die toe. - Stuur geëxtraheerde inhoud plus prompt naar het geselecteerde model.
Terugvaldetails:
- Extractie van pagina-afbeeldingen gebruikt een pixelbudget van
4,000,000. - Als het doelmodel geen image-invoer ondersteunt en er geen extraheerbare tekst is, geeft de tool een fout.
- Als tekstextractie slaagt maar afbeeldingsextractie vision op een text-only model zou vereisen, laat OpenClaw de gerenderde afbeeldingen vallen en gaat het verder met de geëxtraheerde tekst.
- Extractie-terugval gebruikt de gebundelde
document-extract-plugin. De plugin beheertpdfjs-dist;@napi-rs/canvaswordt alleen gebruikt wanneer terugval naar afbeeldingsrendering beschikbaar is.
Configuratie
{
agents: {
defaults: {
pdfModel: {
primary: "anthropic/claude-opus-4-6",
fallbacks: ["openai/gpt-5.4-mini"],
},
pdfMaxBytesMb: 10,
pdfMaxPages: 20,
},
},
}
Zie Configuratiereferentie voor volledige velddetails.
Uitvoerdetails
De tool retourneert tekst in content[0].text en gestructureerde metadata in details.
Veelvoorkomende details-velden:
model: opgeloste modelreferentie (provider/model)native:truevoor native providermodus,falsevoor terugvalattempts: terugvalpogingen die mislukten vóór succes
Padvelden:
- enkelvoudige PDF-invoer:
details.pdf - meervoudige PDF-invoer:
details.pdfs[]metpdf-items - metadata voor herschrijven van sandboxpaden (indien van toepassing):
rewrittenFrom
Foutgedrag
- Ontbrekende PDF-invoer: gooit
pdf required: provide a path or URL to a PDF document - Te veel PDF's: retourneert gestructureerde fout in
details.error = "too_many_pdfs" - Niet-ondersteund referentieschema: retourneert
details.error = "unsupported_pdf_reference" - Native modus met
pages: gooit duidelijke foutpages is not supported with native PDF providers
Voorbeelden
Enkele PDF:
{
"pdf": "/tmp/report.pdf",
"prompt": "Summarize this report in 5 bullets"
}
Meerdere PDF's:
{
"pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"],
"prompt": "Compare risks and timeline changes across both documents"
}
Terugvalmodel met paginafilter:
{
"pdf": "https://example.com/report.pdf",
"pages": "1-3,7",
"model": "openai/gpt-5.4-mini",
"prompt": "Extract only customer-impacting incidents"
}
Gerelateerd
- Toolsoverzicht - alle beschikbare agenttools
- Configuratiereferentie - configuratie voor pdfMaxBytesMb en pdfMaxPages