Tools
Alat PDF
pdf menganalisis satu atau beberapa dokumen PDF dan mengembalikan teks.
Perilaku cepat:
- Mode penyedia native untuk penyedia model Anthropic dan Google.
- Mode fallback ekstraksi untuk penyedia lain (ekstrak teks terlebih dahulu, lalu gambar halaman bila diperlukan).
- Mendukung input tunggal (
pdf) atau beberapa input (pdfs), maksimal 10 PDF per panggilan.
Ketersediaan
Alat ini hanya didaftarkan ketika OpenClaw dapat menyelesaikan konfigurasi model yang mendukung PDF untuk agen:
agents.defaults.pdfModel- fallback ke
agents.defaults.imageModel - fallback ke model sesi/default agen yang diselesaikan
- jika penyedia PDF native didukung autentikasi, prioritaskan penyedia tersebut sebelum kandidat fallback gambar generik
Jika tidak ada model yang dapat digunakan yang bisa diselesaikan, alat pdf tidak diekspos.
Catatan ketersediaan:
- Rantai fallback peka autentikasi.
provider/modelyang dikonfigurasi hanya dihitung jika OpenClaw benar-benar dapat mengautentikasi penyedia tersebut untuk agen. - Penyedia PDF native saat ini adalah Anthropic dan Google.
- Jika penyedia sesi/default yang diselesaikan sudah memiliki model vision/PDF yang dikonfigurasi, alat PDF akan menggunakannya kembali sebelum fallback ke penyedia lain yang didukung autentikasi.
Referensi input
pdfstringSatu path atau URL PDF.
pdfsstring[]Beberapa path atau URL PDF, hingga total 10.
promptstringPrompt analisis.
pagesstringFilter halaman seperti 1-5 atau 1,3,7-9.
modelstringOverride model opsional dalam bentuk provider/model.
maxBytesMbnumberBatas ukuran per PDF dalam MB. Default ke agents.defaults.pdfMaxBytesMb atau 10.
Catatan input:
pdfdanpdfsdigabungkan dan dideduplikasi sebelum dimuat.- Jika tidak ada input PDF yang diberikan, alat akan menghasilkan error.
pagesdiparse sebagai nomor halaman berbasis 1, dideduplikasi, diurutkan, dan dibatasi ke jumlah halaman maksimal yang dikonfigurasi.maxBytesMbdefault keagents.defaults.pdfMaxBytesMbatau10.
Referensi PDF yang didukung
- path file lokal (termasuk ekspansi
~) - URL
file:// - URL
http://danhttps:// - referensi inbound yang dikelola OpenClaw seperti
media://inbound/<id>
Catatan referensi:
- Skema URI lain (misalnya
ftp://) ditolak denganunsupported_pdf_reference. - Dalam mode sandbox, URL
http(s)jarak jauh ditolak. - Dengan kebijakan file hanya-workspace diaktifkan, path file lokal di luar root yang diizinkan ditolak.
- Referensi inbound terkelola dan path yang diputar ulang di bawah penyimpanan media inbound OpenClaw diizinkan dengan kebijakan file hanya-workspace.
Mode eksekusi
Mode penyedia native
Mode native digunakan untuk penyedia anthropic dan google.
Alat mengirim byte PDF mentah langsung ke API penyedia.
Batasan mode native:
pagestidak didukung. Jika diatur, alat mengembalikan error.- Input multi-PDF didukung; setiap PDF dikirim sebagai blok dokumen native / bagian PDF inline sebelum prompt.
Mode fallback ekstraksi
Mode fallback digunakan untuk penyedia non-native.
Alur:
- Ekstrak teks dari halaman yang dipilih (hingga
agents.defaults.pdfMaxPages, default20). - Jika panjang teks yang diekstrak di bawah
200karakter, render halaman yang dipilih menjadi gambar PNG dan sertakan gambar tersebut. - Kirim konten yang diekstrak beserta prompt ke model yang dipilih.
Detail fallback:
- Ekstraksi gambar halaman menggunakan anggaran piksel
4,000,000. - Jika model target tidak mendukung input gambar dan tidak ada teks yang dapat diekstrak, alat menghasilkan error.
- Jika ekstraksi teks berhasil tetapi ekstraksi gambar memerlukan vision pada model hanya-teks, OpenClaw membuang gambar yang dirender dan melanjutkan dengan teks yang diekstrak.
- Fallback ekstraksi menggunakan Plugin
document-extractbawaan. Plugin memilikipdfjs-dist;@napi-rs/canvashanya digunakan ketika fallback rendering gambar tersedia.
Konfigurasi
{
agents: {
defaults: {
pdfModel: {
primary: "anthropic/claude-opus-4-6",
fallbacks: ["openai/gpt-5.4-mini"],
},
pdfMaxBytesMb: 10,
pdfMaxPages: 20,
},
},
}
Lihat Referensi Konfigurasi untuk detail lengkap kolom.
Detail output
Alat mengembalikan teks di content[0].text dan metadata terstruktur di details.
Kolom details umum:
model: referensi model yang diselesaikan (provider/model)native:trueuntuk mode penyedia native,falseuntuk fallbackattempts: percobaan fallback yang gagal sebelum berhasil
Kolom path:
- input PDF tunggal:
details.pdf - beberapa input PDF:
details.pdfs[]dengan entripdf - metadata penulisan ulang path sandbox (bila berlaku):
rewrittenFrom
Perilaku error
- Input PDF hilang: melempar
pdf required: provide a path or URL to a PDF document - Terlalu banyak PDF: mengembalikan error terstruktur di
details.error = "too_many_pdfs" - Skema referensi tidak didukung: mengembalikan
details.error = "unsupported_pdf_reference" - Mode native dengan
pages: melempar error jelaspages is not supported with native PDF providers
Contoh
PDF tunggal:
{
"pdf": "/tmp/report.pdf",
"prompt": "Summarize this report in 5 bullets"
}
Beberapa PDF:
{
"pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"],
"prompt": "Compare risks and timeline changes across both documents"
}
Model fallback dengan filter halaman:
{
"pdf": "https://example.com/report.pdf",
"pages": "1-3,7",
"model": "openai/gpt-5.4-mini",
"prompt": "Extract only customer-impacting incidents"
}
Terkait
- Ringkasan Alat - semua alat agen yang tersedia
- Referensi Konfigurasi - konfigurasi pdfMaxBytesMb dan pdfMaxPages