Tools
Công cụ PDF
pdf phân tích một hoặc nhiều tài liệu PDF và trả về văn bản.
Hành vi nhanh:
- Chế độ nhà cung cấp gốc cho nhà cung cấp mô hình Anthropic và Google.
- Chế độ dự phòng trích xuất cho các nhà cung cấp khác (trích xuất văn bản trước, rồi đến hình ảnh trang khi cần).
- Hỗ trợ đầu vào đơn (
pdf) hoặc nhiều (pdfs), tối đa 10 PDF mỗi lệnh gọi.
Tính khả dụng
Công cụ chỉ được đăng ký khi OpenClaw có thể phân giải cấu hình mô hình hỗ trợ PDF cho tác nhân:
agents.defaults.pdfModel- dự phòng về
agents.defaults.imageModel - dự phòng về mô hình phiên/mặc định đã phân giải của tác nhân
- nếu nhà cung cấp PDF gốc được hỗ trợ bằng xác thực, ưu tiên chúng trước các ứng viên dự phòng hình ảnh chung
Nếu không thể phân giải mô hình có thể dùng được, công cụ pdf sẽ không được hiển thị.
Ghi chú về tính khả dụng:
- Chuỗi dự phòng có nhận biết xác thực. Một
provider/modelđã cấu hình chỉ được tính nếu OpenClaw thực sự có thể xác thực nhà cung cấp đó cho tác nhân. - Nhà cung cấp PDF gốc hiện là Anthropic và Google.
- Nếu nhà cung cấp phiên/mặc định đã phân giải đã có mô hình vision/PDF được cấu hình, công cụ PDF sẽ dùng lại mô hình đó trước khi dự phòng sang các nhà cung cấp khác được hỗ trợ bằng xác thực.
Tham chiếu đầu vào
pdfstringMột đường dẫn hoặc URL PDF.
pdfsstring[]Nhiều đường dẫn hoặc URL PDF, tổng cộng tối đa 10.
promptstringLời nhắc phân tích.
pagesstringBộ lọc trang như 1-5 hoặc 1,3,7-9.
modelstringGhi đè mô hình tùy chọn ở dạng provider/model.
maxBytesMbnumberGiới hạn kích thước mỗi PDF theo MB. Mặc định là agents.defaults.pdfMaxBytesMb hoặc 10.
Ghi chú đầu vào:
pdfvàpdfsđược hợp nhất và loại bỏ trùng lặp trước khi tải.- Nếu không cung cấp đầu vào PDF, công cụ báo lỗi.
pagesđược phân tích dưới dạng số trang bắt đầu từ 1, loại bỏ trùng lặp, sắp xếp và giới hạn theo số trang tối đa đã cấu hình.maxBytesMbmặc định làagents.defaults.pdfMaxBytesMbhoặc10.
Tham chiếu PDF được hỗ trợ
- đường dẫn tệp cục bộ (bao gồm mở rộng
~) - URL
file:// - URL
http://vàhttps:// - tham chiếu đầu vào do OpenClaw quản lý như
media://inbound/<id>
Ghi chú tham chiếu:
- Các lược đồ URI khác (ví dụ
ftp://) bị từ chối vớiunsupported_pdf_reference. - Trong chế độ sandbox, URL
http(s)từ xa bị từ chối. - Khi chính sách tệp chỉ trong workspace được bật, các đường dẫn tệp cục bộ nằm ngoài gốc được phép sẽ bị từ chối.
- Tham chiếu đầu vào được quản lý và đường dẫn phát lại dưới kho phương tiện đầu vào của OpenClaw được phép với chính sách tệp chỉ trong workspace.
Chế độ thực thi
Chế độ nhà cung cấp gốc
Chế độ gốc được dùng cho nhà cung cấp anthropic và google.
Công cụ gửi byte PDF thô trực tiếp tới API nhà cung cấp.
Giới hạn chế độ gốc:
pageskhông được hỗ trợ. Nếu được đặt, công cụ trả về lỗi.- Đầu vào nhiều PDF được hỗ trợ; mỗi PDF được gửi dưới dạng khối tài liệu gốc / phần PDF nội tuyến trước lời nhắc.
Chế độ dự phòng trích xuất
Chế độ dự phòng được dùng cho các nhà cung cấp không gốc.
Luồng:
- Trích xuất văn bản từ các trang đã chọn (tối đa
agents.defaults.pdfMaxPages, mặc định20). - Nếu độ dài văn bản đã trích xuất dưới
200ký tự, kết xuất các trang đã chọn thành hình ảnh PNG và đưa chúng vào. - Gửi nội dung đã trích xuất cùng lời nhắc tới mô hình đã chọn.
Chi tiết dự phòng:
- Trích xuất hình ảnh trang dùng ngân sách pixel là
4,000,000. - Nếu mô hình đích không hỗ trợ đầu vào hình ảnh và không có văn bản nào trích xuất được, công cụ báo lỗi.
- Nếu trích xuất văn bản thành công nhưng trích xuất hình ảnh sẽ yêu cầu vision trên một mô hình chỉ văn bản, OpenClaw bỏ các hình ảnh đã kết xuất và tiếp tục với văn bản đã trích xuất.
- Dự phòng trích xuất dùng Plugin
document-extractđược đóng gói. Plugin sở hữupdfjs-dist;@napi-rs/canvaschỉ được dùng khi dự phòng kết xuất hình ảnh khả dụng.
Cấu hình
{
agents: {
defaults: {
pdfModel: {
primary: "anthropic/claude-opus-4-6",
fallbacks: ["openai/gpt-5.4-mini"],
},
pdfMaxBytesMb: 10,
pdfMaxPages: 20,
},
},
}
Xem Tham chiếu cấu hình để biết chi tiết đầy đủ về trường.
Chi tiết đầu ra
Công cụ trả về văn bản trong content[0].text và siêu dữ liệu có cấu trúc trong details.
Các trường details thường gặp:
model: tham chiếu mô hình đã phân giải (provider/model)native:truecho chế độ nhà cung cấp gốc,falsecho dự phòngattempts: các lần thử dự phòng đã thất bại trước khi thành công
Trường đường dẫn:
- đầu vào PDF đơn:
details.pdf - đầu vào nhiều PDF:
details.pdfs[]với các mụcpdf - siêu dữ liệu viết lại đường dẫn sandbox (khi áp dụng):
rewrittenFrom
Hành vi lỗi
- Thiếu đầu vào PDF: ném
pdf required: provide a path or URL to a PDF document - Quá nhiều PDF: trả về lỗi có cấu trúc trong
details.error = "too_many_pdfs" - Lược đồ tham chiếu không được hỗ trợ: trả về
details.error = "unsupported_pdf_reference" - Chế độ gốc với
pages: ném lỗi rõ ràngpages is not supported with native PDF providers
Ví dụ
PDF đơn:
{
"pdf": "/tmp/report.pdf",
"prompt": "Summarize this report in 5 bullets"
}
Nhiều PDF:
{
"pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"],
"prompt": "Compare risks and timeline changes across both documents"
}
Mô hình dự phòng có lọc trang:
{
"pdf": "https://example.com/report.pdf",
"pages": "1-3,7",
"model": "openai/gpt-5.4-mini",
"prompt": "Extract only customer-impacting incidents"
}
Liên quan
- Tổng quan công cụ - tất cả công cụ tác nhân khả dụng
- Tham chiếu cấu hình - cấu hình pdfMaxBytesMb và pdfMaxPages