Tools
Afbeeldingen genereren
De image_generate-tool laat de agent afbeeldingen maken en bewerken met je
geconfigureerde providers. Gegenereerde afbeeldingen worden automatisch geleverd als media-
bijlagen in het antwoord van de agent.
Snel aan de slag
Authenticatie configureren
Stel een API-sleutel in voor ten minste één provider (bijvoorbeeld OPENAI_API_KEY,
GEMINI_API_KEY, OPENROUTER_API_KEY) of meld je aan met OpenAI Codex OAuth.
Kies een standaardmodel (optioneel)
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openai/gpt-image-2",
timeoutMs: 180_000,
},
},
},
}
Codex OAuth gebruikt dezelfde modelreferentie openai/gpt-image-2. Wanneer een
openai-codex OAuth-profiel is geconfigureerd, routeert OpenClaw afbeeldings-
aanvragen via dat OAuth-profiel in plaats van eerst
OPENAI_API_KEY te proberen. Expliciete models.providers.openai-configuratie (API-sleutel,
aangepaste/Azure-basis-URL) schakelt terug naar de directe OpenAI Images API-
route.
Vraag het de agent
"Genereer een afbeelding van een vriendelijke robotmascotte."
De agent roept image_generate automatisch aan. Geen allow-listing voor tools
nodig - deze is standaard ingeschakeld wanneer er een provider beschikbaar is.
Veelgebruikte routes
| Doel | Modelreferentie | Authenticatie |
|---|---|---|
| OpenAI-afbeeldingsgeneratie met API-facturering | openai/gpt-image-2 |
OPENAI_API_KEY |
| OpenAI-afbeeldingsgeneratie met Codex-abonnementsauthenticatie | openai/gpt-image-2 |
OpenAI Codex OAuth |
| OpenAI-PNG/WebP met transparante achtergrond | openai/gpt-image-1.5 |
OPENAI_API_KEY of OpenAI Codex OAuth |
| DeepInfra-afbeeldingsgeneratie | deepinfra/black-forest-labs/FLUX-1-schnell |
DEEPINFRA_API_KEY |
| OpenRouter-afbeeldingsgeneratie | openrouter/google/gemini-3.1-flash-image-preview |
OPENROUTER_API_KEY |
| LiteLLM-afbeeldingsgeneratie | litellm/gpt-image-2 |
LITELLM_API_KEY |
| Google Gemini-afbeeldingsgeneratie | google/gemini-3.1-flash-image-preview |
GEMINI_API_KEY of GOOGLE_API_KEY |
Dezelfde image_generate-tool verwerkt tekst-naar-afbeelding en bewerking met
referentieafbeeldingen. Gebruik image voor één referentie of images voor meerdere referenties.
Door de provider ondersteunde uitvoerhints zoals quality, outputFormat en
background worden doorgestuurd wanneer ze beschikbaar zijn en gerapporteerd als genegeerd wanneer een
provider ze niet ondersteunt. Gebundelde ondersteuning voor transparante achtergronden is
OpenAI-specifiek; andere providers kunnen PNG-alpha nog steeds behouden als hun
backend die uitgeeft.
Ondersteunde providers
| Provider | Standaardmodel | Bewerkingsondersteuning | Authenticatie |
|---|---|---|---|
| ComfyUI | workflow |
Ja (1 afbeelding, door workflow geconfigureerd) | COMFY_API_KEY of COMFY_CLOUD_API_KEY voor cloud |
| DeepInfra | black-forest-labs/FLUX-1-schnell |
Ja (1 afbeelding) | DEEPINFRA_API_KEY |
| fal | fal-ai/flux/dev |
Ja | FAL_KEY |
gemini-3.1-flash-image-preview |
Ja | GEMINI_API_KEY of GOOGLE_API_KEY |
|
| LiteLLM | gpt-image-2 |
Ja (tot 5 invoerafbeeldingen) | LITELLM_API_KEY |
| MiniMax | image-01 |
Ja (onderwerpreferentie) | MINIMAX_API_KEY of MiniMax OAuth (minimax-portal) |
| OpenAI | gpt-image-2 |
Ja (tot 4 afbeeldingen) | OPENAI_API_KEY of OpenAI Codex OAuth |
| OpenRouter | google/gemini-3.1-flash-image-preview |
Ja (tot 5 invoerafbeeldingen) | OPENROUTER_API_KEY |
| Vydra | grok-imagine |
Nee | VYDRA_API_KEY |
| xAI | grok-imagine-image |
Ja (tot 5 afbeeldingen) | XAI_API_KEY |
Gebruik action: "list" om beschikbare providers en modellen tijdens runtime te inspecteren:
/tool image_generate action=list
Providermogelijkheden
| Mogelijkheid | ComfyUI | DeepInfra | fal | MiniMax | OpenAI | Vydra | xAI | |
|---|---|---|---|---|---|---|---|---|
| Genereren (max. aantal) | Door workflow gedefinieerd | 4 | 4 | 4 | 9 | 4 | 1 | 4 |
| Bewerken / referentie | 1 afbeelding (workflow) | 1 afbeelding | 1 afbeelding | Tot 5 afbeeldingen | 1 afbeelding (onderwerpreferentie) | Tot 5 afbeeldingen | - | Tot 5 afbeeldingen |
| Groottecontrole | - | ✓ | ✓ | ✓ | - | Tot 4K | - | - |
| Beeldverhouding | - | - | ✓ (alleen genereren) | ✓ | ✓ | - | - | ✓ |
| Resolutie (1K/2K/4K) | - | - | ✓ | ✓ | - | - | - | 1K, 2K |
Toolparameters
promptstringrequiredPrompt voor afbeeldingsgeneratie. Vereist voor action: "generate".
action"generate" | "list"Gebruik "list" om beschikbare providers en modellen tijdens runtime te inspecteren.
modelstringOverschrijving van provider/model (bijv. openai/gpt-image-2). Gebruik
openai/gpt-image-1.5 voor transparante OpenAI-achtergronden.
imagestringPad of URL van één referentieafbeelding voor bewerkingsmodus.
imagesstring[]Meerdere referentieafbeeldingen voor bewerkingsmodus (tot 5 bij ondersteunende providers).
sizestringGroottehint: 1024x1024, 1536x1024, 1024x1536, 2048x2048, 3840x2160.
aspectRatiostringBeeldverhouding: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9.
resolution"1K" | "2K" | "4K"quality"low" | "medium" | "high" | "auto"Kwaliteitshint wanneer de provider dit ondersteunt.
outputFormat"png" | "jpeg" | "webp"Uitvoerformaat-hint wanneer de provider dit ondersteunt.
background"transparent" | "opaque" | "auto"Achtergrondhint wanneer de provider dit ondersteunt. Gebruik transparent met
outputFormat: "png" of "webp" voor providers die transparantie ondersteunen.
countnumbertimeoutMsnumberfilenamestringopenaiobjectAlleen-OpenAI-hints: background, moderation, outputCompression en user.
Configuratie
Modelselectie
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openai/gpt-image-2",
timeoutMs: 180_000,
fallbacks: [
"openrouter/google/gemini-3.1-flash-image-preview",
"google/gemini-3.1-flash-image-preview",
"fal/fal-ai/flux/dev",
],
},
},
},
}
Selectievolgorde van providers
OpenClaw probeert providers in deze volgorde:
model-parameter uit de toolaanroep (als de agent er een opgeeft).imageGenerationModel.primaryuit de configuratie.imageGenerationModel.fallbacksop volgorde.- Automatische detectie - alleen auth-ondersteunde providerstandaarden:
- huidige standaardprovider eerst;
- overige geregistreerde providers voor afbeeldingsgeneratie in provider-id-volgorde.
Als een provider faalt (authenticatiefout, ratelimiet, enz.), wordt de volgende geconfigureerde kandidaat automatisch geprobeerd. Als ze allemaal falen, bevat de fout details van elke poging.
Modeloverschrijvingen per aanroep zijn exact
Een model-overschrijving per aanroep probeert alleen die provider/dat model en gaat
niet door naar geconfigureerde primary/fallback- of automatisch gedetecteerde providers.
Automatische detectie is auth-bewust
Een providerstandaard komt alleen in de kandidatenlijst wanneer OpenClaw die
provider daadwerkelijk kan authenticeren. Stel
agents.defaults.mediaGenerationAutoProviderFallback: false in om alleen
expliciete model-, primary- en fallbacks-vermeldingen te gebruiken.
Time-outs
Stel agents.defaults.imageGenerationModel.timeoutMs in voor trage afbeeldings-
backends. Een timeoutMs-toolparameter per aanroep overschrijft de geconfigureerde
standaard.
Inspecteren tijdens runtime
Gebruik action: "list" om de momenteel geregistreerde providers,
hun standaardmodellen en hints voor auth-env-vars te inspecteren.
Afbeeldingen bewerken
OpenAI, OpenRouter, Google, DeepInfra, fal, MiniMax, ComfyUI en xAI ondersteunen het bewerken van referentieafbeeldingen. Geef een pad of URL van een referentieafbeelding door:
"Genereer een aquarelversie van deze foto" + image: "/path/to/photo.jpg"
OpenAI, OpenRouter, Google en xAI ondersteunen tot 5 referentieafbeeldingen via de
images-parameter. fal, MiniMax en ComfyUI ondersteunen 1.
Providerverdiepingen
OpenAI gpt-image-2 (en gpt-image-1.5)
OpenAI-afbeeldingsgeneratie gebruikt standaard openai/gpt-image-2. Als er een
openai-codex OAuth-profiel is geconfigureerd, hergebruikt OpenClaw hetzelfde
OAuth-profiel dat door Codex-abonnement-chatmodellen wordt gebruikt en stuurt het
de afbeeldingsaanvraag via de Codex Responses-backend. Verouderde Codex-basis-URL's
zoals https://chatgpt.com/backend-api worden voor afbeeldingsaanvragen gecanonicaliseerd naar
https://chatgpt.com/backend-api/codex. OpenClaw
valt voor die aanvraag niet stilzwijgend terug op OPENAI_API_KEY -
om routering rechtstreeks via de OpenAI Images API af te dwingen, configureer je
models.providers.openai expliciet met een API-sleutel, aangepaste basis-URL
of Azure-eindpunt.
De modellen openai/gpt-image-1.5, openai/gpt-image-1 en
openai/gpt-image-1-mini kunnen nog steeds expliciet worden geselecteerd. Gebruik
gpt-image-1.5 voor PNG-/WebP-uitvoer met transparante achtergrond; de huidige
gpt-image-2-API weigert background: "transparent".
gpt-image-2 ondersteunt zowel tekst-naar-afbeelding-generatie als
bewerking met referentieafbeeldingen via dezelfde image_generate-tool.
OpenClaw stuurt prompt, count, size, quality, outputFormat
en referentieafbeeldingen door naar OpenAI. OpenAI ontvangt
aspectRatio of resolution niet rechtstreeks; waar mogelijk zet OpenClaw
die om naar een ondersteunde size, anders meldt de tool ze als
genegeerde overrides.
OpenAI-specifieke opties staan onder het openai-object:
{
"quality": "low",
"outputFormat": "jpeg",
"openai": {
"background": "opaque",
"moderation": "low",
"outputCompression": 60,
"user": "end-user-42"
}
}
openai.background accepteert transparent, opaque of auto;
transparante uitvoer vereist outputFormat png of webp en een
OpenAI-afbeeldingsmodel dat transparantie ondersteunt. OpenClaw routeert standaard
gpt-image-2-aanvragen met transparante achtergrond naar gpt-image-1.5.
openai.outputCompression is van toepassing op JPEG-/WebP-uitvoer.
De hint background op topniveau is providerneutraal en wordt momenteel
toegewezen aan hetzelfde OpenAI-aanvraagveld background wanneer de OpenAI-provider
is geselecteerd. Providers die geen achtergrondondersteuning declareren, retourneren
deze in ignoredOverrides in plaats van de niet-ondersteunde parameter te ontvangen.
Om OpenAI-afbeeldingsgeneratie via een Azure OpenAI-implementatie te routeren
in plaats van via api.openai.com, zie
Azure OpenAI-eindpunten.
OpenRouter-afbeeldingsmodellen
OpenRouter-afbeeldingsgeneratie gebruikt dezelfde OPENROUTER_API_KEY en
routeert via OpenRouters chat completions image API. Selecteer
OpenRouter-afbeeldingsmodellen met het voorvoegsel openrouter/:
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openrouter/google/gemini-3.1-flash-image-preview",
},
},
},
}
OpenClaw stuurt prompt, count, referentieafbeeldingen en
Gemini-compatibele hints voor aspectRatio / resolution door naar OpenRouter.
Huidige ingebouwde snelkoppelingen voor OpenRouter-afbeeldingsmodellen omvatten
google/gemini-3.1-flash-image-preview,
google/gemini-3-pro-image-preview en openai/gpt-5.4-image-2. Gebruik
action: "list" om te zien wat je geconfigureerde Plugin beschikbaar stelt.
MiniMax dubbele authenticatie
MiniMax-afbeeldingsgeneratie is beschikbaar via beide gebundelde MiniMax- authenticatiepaden:
minimax/image-01voor setups met API-sleutelminimax-portal/image-01voor OAuth-setups
xAI grok-imagine-image
De gebundelde xAI-provider gebruikt /v1/images/generations voor aanvragen met alleen een prompt
en /v1/images/edits wanneer image of images aanwezig is.
- Modellen:
xai/grok-imagine-image,xai/grok-imagine-image-pro - Aantal: tot 4
- Referenties: één
imageof maximaal vijfimages - Beeldverhoudingen:
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - Resoluties:
1K,2K - Uitvoer: geretourneerd als door OpenClaw beheerde afbeeldingsbijlagen
OpenClaw stelt xAI-native quality, mask,
user of extra uitsluitend native beeldverhoudingen bewust niet beschikbaar
totdat die besturingselementen bestaan in het gedeelde provideroverschrijdende
image_generate-contract.
Voorbeelden
Genereren (4K-landschap)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="A clean editorial poster for OpenClaw image generation" size=3840x2160 count=1
Genereren (transparante PNG)
/tool image_generate action=generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparent
Equivalente CLI:
openclaw infer image generate \
--model openai/gpt-image-1.5 \
--output-format png \
--background transparent \
--prompt "A simple red circle sticker on a transparent background" \
--json
Genereren (twee vierkante)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Two visual directions for a calm productivity app icon" size=1024x1024 count=2
Bewerken (één referentie)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Keep the subject, replace the background with a bright studio setup" image=/path/to/reference.png size=1024x1536
Bewerken (meerdere referenties)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Combine the character identity from the first image with the color palette from the second" images='["/path/to/character.png","/path/to/palette.jpg"]' size=1536x1024
Dezelfde vlaggen --output-format en --background zijn beschikbaar op
openclaw infer image edit; --openai-background blijft bestaan als
OpenAI-specifieke alias. Gebundelde providers anders dan OpenAI declareren vandaag
geen expliciete achtergrondbesturing, dus background: "transparent" wordt voor hen
als genegeerd gerapporteerd.
Gerelateerd
- Tools-overzicht - alle beschikbare agenttools
- ComfyUI - lokale ComfyUI- en Comfy Cloud-workflowsetup
- fal - setup van fal-afbeeldings- en videoprovider
- Google (Gemini) - setup van Gemini-afbeeldingsprovider
- MiniMax - setup van MiniMax-afbeeldingsprovider
- OpenAI - setup van OpenAI Images-provider
- Vydra - setup van Vydra voor afbeeldingen, video en spraak
- xAI - setup van Grok voor afbeeldingen, video, zoeken, code-uitvoering en TTS
- Configuratiereferentie -
imageGenerationModel-configuratie - Modellen - modelconfiguratie en failover