Tools

Afbeeldingen genereren

De image_generate-tool laat de agent afbeeldingen maken en bewerken met je geconfigureerde providers. Gegenereerde afbeeldingen worden automatisch geleverd als media- bijlagen in het antwoord van de agent.

Snel aan de slag

Authenticatie configureren

Stel een API-sleutel in voor ten minste één provider (bijvoorbeeld OPENAI_API_KEY, GEMINI_API_KEY, OPENROUTER_API_KEY) of meld je aan met OpenAI Codex OAuth.

Kies een standaardmodel (optioneel)

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-2",
        timeoutMs: 180_000,
      },
    },
  },
}

Codex OAuth gebruikt dezelfde modelreferentie openai/gpt-image-2. Wanneer een openai-codex OAuth-profiel is geconfigureerd, routeert OpenClaw afbeeldings- aanvragen via dat OAuth-profiel in plaats van eerst OPENAI_API_KEY te proberen. Expliciete models.providers.openai-configuratie (API-sleutel, aangepaste/Azure-basis-URL) schakelt terug naar de directe OpenAI Images API- route.

Vraag het de agent

"Genereer een afbeelding van een vriendelijke robotmascotte."

De agent roept image_generate automatisch aan. Geen allow-listing voor tools nodig - deze is standaard ingeschakeld wanneer er een provider beschikbaar is.

Veelgebruikte routes

Doel	Modelreferentie	Authenticatie
OpenAI-afbeeldingsgeneratie met API-facturering	`openai/gpt-image-2`	`OPENAI_API_KEY`
OpenAI-afbeeldingsgeneratie met Codex-abonnementsauthenticatie	`openai/gpt-image-2`	OpenAI Codex OAuth
OpenAI-PNG/WebP met transparante achtergrond	`openai/gpt-image-1.5`	`OPENAI_API_KEY` of OpenAI Codex OAuth
DeepInfra-afbeeldingsgeneratie	`deepinfra/black-forest-labs/FLUX-1-schnell`	`DEEPINFRA_API_KEY`
OpenRouter-afbeeldingsgeneratie	`openrouter/google/gemini-3.1-flash-image-preview`	`OPENROUTER_API_KEY`
LiteLLM-afbeeldingsgeneratie	`litellm/gpt-image-2`	`LITELLM_API_KEY`
Google Gemini-afbeeldingsgeneratie	`google/gemini-3.1-flash-image-preview`	`GEMINI_API_KEY` of `GOOGLE_API_KEY`

Dezelfde image_generate-tool verwerkt tekst-naar-afbeelding en bewerking met referentieafbeeldingen. Gebruik image voor één referentie of images voor meerdere referenties. Door de provider ondersteunde uitvoerhints zoals quality, outputFormat en background worden doorgestuurd wanneer ze beschikbaar zijn en gerapporteerd als genegeerd wanneer een provider ze niet ondersteunt. Gebundelde ondersteuning voor transparante achtergronden is OpenAI-specifiek; andere providers kunnen PNG-alpha nog steeds behouden als hun backend die uitgeeft.

Ondersteunde providers

Provider	Standaardmodel	Bewerkingsondersteuning	Authenticatie
ComfyUI	`workflow`	Ja (1 afbeelding, door workflow geconfigureerd)	`COMFY_API_KEY` of `COMFY_CLOUD_API_KEY` voor cloud
DeepInfra	`black-forest-labs/FLUX-1-schnell`	Ja (1 afbeelding)	`DEEPINFRA_API_KEY`
fal	`fal-ai/flux/dev`	Ja	`FAL_KEY`
Google	`gemini-3.1-flash-image-preview`	Ja	`GEMINI_API_KEY` of `GOOGLE_API_KEY`
LiteLLM	`gpt-image-2`	Ja (tot 5 invoerafbeeldingen)	`LITELLM_API_KEY`
MiniMax	`image-01`	Ja (onderwerpreferentie)	`MINIMAX_API_KEY` of MiniMax OAuth (`minimax-portal`)
OpenAI	`gpt-image-2`	Ja (tot 4 afbeeldingen)	`OPENAI_API_KEY` of OpenAI Codex OAuth
OpenRouter	`google/gemini-3.1-flash-image-preview`	Ja (tot 5 invoerafbeeldingen)	`OPENROUTER_API_KEY`
Vydra	`grok-imagine`	Nee	`VYDRA_API_KEY`
xAI	`grok-imagine-image`	Ja (tot 5 afbeeldingen)	`XAI_API_KEY`

Gebruik action: "list" om beschikbare providers en modellen tijdens runtime te inspecteren:

/tool image_generate action=list

Providermogelijkheden

Mogelijkheid	ComfyUI	DeepInfra	fal	Google	MiniMax	OpenAI	Vydra	xAI
Genereren (max. aantal)	Door workflow gedefinieerd	4	4	4	9	4	1	4
Bewerken / referentie	1 afbeelding (workflow)	1 afbeelding	1 afbeelding	Tot 5 afbeeldingen	1 afbeelding (onderwerpreferentie)	Tot 5 afbeeldingen	-	Tot 5 afbeeldingen
Groottecontrole	-	✓	✓	✓	-	Tot 4K	-	-
Beeldverhouding	-	-	✓ (alleen genereren)	✓	✓	-	-	✓
Resolutie (1K/2K/4K)	-	-	✓	✓	-	-	-	1K, 2K

Toolparameters

promptstringrequired

Prompt voor afbeeldingsgeneratie. Vereist voor action: "generate".

action"generate" | "list"

Gebruik "list" om beschikbare providers en modellen tijdens runtime te inspecteren.

modelstring

Overschrijving van provider/model (bijv. openai/gpt-image-2). Gebruik openai/gpt-image-1.5 voor transparante OpenAI-achtergronden.

imagestring

Pad of URL van één referentieafbeelding voor bewerkingsmodus.

imagesstring[]

Meerdere referentieafbeeldingen voor bewerkingsmodus (tot 5 bij ondersteunende providers).

sizestring

Groottehint: 1024x1024, 1536x1024, 1024x1536, 2048x2048, 3840x2160.

aspectRatiostring

Beeldverhouding: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9.

resolution"1K" | "2K" | "4K"

quality"low" | "medium" | "high" | "auto"

Kwaliteitshint wanneer de provider dit ondersteunt.

outputFormat"png" | "jpeg" | "webp"

Uitvoerformaat-hint wanneer de provider dit ondersteunt.

background"transparent" | "opaque" | "auto"

Achtergrondhint wanneer de provider dit ondersteunt. Gebruik transparent met outputFormat: "png" of "webp" voor providers die transparantie ondersteunen.

countnumber

timeoutMsnumber

filenamestring

openaiobject

Alleen-OpenAI-hints: background, moderation, outputCompression en user.

Configuratie

Modelselectie

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-2",
        timeoutMs: 180_000,
        fallbacks: [
          "openrouter/google/gemini-3.1-flash-image-preview",
          "google/gemini-3.1-flash-image-preview",
          "fal/fal-ai/flux/dev",
        ],
      },
    },
  },
}

Selectievolgorde van providers

OpenClaw probeert providers in deze volgorde:

model-parameter uit de toolaanroep (als de agent er een opgeeft).
imageGenerationModel.primary uit de configuratie.
imageGenerationModel.fallbacks op volgorde.
Automatische detectie - alleen auth-ondersteunde providerstandaarden:
- huidige standaardprovider eerst;
- overige geregistreerde providers voor afbeeldingsgeneratie in provider-id-volgorde.

Als een provider faalt (authenticatiefout, ratelimiet, enz.), wordt de volgende geconfigureerde kandidaat automatisch geprobeerd. Als ze allemaal falen, bevat de fout details van elke poging.

Modeloverschrijvingen per aanroep zijn exact

Een model-overschrijving per aanroep probeert alleen die provider/dat model en gaat niet door naar geconfigureerde primary/fallback- of automatisch gedetecteerde providers.

Automatische detectie is auth-bewust

Een providerstandaard komt alleen in de kandidatenlijst wanneer OpenClaw die provider daadwerkelijk kan authenticeren. Stel agents.defaults.mediaGenerationAutoProviderFallback: false in om alleen expliciete model-, primary- en fallbacks-vermeldingen te gebruiken.

Time-outs

Stel agents.defaults.imageGenerationModel.timeoutMs in voor trage afbeeldings- backends. Een timeoutMs-toolparameter per aanroep overschrijft de geconfigureerde standaard.

Inspecteren tijdens runtime

Gebruik action: "list" om de momenteel geregistreerde providers, hun standaardmodellen en hints voor auth-env-vars te inspecteren.

Afbeeldingen bewerken

OpenAI, OpenRouter, Google, DeepInfra, fal, MiniMax, ComfyUI en xAI ondersteunen het bewerken van referentieafbeeldingen. Geef een pad of URL van een referentieafbeelding door:

"Genereer een aquarelversie van deze foto" + image: "/path/to/photo.jpg"

OpenAI, OpenRouter, Google en xAI ondersteunen tot 5 referentieafbeeldingen via de images-parameter. fal, MiniMax en ComfyUI ondersteunen 1.

Providerverdiepingen

OpenAI gpt-image-2 (en gpt-image-1.5)

OpenAI-afbeeldingsgeneratie gebruikt standaard openai/gpt-image-2. Als er een openai-codex OAuth-profiel is geconfigureerd, hergebruikt OpenClaw hetzelfde OAuth-profiel dat door Codex-abonnement-chatmodellen wordt gebruikt en stuurt het de afbeeldingsaanvraag via de Codex Responses-backend. Verouderde Codex-basis-URL's zoals https://chatgpt.com/backend-api worden voor afbeeldingsaanvragen gecanonicaliseerd naar https://chatgpt.com/backend-api/codex. OpenClaw valt voor die aanvraag niet stilzwijgend terug op OPENAI_API_KEY - om routering rechtstreeks via de OpenAI Images API af te dwingen, configureer je models.providers.openai expliciet met een API-sleutel, aangepaste basis-URL of Azure-eindpunt.

De modellen openai/gpt-image-1.5, openai/gpt-image-1 en openai/gpt-image-1-mini kunnen nog steeds expliciet worden geselecteerd. Gebruik gpt-image-1.5 voor PNG-/WebP-uitvoer met transparante achtergrond; de huidige gpt-image-2-API weigert background: "transparent".

gpt-image-2 ondersteunt zowel tekst-naar-afbeelding-generatie als bewerking met referentieafbeeldingen via dezelfde image_generate-tool. OpenClaw stuurt prompt, count, size, quality, outputFormat en referentieafbeeldingen door naar OpenAI. OpenAI ontvangt aspectRatio of resolution niet rechtstreeks; waar mogelijk zet OpenClaw die om naar een ondersteunde size, anders meldt de tool ze als genegeerde overrides.

OpenAI-specifieke opties staan onder het openai-object:

{
  "quality": "low",
  "outputFormat": "jpeg",
  "openai": {
    "background": "opaque",
    "moderation": "low",
    "outputCompression": 60,
    "user": "end-user-42"
  }
}

openai.background accepteert transparent, opaque of auto; transparante uitvoer vereist outputFormat png of webp en een OpenAI-afbeeldingsmodel dat transparantie ondersteunt. OpenClaw routeert standaard gpt-image-2-aanvragen met transparante achtergrond naar gpt-image-1.5. openai.outputCompression is van toepassing op JPEG-/WebP-uitvoer.

De hint background op topniveau is providerneutraal en wordt momenteel toegewezen aan hetzelfde OpenAI-aanvraagveld background wanneer de OpenAI-provider is geselecteerd. Providers die geen achtergrondondersteuning declareren, retourneren deze in ignoredOverrides in plaats van de niet-ondersteunde parameter te ontvangen.

Om OpenAI-afbeeldingsgeneratie via een Azure OpenAI-implementatie te routeren in plaats van via api.openai.com, zie Azure OpenAI-eindpunten.

OpenRouter-afbeeldingsmodellen

OpenRouter-afbeeldingsgeneratie gebruikt dezelfde OPENROUTER_API_KEY en routeert via OpenRouters chat completions image API. Selecteer OpenRouter-afbeeldingsmodellen met het voorvoegsel openrouter/:

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openrouter/google/gemini-3.1-flash-image-preview",
      },
    },
  },
}

OpenClaw stuurt prompt, count, referentieafbeeldingen en Gemini-compatibele hints voor aspectRatio / resolution door naar OpenRouter. Huidige ingebouwde snelkoppelingen voor OpenRouter-afbeeldingsmodellen omvatten google/gemini-3.1-flash-image-preview, google/gemini-3-pro-image-preview en openai/gpt-5.4-image-2. Gebruik action: "list" om te zien wat je geconfigureerde Plugin beschikbaar stelt.

MiniMax dubbele authenticatie

MiniMax-afbeeldingsgeneratie is beschikbaar via beide gebundelde MiniMax- authenticatiepaden:

minimax/image-01 voor setups met API-sleutel
minimax-portal/image-01 voor OAuth-setups

xAI grok-imagine-image

De gebundelde xAI-provider gebruikt /v1/images/generations voor aanvragen met alleen een prompt en /v1/images/edits wanneer image of images aanwezig is.

Modellen: xai/grok-imagine-image, xai/grok-imagine-image-pro
Aantal: tot 4
Referenties: één image of maximaal vijf images
Beeldverhoudingen: 1:1, 16:9, 9:16, 4:3, 3:4, 2:3, 3:2
Resoluties: 1K, 2K
Uitvoer: geretourneerd als door OpenClaw beheerde afbeeldingsbijlagen

OpenClaw stelt xAI-native quality, mask, user of extra uitsluitend native beeldverhoudingen bewust niet beschikbaar totdat die besturingselementen bestaan in het gedeelde provideroverschrijdende image_generate-contract.

Voorbeelden

Genereren (4K-landschap)

/tool image_generate action=generate model=openai/gpt-image-2 prompt="A clean editorial poster for OpenClaw image generation" size=3840x2160 count=1

Genereren (transparante PNG)

/tool image_generate action=generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparent

Equivalente CLI:

openclaw infer image generate \
--model openai/gpt-image-1.5 \
--output-format png \
--background transparent \
--prompt "A simple red circle sticker on a transparent background" \
--json

Genereren (twee vierkante)

/tool image_generate action=generate model=openai/gpt-image-2 prompt="Two visual directions for a calm productivity app icon" size=1024x1024 count=2

Bewerken (één referentie)

/tool image_generate action=generate model=openai/gpt-image-2 prompt="Keep the subject, replace the background with a bright studio setup" image=/path/to/reference.png size=1024x1536

Bewerken (meerdere referenties)

/tool image_generate action=generate model=openai/gpt-image-2 prompt="Combine the character identity from the first image with the color palette from the second" images='["/path/to/character.png","/path/to/palette.jpg"]' size=1536x1024

Dezelfde vlaggen --output-format en --background zijn beschikbaar op openclaw infer image edit; --openai-background blijft bestaan als OpenAI-specifieke alias. Gebundelde providers anders dan OpenAI declareren vandaag geen expliciete achtergrondbesturing, dus background: "transparent" wordt voor hen als genegeerd gerapporteerd.

Gerelateerd

Tools-overzicht - alle beschikbare agenttools
ComfyUI - lokale ComfyUI- en Comfy Cloud-workflowsetup
fal - setup van fal-afbeeldings- en videoprovider
Google (Gemini) - setup van Gemini-afbeeldingsprovider
MiniMax - setup van MiniMax-afbeeldingsprovider
OpenAI - setup van OpenAI Images-provider
Vydra - setup van Vydra voor afbeeldingen, video en spraak
xAI - setup van Grok voor afbeeldingen, video, zoeken, code-uitvoering en TTS
Configuratiereferentie - imageGenerationModel-configuratie
Modellen - modelconfiguratie en failover

# Snel aan de slag

Authenticatie configureren

Kies een standaardmodel (optioneel)

Vraag het de agent

# Veelgebruikte routes

# Ondersteunde providers

# Providermogelijkheden

# Toolparameters

# Configuratie

# Modelselectie

# Selectievolgorde van providers

# Afbeeldingen bewerken

# Providerverdiepingen

# Voorbeelden