Tools
Görsel oluşturma
image_generate aracı, ajanının yapılandırılmış sağlayıcılarınızı kullanarak görseller oluşturmasına ve düzenlemesine olanak tanır. Oluşturulan görseller, ajanın yanıtında medya ekleri olarak otomatik teslim edilir.
Hızlı başlangıç
Kimlik doğrulamayı yapılandır
En az bir sağlayıcı için API anahtarı ayarlayın (örneğin OPENAI_API_KEY,
GEMINI_API_KEY, OPENROUTER_API_KEY) veya OpenAI Codex OAuth ile oturum açın.
Varsayılan model seç (isteğe bağlı)
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openai/gpt-image-2",
timeoutMs: 180_000,
},
},
},
}
Codex OAuth aynı openai/gpt-image-2 model başvurusunu kullanır. Bir
openai-codex OAuth profili yapılandırıldığında OpenClaw, görsel
isteklerini önce OPENAI_API_KEY denemek yerine bu OAuth profili
üzerinden yönlendirir. Açık models.providers.openai yapılandırması (API anahtarı,
özel/Azure temel URL'si) doğrudan OpenAI Images API
rotasına geri döndürür.
Ajana sor
"Arkadaş canlısı bir robot maskotunun görselini oluştur."
Ajan image_generate aracını otomatik çağırır. Araç izin listesi
gerekmez - bir sağlayıcı kullanılabilir olduğunda varsayılan olarak etkindir.
Yaygın rotalar
| Hedef | Model başvurusu | Kimlik doğrulama |
|---|---|---|
| API faturalandırmasıyla OpenAI görsel oluşturma | openai/gpt-image-2 |
OPENAI_API_KEY |
| Codex abonelik kimlik doğrulamasıyla OpenAI görsel oluşturma | openai/gpt-image-2 |
OpenAI Codex OAuth |
| OpenAI şeffaf arka planlı PNG/WebP | openai/gpt-image-1.5 |
OPENAI_API_KEY veya OpenAI Codex OAuth |
| DeepInfra görsel oluşturma | deepinfra/black-forest-labs/FLUX-1-schnell |
DEEPINFRA_API_KEY |
| OpenRouter görsel oluşturma | openrouter/google/gemini-3.1-flash-image-preview |
OPENROUTER_API_KEY |
| LiteLLM görsel oluşturma | litellm/gpt-image-2 |
LITELLM_API_KEY |
| Google Gemini görsel oluşturma | google/gemini-3.1-flash-image-preview |
GEMINI_API_KEY veya GOOGLE_API_KEY |
Aynı image_generate aracı metinden görsel oluşturmeyi ve referans görselle düzenlemeyi yürütür. Tek referans için image, birden fazla referans için images kullanın. quality, outputFormat ve background gibi sağlayıcının desteklediği çıktı ipuçları kullanılabildiğinde iletilir ve sağlayıcı desteklemediğinde yok sayıldı olarak bildirilir. Paketle gelen şeffaf arka plan desteği OpenAI'ye özeldir; diğer sağlayıcılar, arka uçları bunu üretiyorsa PNG alfa değerini yine de koruyabilir.
Desteklenen sağlayıcılar
| Sağlayıcı | Varsayılan model | Düzenleme desteği | Kimlik doğrulama |
|---|---|---|---|
| ComfyUI | workflow |
Evet (1 görsel, iş akışınca yapılandırılmış) | Bulut için COMFY_API_KEY veya COMFY_CLOUD_API_KEY |
| DeepInfra | black-forest-labs/FLUX-1-schnell |
Evet (1 görsel) | DEEPINFRA_API_KEY |
| fal | fal-ai/flux/dev |
Evet | FAL_KEY |
gemini-3.1-flash-image-preview |
Evet | GEMINI_API_KEY veya GOOGLE_API_KEY |
|
| LiteLLM | gpt-image-2 |
Evet (en fazla 5 giriş görseli) | LITELLM_API_KEY |
| MiniMax | image-01 |
Evet (konu referansı) | MINIMAX_API_KEY veya MiniMax OAuth (minimax-portal) |
| OpenAI | gpt-image-2 |
Evet (en fazla 4 görsel) | OPENAI_API_KEY veya OpenAI Codex OAuth |
| OpenRouter | google/gemini-3.1-flash-image-preview |
Evet (en fazla 5 giriş görseli) | OPENROUTER_API_KEY |
| Vydra | grok-imagine |
Hayır | VYDRA_API_KEY |
| xAI | grok-imagine-image |
Evet (en fazla 5 görsel) | XAI_API_KEY |
Çalışma zamanında kullanılabilir sağlayıcıları ve modelleri incelemek için action: "list" kullanın:
/tool image_generate action=list
Sağlayıcı yetenekleri
| Yetenek | ComfyUI | DeepInfra | fal | MiniMax | OpenAI | Vydra | xAI | |
|---|---|---|---|---|---|---|---|---|
| Oluşturma (maks. sayı) | İş akışı tanımlı | 4 | 4 | 4 | 9 | 4 | 1 | 4 |
| Düzenleme / referans | 1 görsel (iş akışı) | 1 görsel | 1 görsel | En fazla 5 görsel | 1 görsel (konu ref) | En fazla 5 görsel | - | En fazla 5 görsel |
| Boyut kontrolü | - | ✓ | ✓ | ✓ | - | En fazla 4K | - | - |
| En-boy oranı | - | - | ✓ (yalnızca oluşturma) | ✓ | ✓ | - | - | ✓ |
| Çözünürlük (1K/2K/4K) | - | - | ✓ | ✓ | - | - | - | 1K, 2K |
Araç parametreleri
promptstringrequiredGörsel oluşturma istemi. action: "generate" için gereklidir.
action"generate" | "list"Çalışma zamanında kullanılabilir sağlayıcıları ve modelleri incelemek için "list" kullanın.
modelstringSağlayıcı/model geçersiz kılması (ör. openai/gpt-image-2). Şeffaf OpenAI arka planları için
openai/gpt-image-1.5 kullanın.
imagestringDüzenleme modu için tek referans görsel yolu veya URL.
imagesstring[]Düzenleme modu için birden fazla referans görsel (destekleyen sağlayıcılarda en fazla 5).
sizestringBoyut ipucu: 1024x1024, 1536x1024, 1024x1536, 2048x2048, 3840x2160.
aspectRatiostringEn-boy oranı: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9.
resolution"1K" | "2K" | "4K"quality"low" | "medium" | "high" | "auto"Sağlayıcı desteklediğinde kalite ipucu.
outputFormat"png" | "jpeg" | "webp"Sağlayıcı desteklediğinde çıktı biçimi ipucu.
background"transparent" | "opaque" | "auto"Sağlayıcı desteklediğinde arka plan ipucu. Saydamlığı destekleyen sağlayıcılar için
outputFormat: "png" veya "webp" ile transparent kullanın.
countnumbertimeoutMsnumberfilenamestringopenaiobjectYalnızca OpenAI ipuçları: background, moderation, outputCompression ve user.
Yapılandırma
Model seçimi
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openai/gpt-image-2",
timeoutMs: 180_000,
fallbacks: [
"openrouter/google/gemini-3.1-flash-image-preview",
"google/gemini-3.1-flash-image-preview",
"fal/fal-ai/flux/dev",
],
},
},
},
}
Sağlayıcı seçim sırası
OpenClaw sağlayıcıları şu sırayla dener:
- Araç çağrısından
modelparametresi (ajan bir tane belirtirse). - Yapılandırmadan
imageGenerationModel.primary. - Sırayla
imageGenerationModel.fallbacks. - Otomatik algılama - yalnızca kimlik doğrulama destekli sağlayıcı varsayılanları:
- önce geçerli varsayılan sağlayıcı;
- kalan kayıtlı görsel oluşturma sağlayıcıları, sağlayıcı kimliği sırasına göre.
Bir sağlayıcı başarısız olursa (kimlik doğrulama hatası, hız sınırı vb.), sıradaki yapılandırılmış aday otomatik olarak denenir. Tümü başarısız olursa hata, her denemeden ayrıntıları içerir.
Çağrı başına model geçersiz kılmaları kesindir
Çağrı başına model geçersiz kılması yalnızca o sağlayıcıyı/modeli dener ve
yapılandırılmış birincil/yedek veya otomatik algılanan sağlayıcılara devam etmez.
Otomatik algılama kimlik doğrulamanın farkındadır
Bir sağlayıcı varsayılanı, aday listesine yalnızca OpenClaw gerçekten
o sağlayıcıda kimlik doğrulaması yapabildiğinde girer. Yalnızca açık
model, primary ve fallbacks girdilerini kullanmak için
agents.defaults.mediaGenerationAutoProviderFallback: false ayarlayın.
Zaman aşımları
Yavaş görsel arka uçları için agents.defaults.imageGenerationModel.timeoutMs ayarlayın. Çağrı başına timeoutMs araç parametresi, yapılandırılmış varsayılanı geçersiz kılar.
Çalışma zamanında incele
Geçerli kayıtlı sağlayıcıları, varsayılan modellerini ve kimlik doğrulama ortam değişkeni ipuçlarını incelemek için action: "list" kullanın.
Görsel düzenleme
OpenAI, OpenRouter, Google, DeepInfra, fal, MiniMax, ComfyUI ve xAI referans görselleri düzenlemeyi destekler. Bir referans görsel yolu veya URL geçirin:
"Generate a watercolor version of this photo" + image: "/path/to/photo.jpg"
OpenAI, OpenRouter, Google ve xAI, images parametresi aracılığıyla en fazla 5 referans görseli destekler. fal, MiniMax ve ComfyUI 1 tane destekler.
Sağlayıcı ayrıntılı incelemeleri
OpenAI gpt-image-2 (ve gpt-image-1.5)
OpenAI görsel oluşturma varsayılan olarak openai/gpt-image-2 kullanır. Bir
openai-codex OAuth profili yapılandırılmışsa OpenClaw, Codex abonelik
sohbet modelleri tarafından kullanılan aynı OAuth profilini yeniden kullanır ve
görsel isteğini Codex Responses arka ucu üzerinden gönderir. https://chatgpt.com/backend-api
gibi eski Codex temel URL'leri, görsel istekleri için
https://chatgpt.com/backend-api/codex biçimine standartlaştırılır. OpenClaw
bu istek için sessizce OPENAI_API_KEY kullanımına geri dönmez -
doğrudan OpenAI Images API yönlendirmesini zorlamak için
models.providers.openai değerini bir API anahtarı, özel temel URL
veya Azure uç noktasıyla açıkça yapılandırın.
openai/gpt-image-1.5, openai/gpt-image-1 ve
openai/gpt-image-1-mini modelleri yine de açıkça seçilebilir. Şeffaf
arka planlı PNG/WebP çıktısı için gpt-image-1.5 kullanın; mevcut
gpt-image-2 API'si background: "transparent" değerini reddeder.
gpt-image-2, aynı image_generate aracı üzerinden hem metinden görsel
oluşturmayı hem de referans görselle düzenlemeyi destekler.
OpenClaw, prompt, count, size, quality, outputFormat
ve referans görselleri OpenAI'ye iletir. OpenAI, aspectRatio veya
resolution değerlerini doğrudan almaz; mümkün olduğunda OpenClaw
bunları desteklenen bir size değerine eşler, aksi halde araç bunları
yok sayılan geçersiz kılmalar olarak bildirir.
OpenAI'ye özgü seçenekler openai nesnesinin altında yer alır:
{
"quality": "low",
"outputFormat": "jpeg",
"openai": {
"background": "opaque",
"moderation": "low",
"outputCompression": 60,
"user": "end-user-42"
}
}
openai.background transparent, opaque veya auto değerlerini kabul eder;
şeffaf çıktılar için outputFormat olarak png veya webp ve
şeffaflığı destekleyen bir OpenAI görsel modeli gerekir. OpenClaw,
varsayılan gpt-image-2 şeffaf arka plan isteklerini gpt-image-1.5
modeline yönlendirir. openai.outputCompression, JPEG/WebP çıktıları için
geçerlidir.
Üst düzey background ipucu sağlayıcıdan bağımsızdır ve OpenAI sağlayıcısı
seçildiğinde şu anda aynı OpenAI background istek alanına eşlenir.
Arka plan desteği bildirmeyen sağlayıcılar, desteklenmeyen parametreyi almak
yerine bunu ignoredOverrides içinde döndürür.
OpenAI görsel oluşturmayı api.openai.com yerine bir Azure OpenAI dağıtımı
üzerinden yönlendirmek için
Azure OpenAI uç noktaları bölümüne bakın.
OpenRouter görsel modelleri
OpenRouter görsel oluşturma aynı OPENROUTER_API_KEY değerini kullanır ve
OpenRouter'ın sohbet tamamlama görsel API'si üzerinden yönlendirilir.
OpenRouter görsel modellerini openrouter/ önekiyle seçin:
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openrouter/google/gemini-3.1-flash-image-preview",
},
},
},
}
OpenClaw, prompt, count, referans görseller ve
Gemini uyumlu aspectRatio / resolution ipuçlarını OpenRouter'a iletir.
Mevcut yerleşik OpenRouter görsel modeli kısayolları arasında
google/gemini-3.1-flash-image-preview,
google/gemini-3-pro-image-preview ve openai/gpt-5.4-image-2 bulunur.
Yapılandırılmış Plugin tarafından nelerin sunulduğunu görmek için
action: "list" kullanın.
MiniMax çift kimlik doğrulama
MiniMax görsel oluşturma, iki yerleşik MiniMax kimlik doğrulama yolu üzerinden kullanılabilir:
- API anahtarı kurulumları için
minimax/image-01 - OAuth kurulumları için
minimax-portal/image-01
xAI grok-imagine-image
Yerleşik xAI sağlayıcısı, yalnızca istem içeren istekler için
/v1/images/generations, image veya images mevcut olduğunda ise
/v1/images/edits kullanır.
- Modeller:
xai/grok-imagine-image,xai/grok-imagine-image-pro - Sayı: 4'e kadar
- Referanslar: bir
imageveya beşe kadarimages - En-boy oranları:
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - Çözünürlükler:
1K,2K - Çıktılar: OpenClaw tarafından yönetilen görsel ekleri olarak döndürülür
OpenClaw, bu denetimler paylaşılan sağlayıcılar arası image_generate
sözleşmesinde bulunana kadar xAI'ye özgü quality, mask, user veya
yalnızca yerel ekstra en-boy oranlarını bilerek kullanıma sunmaz.
Örnekler
Oluştur (4K yatay)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="A clean editorial poster for OpenClaw image generation" size=3840x2160 count=1
Oluştur (şeffaf PNG)
/tool image_generate action=generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparent
Eşdeğer CLI:
openclaw infer image generate \
--model openai/gpt-image-1.5 \
--output-format png \
--background transparent \
--prompt "A simple red circle sticker on a transparent background" \
--json
Oluştur (iki kare)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Two visual directions for a calm productivity app icon" size=1024x1024 count=2
Düzenle (bir referans)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Keep the subject, replace the background with a bright studio setup" image=/path/to/reference.png size=1024x1536
Düzenle (birden çok referans)
/tool image_generate action=generate model=openai/gpt-image-2 prompt="Combine the character identity from the first image with the color palette from the second" images='["/path/to/character.png","/path/to/palette.jpg"]' size=1536x1024
Aynı --output-format ve --background bayrakları
openclaw infer image edit üzerinde de kullanılabilir; --openai-background
OpenAI'ye özgü bir takma ad olarak kalır. OpenAI dışındaki yerleşik sağlayıcılar
bugün açık arka plan denetimi bildirmez, bu nedenle background: "transparent"
onlar için yok sayılmış olarak raporlanır.
İlgili
- Araçlara genel bakış - kullanılabilir tüm ajan araçları
- ComfyUI - yerel ComfyUI ve Comfy Cloud iş akışı kurulumu
- fal - fal görsel ve video sağlayıcısı kurulumu
- Google (Gemini) - Gemini görsel sağlayıcısı kurulumu
- MiniMax - MiniMax görsel sağlayıcısı kurulumu
- OpenAI - OpenAI Images sağlayıcısı kurulumu
- Vydra - Vydra görsel, video ve konuşma kurulumu
- xAI - Grok görsel, video, arama, kod yürütme ve TTS kurulumu
- Yapılandırma başvurusu -
imageGenerationModelyapılandırması - Modeller - model yapılandırması ve yük devretme