Providers
Google (Gemini)
Google Plugin, Google AI Studio üzerinden Gemini modellerine erişim sağlamanın yanı sıra Gemini Grounding aracılığıyla görsel üretimi, medya anlama (görsel/ses/video), metinden konuşmaya ve web araması sağlar.
- Sağlayıcı:
google - Kimlik doğrulama:
GEMINI_API_KEYveyaGOOGLE_API_KEY - API: Google Gemini API
- Çalışma zamanı seçeneği:
agents.defaults.agentRuntime.id: "google-gemini-cli"model referanslarınıgoogle/*olarak kanonik tutarken Gemini CLI OAuth'u yeniden kullanır.
Başlarken
Tercih ettiğiniz kimlik doğrulama yöntemini seçin ve kurulum adımlarını izleyin.
API anahtarı
Şunun için en iyi: Google AI Studio üzerinden standart Gemini API erişimi.
İlk kurulumu çalıştırın
openclaw onboard --auth-choice gemini-api-key
Veya anahtarı doğrudan geçirin:
openclaw onboard --non-interactive \
--mode local \
--auth-choice gemini-api-key \
--gemini-api-key "$GEMINI_API_KEY"
Varsayılan model ayarlayın
{
agents: {
defaults: {
model: { primary: "google/gemini-3.1-pro-preview" },
},
},
}
Modelin kullanılabilir olduğunu doğrulayın
openclaw models list --provider google
Gemini CLI (OAuth)
Şunun için en iyi: Ayrı bir API anahtarı yerine PKCE OAuth aracılığıyla mevcut bir Gemini CLI oturum açmasını yeniden kullanmak.
Gemini CLI'yi yükleyin
Yerel gemini komutu PATH üzerinde kullanılabilir olmalıdır.
# Homebrew
brew install gemini-cli
# or npm
npm install -g @google/gemini-cli
OpenClaw, yaygın Windows/npm düzenleri dahil olmak üzere hem Homebrew kurulumlarını hem de global npm kurulumlarını destekler.
OAuth ile oturum açın
openclaw models auth login --provider google-gemini-cli --set-default
Modelin kullanılabilir olduğunu doğrulayın
openclaw models list --provider google
- Varsayılan model:
google/gemini-3.1-pro-preview - Çalışma zamanı:
google-gemini-cli - Diğer ad:
gemini-cli
Gemini 3.1 Pro'nun Gemini API model kimliği gemini-3.1-pro-preview şeklindedir. OpenClaw, kolaylık için daha kısa google/gemini-3.1-pro değerini diğer ad olarak kabul eder ve sağlayıcı çağrılarından önce normalleştirir.
Ortam değişkenleri:
OPENCLAW_GEMINI_OAUTH_CLIENT_IDOPENCLAW_GEMINI_OAUTH_CLIENT_SECRET
(Veya GEMINI_CLI_* varyantları.)
google-gemini-cli/* model referansları eski uyumluluk diğer adlarıdır. Yeni
yapılandırmalar, yerel Gemini CLI yürütmesi istediklerinde google/* model referanslarını ve google-gemini-cli
çalışma zamanını kullanmalıdır.
Yetenekler
| Yetenek | Desteklenir |
|---|---|
| Sohbet tamamlama | Evet |
| Görsel üretimi | Evet |
| Müzik üretimi | Evet |
| Metinden konuşmaya | Evet |
| Gerçek zamanlı ses | Evet (Google Live API) |
| Görsel anlama | Evet |
| Ses transkripsiyonu | Evet |
| Video anlama | Evet |
| Web araması (Grounding) | Evet |
| Düşünme/akıl yürütme | Evet (Gemini 2.5+ / Gemini 3+) |
| Gemma 4 modelleri | Evet |
Web araması
Paketle gelen gemini web arama sağlayıcısı, Gemini Google Search grounding kullanır.
plugins.entries.google.config.webSearch altında ayrılmış bir arama anahtarı yapılandırın
veya GEMINI_API_KEY sonrasında models.providers.google.apiKey değerini yeniden kullanmasına izin verin:
{
plugins: {
entries: {
google: {
config: {
webSearch: {
apiKey: "AIza...", // optional if GEMINI_API_KEY or models.providers.google.apiKey is set
baseUrl: "https://generativelanguage.googleapis.com/v1beta", // falls back to models.providers.google.baseUrl
model: "gemini-2.5-flash",
},
},
},
},
},
}
Kimlik bilgisi önceliği, ayrılmış webSearch.apiKey, ardından GEMINI_API_KEY,
ardından models.providers.google.apiKey şeklindedir. webSearch.baseUrl isteğe bağlıdır ve
operatör proxy'leri veya uyumlu Gemini API uç noktaları için bulunur; atlandığında
Gemini web araması models.providers.google.baseUrl değerini yeniden kullanır. Sağlayıcıya özgü araç davranışı için
Gemini araması bölümüne bakın.
Görsel üretimi
Paketle gelen google görsel üretimi sağlayıcısı varsayılan olarak
google/gemini-3.1-flash-image-preview kullanır.
google/gemini-3-pro-image-previewda desteklenir- Üretim: istek başına en fazla 4 görsel
- Düzenleme modu: etkin, en fazla 5 girdi görseli
- Geometri denetimleri:
size,aspectRatioveresolution
Google'ı varsayılan görsel sağlayıcısı olarak kullanmak için:
{
agents: {
defaults: {
imageGenerationModel: {
primary: "google/gemini-3.1-flash-image-preview",
},
},
},
}
Video üretimi
Paketle gelen google Plugin, paylaşılan
video_generate aracı üzerinden video üretimini de kaydeder.
- Varsayılan video modeli:
google/veo-3.1-fast-generate-preview - Modlar: metinden videoya, görselden videoya ve tek video referans akışları
aspectRatio,resolutionveaudiodestekler- Geçerli süre sınırı: 4 ila 8 saniye
Google'ı varsayılan video sağlayıcısı olarak kullanmak için:
{
agents: {
defaults: {
videoGenerationModel: {
primary: "google/veo-3.1-fast-generate-preview",
},
},
},
}
Müzik üretimi
Paketle gelen google Plugin, paylaşılan
music_generate aracı üzerinden müzik üretimini de kaydeder.
- Varsayılan müzik modeli:
google/lyria-3-clip-preview google/lyria-3-pro-previewda desteklenir- İstem denetimleri:
lyricsveinstrumental - Çıktı biçimi: varsayılan olarak
mp3, ayrıcagoogle/lyria-3-pro-previewüzerindewav - Referans girdileri: en fazla 10 görsel
- Oturum destekli çalıştırmalar,
action: "status"dahil olmak üzere paylaşılan görev/durum akışı üzerinden ayrılır
Google'ı varsayılan müzik sağlayıcısı olarak kullanmak için:
{
agents: {
defaults: {
musicGenerationModel: {
primary: "google/lyria-3-clip-preview",
},
},
},
}
Metinden konuşmaya
Paketle gelen google konuşma sağlayıcısı, Gemini API TTS yolunu
gemini-3.1-flash-tts-preview ile kullanır.
- Varsayılan ses:
Kore - Kimlik doğrulama:
messages.tts.providers.google.apiKey,models.providers.google.apiKey,GEMINI_API_KEYveyaGOOGLE_API_KEY - Çıktı: normal TTS ekleri için WAV, sesli not hedefleri için Opus, Talk/telefon için PCM
- Sesli not çıktısı: Google PCM, WAV olarak sarılır ve
ffmpegile 48 kHz Opus biçimine dönüştürülür
Google'ın toplu Gemini TTS yolu, üretilen sesi tamamlanmış
generateContent yanıtında döndürür. En düşük gecikmeli konuşmalı görüşmeler için toplu
TTS yerine Gemini Live API tarafından desteklenen Google gerçek zamanlı ses sağlayıcısını kullanın.
Google'ı varsayılan TTS sağlayıcısı olarak kullanmak için:
{
messages: {
tts: {
auto: "always",
provider: "google",
providers: {
google: {
model: "gemini-3.1-flash-tts-preview",
voiceName: "Kore",
audioProfile: "Speak professionally with a calm tone.",
},
},
},
},
}
Gemini API TTS, stil denetimi için doğal dil istemleri kullanır.
Konuşulan metinden önce yeniden kullanılabilir bir stil istemi eklemek için
audioProfile ayarlayın. İstem metniniz adlandırılmış bir konuşmacıya başvuruyorsa
speakerName ayarlayın.
Gemini API TTS ayrıca metinde [whispers] veya [laughs] gibi etkileyici köşeli parantezli ses etiketlerini kabul eder.
Etiketleri görünür sohbet yanıtının dışında tutarken TTS'ye göndermek için
bunları bir [[tts:text]]...[[/tts:text]]
bloğunun içine koyun:
Here is the clean reply text.
[[tts:text]][whispers] Here is the spoken version.[[/tts:text]]
Gerçek zamanlı ses
Paketle gelen google Plugin, Voice Call ve Google Meet gibi arka uç ses köprüleri için
Gemini Live API tarafından desteklenen bir gerçek zamanlı ses sağlayıcısı kaydeder.
| Ayar | Yapılandırma yolu | Varsayılan |
|---|---|---|
| Model | plugins.entries.voice-call.config.realtime.providers.google.model |
gemini-2.5-flash-native-audio-preview-12-2025 |
| Ses | ...google.voice |
Kore |
| Sıcaklık | ...google.temperature |
(ayarlanmamış) |
| VAD başlangıç hassasiyeti | ...google.startSensitivity |
(ayarlanmamış) |
| VAD bitiş hassasiyeti | ...google.endSensitivity |
(ayarlanmamış) |
| Sessizlik süresi | ...google.silenceDurationMs |
(ayarlanmamış) |
| Etkinlik işleme | ...google.activityHandling |
Google varsayılanı, start-of-activity-interrupts |
| Tur kapsamı | ...google.turnCoverage |
Google varsayılanı, only-activity |
| Otomatik VAD'yi devre dışı bırak | ...google.automaticActivityDetectionDisabled |
false |
| Oturum devam ettirme | ...google.sessionResumption |
true |
| Bağlam sıkıştırma | ...google.contextWindowCompression |
true |
| API anahtarı | ...google.apiKey |
models.providers.google.apiKey, GEMINI_API_KEY veya GOOGLE_API_KEY değerine geri döner |
Örnek Voice Call gerçek zamanlı yapılandırması:
{
plugins: {
entries: {
"voice-call": {
enabled: true,
config: {
realtime: {
enabled: true,
provider: "google",
providers: {
google: {
model: "gemini-2.5-flash-native-audio-preview-12-2025",
voice: "Kore",
activityHandling: "start-of-activity-interrupts",
turnCoverage: "only-activity",
},
},
},
},
},
},
},
}
Bakımcı canlı doğrulaması için şunu çalıştırın:
OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts.
Google ayağı, Control UI Talk tarafından kullanılan aynı kısıtlı Live API belirteci şeklini üretir,
tarayıcı WebSocket uç noktasını açar, ilk kurulum yükünü gönderir
ve setupComplete için bekler.
Gelişmiş yapılandırma
Doğrudan Gemini önbelleği yeniden kullanımı
Doğrudan Gemini API çalıştırmaları (api: "google-generative-ai") için OpenClaw,
yapılandırılmış bir cachedContent tanıtıcısını Gemini isteklerine geçirir.
- Model başına veya genel parametreleri
cachedContentya da eskicached_contentile yapılandırın - İkisi de mevcutsa,
cachedContentönceliklidir - Örnek değer:
cachedContents/prebuilt-context - Gemini önbellek isabeti kullanımı, yukarı akış
cachedContentTokenCountdeğerinden OpenClawcacheReadiçine normalleştirilir
{
agents: {
defaults: {
models: {
"google/gemini-2.5-pro": {
params: {
cachedContent: "cachedContents/prebuilt-context",
},
},
},
},
},
}
Gemini CLI JSON kullanım notları
google-gemini-cli OAuth sağlayıcısını kullanırken OpenClaw,
CLI JSON çıktısını şu şekilde normalleştirir:
- Yanıt metni CLI JSON
responsealanından gelir. - CLI
usagealanını boş bıraktığında kullanımstatsdeğerine geri döner. stats.cached, OpenClawcacheReadiçine normalleştirilir.stats.inputeksikse, OpenClaw giriş belirteçlerinistats.input_tokens - stats.cachedüzerinden türetir.
Ortam ve daemon kurulumu
Gateway bir daemon (launchd/systemd) olarak çalışıyorsa, GEMINI_API_KEY
değerinin bu işlem için kullanılabilir olduğundan emin olun (örneğin ~/.openclaw/.env içinde veya
env.shellEnv aracılığıyla).
İlgili
Sağlayıcıları, model başvurularını ve yük devretme davranışını seçme.
Paylaşılan görüntü aracı parametreleri ve sağlayıcı seçimi.
Paylaşılan video aracı parametreleri ve sağlayıcı seçimi.
Paylaşılan müzik aracı parametreleri ve sağlayıcı seçimi.