Providers
Google (Gemini)
De Google-Plugin biedt toegang tot Gemini-modellen via Google AI Studio, plus beeldgeneratie, mediabegrip (afbeelding/audio/video), tekst-naar-spraak en zoeken op het web via Gemini Grounding.
- Provider:
google - Authenticatie:
GEMINI_API_KEYofGOOGLE_API_KEY - API: Google Gemini API
- Runtime-optie:
agents.defaults.agentRuntime.id: "google-gemini-cli"hergebruikt Gemini CLI OAuth terwijl modelverwijzingen canoniek blijven alsgoogle/*.
Aan de slag
Kies je gewenste authenticatiemethode en volg de installatiestappen.
API-sleutel
Het beste voor: standaard toegang tot de Gemini API via Google AI Studio.
Onboarding uitvoeren
openclaw onboard --auth-choice gemini-api-key
Of geef de sleutel direct door:
openclaw onboard --non-interactive \
--mode local \
--auth-choice gemini-api-key \
--gemini-api-key "$GEMINI_API_KEY"
Een standaardmodel instellen
{
agents: {
defaults: {
model: { primary: "google/gemini-3.1-pro-preview" },
},
},
}
Controleren of het model beschikbaar is
openclaw models list --provider google
Gemini CLI (OAuth)
Het beste voor: hergebruik van een bestaande Gemini CLI-aanmelding via PKCE OAuth in plaats van een aparte API-sleutel.
De Gemini CLI installeren
De lokale opdracht gemini moet beschikbaar zijn op PATH.
# Homebrew
brew install gemini-cli
# or npm
npm install -g @google/gemini-cli
OpenClaw ondersteunt zowel Homebrew-installaties als globale npm-installaties, inclusief gangbare Windows/npm-indelingen.
Aanmelden via OAuth
openclaw models auth login --provider google-gemini-cli --set-default
Controleren of het model beschikbaar is
openclaw models list --provider google
- Standaardmodel:
google/gemini-3.1-pro-preview - Runtime:
google-gemini-cli - Alias:
gemini-cli
De Gemini API-model-id van Gemini 3.1 Pro is gemini-3.1-pro-preview. OpenClaw accepteert de kortere google/gemini-3.1-pro als gemaksalias en normaliseert deze vóór provider-aanroepen.
Omgevingsvariabelen:
OPENCLAW_GEMINI_OAUTH_CLIENT_IDOPENCLAW_GEMINI_OAUTH_CLIENT_SECRET
(Of de GEMINI_CLI_*-varianten.)
google-gemini-cli/*-modelverwijzingen zijn legacy compatibiliteitsaliassen. Nieuwe
configuraties moeten google/*-modelverwijzingen gebruiken plus de google-gemini-cli-
runtime wanneer ze lokale Gemini CLI-uitvoering willen.
Mogelijkheden
| Mogelijkheid | Ondersteund |
|---|---|
| Chatvoltooiingen | Ja |
| Beeldgeneratie | Ja |
| Muziekgeneratie | Ja |
| Tekst-naar-spraak | Ja |
| Realtime spraak | Ja (Google Live API) |
| Afbeeldingsbegrip | Ja |
| Audiotranscriptie | Ja |
| Videobegrip | Ja |
| Zoeken op het web (Grounding) | Ja |
| Denken/redeneren | Ja (Gemini 2.5+ / Gemini 3+) |
| Gemma 4-modellen | Ja |
Zoeken op het web
De meegeleverde gemini-provider voor zoeken op het web gebruikt Gemini Google Search grounding.
Configureer een speciale zoeksleutel onder plugins.entries.google.config.webSearch,
of laat deze models.providers.google.apiKey hergebruiken na GEMINI_API_KEY:
{
plugins: {
entries: {
google: {
config: {
webSearch: {
apiKey: "AIza...", // optional if GEMINI_API_KEY or models.providers.google.apiKey is set
baseUrl: "https://generativelanguage.googleapis.com/v1beta", // falls back to models.providers.google.baseUrl
model: "gemini-2.5-flash",
},
},
},
},
},
}
De volgorde van referenties is de speciale webSearch.apiKey, daarna GEMINI_API_KEY,
daarna models.providers.google.apiKey. webSearch.baseUrl is optioneel en
bestaat voor operator-proxy's of compatibele Gemini API-eindpunten; wanneer dit wordt weggelaten,
hergebruikt Gemini zoeken op het web models.providers.google.baseUrl. Zie
Gemini zoeken voor providerspecifiek toolgedrag.
Beeldgeneratie
De meegeleverde google-provider voor beeldgeneratie gebruikt standaard
google/gemini-3.1-flash-image-preview.
- Ondersteunt ook
google/gemini-3-pro-image-preview - Genereren: tot 4 afbeeldingen per aanvraag
- Bewerkmodus: ingeschakeld, tot 5 invoerafbeeldingen
- Geometrie-instellingen:
size,aspectRatioenresolution
Om Google als standaardprovider voor afbeeldingen te gebruiken:
{
agents: {
defaults: {
imageGenerationModel: {
primary: "google/gemini-3.1-flash-image-preview",
},
},
},
}
Videogeneratie
De meegeleverde google-Plugin registreert ook videogeneratie via de gedeelde
video_generate-tool.
- Standaard videomodel:
google/veo-3.1-fast-generate-preview - Modi: tekst-naar-video, afbeelding-naar-video en referentieflows met één video
- Ondersteunt
aspectRatio,resolutionenaudio - Huidige duurbegrenzing: 4 tot 8 seconden
Om Google als standaardprovider voor video te gebruiken:
{
agents: {
defaults: {
videoGenerationModel: {
primary: "google/veo-3.1-fast-generate-preview",
},
},
},
}
Muziekgeneratie
De meegeleverde google-Plugin registreert ook muziekgeneratie via de gedeelde
music_generate-tool.
- Standaard muziekmodel:
google/lyria-3-clip-preview - Ondersteunt ook
google/lyria-3-pro-preview - Promptinstellingen:
lyricseninstrumental - Uitvoerformaat: standaard
mp3, pluswavopgoogle/lyria-3-pro-preview - Referentie-invoer: tot 10 afbeeldingen
- Door sessies ondersteunde runs worden losgekoppeld via de gedeelde taak-/statusflow, inclusief
action: "status"
Om Google als standaardprovider voor muziek te gebruiken:
{
agents: {
defaults: {
musicGenerationModel: {
primary: "google/lyria-3-clip-preview",
},
},
},
}
Tekst-naar-spraak
De meegeleverde google-spraakprovider gebruikt het Gemini API TTS-pad met
gemini-3.1-flash-tts-preview.
- Standaardstem:
Kore - Authenticatie:
messages.tts.providers.google.apiKey,models.providers.google.apiKey,GEMINI_API_KEYofGOOGLE_API_KEY - Uitvoer: WAV voor reguliere TTS-bijlagen, Opus voor spraaknotitiedoelen, PCM voor Talk/telefonie
- Uitvoer voor spraaknotities: Google PCM wordt verpakt als WAV en getranscodeerd naar 48 kHz Opus met
ffmpeg
Het batch-Gemini TTS-pad van Google retourneert gegenereerde audio in de voltooide
generateContent-respons. Gebruik voor gesproken gesprekken met de laagste latentie de
realtime spraakprovider van Google, ondersteund door de Gemini Live API, in plaats van batch
TTS.
Om Google als standaard TTS-provider te gebruiken:
{
messages: {
tts: {
auto: "always",
provider: "google",
providers: {
google: {
model: "gemini-3.1-flash-tts-preview",
voiceName: "Kore",
audioProfile: "Speak professionally with a calm tone.",
},
},
},
},
}
Gemini API TTS gebruikt prompts in natuurlijke taal voor stijlsturing. Stel
audioProfile in om een herbruikbare stijlprompt vóór de uitgesproken tekst te plaatsen. Stel
speakerName in wanneer je prompttekst naar een benoemde spreker verwijst.
Gemini API TTS accepteert ook expressieve audiotags tussen vierkante haken in de tekst,
zoals [whispers] of [laughs]. Om tags uit het zichtbare chatantwoord te houden
terwijl ze naar TTS worden verzonden, plaats je ze binnen een [[tts:text]]...[[/tts:text]]-
blok:
Here is the clean reply text.
[[tts:text]][whispers] Here is the spoken version.[[/tts:text]]
Realtime spraak
De meegeleverde google-Plugin registreert een realtime spraakprovider die wordt ondersteund door de
Gemini Live API voor backend-audiobruggen zoals Voice Call en Google Meet.
| Instelling | Configuratiepad | Standaard |
|---|---|---|
| Model | plugins.entries.voice-call.config.realtime.providers.google.model |
gemini-2.5-flash-native-audio-preview-12-2025 |
| Stem | ...google.voice |
Kore |
| Temperatuur | ...google.temperature |
(niet ingesteld) |
| VAD-startgevoeligheid | ...google.startSensitivity |
(niet ingesteld) |
| VAD-eindgevoeligheid | ...google.endSensitivity |
(niet ingesteld) |
| Stilteperiode | ...google.silenceDurationMs |
(niet ingesteld) |
| Activiteitsafhandeling | ...google.activityHandling |
Google-standaard, start-of-activity-interrupts |
| Beurtdekking | ...google.turnCoverage |
Google-standaard, only-activity |
| Automatische VAD uitschakelen | ...google.automaticActivityDetectionDisabled |
false |
| Sessiehervatting | ...google.sessionResumption |
true |
| Contextcompressie | ...google.contextWindowCompression |
true |
| API-sleutel | ...google.apiKey |
Valt terug op models.providers.google.apiKey, GEMINI_API_KEY of GOOGLE_API_KEY |
Voorbeeldconfiguratie voor realtime Voice Call:
{
plugins: {
entries: {
"voice-call": {
enabled: true,
config: {
realtime: {
enabled: true,
provider: "google",
providers: {
google: {
model: "gemini-2.5-flash-native-audio-preview-12-2025",
voice: "Kore",
activityHandling: "start-of-activity-interrupts",
turnCoverage: "only-activity",
},
},
},
},
},
},
},
}
Voor liveverificatie door maintainers voer je
OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts uit.
Het Google-deel maakt dezelfde beperkte Live API-tokenvorm aan die Control
UI Talk gebruikt, opent het WebSocket-eindpunt van de browser, verzendt de initiële setuppayload
en wacht op setupComplete.
Geavanceerde configuratie
Direct Gemini cache reuse
Voor directe Gemini API-runs (api: "google-generative-ai") geeft OpenClaw
een geconfigureerde cachedContent-handle door aan Gemini-aanvragen.
- Configureer per-model- of globale parameters met
cachedContentof legacycached_content - Als beide aanwezig zijn, wint
cachedContent - Voorbeeldwaarde:
cachedContents/prebuilt-context - Gemini-cachehitgebruik wordt genormaliseerd naar OpenClaw
cacheReadvanuit upstreamcachedContentTokenCount
{
agents: {
defaults: {
models: {
"google/gemini-2.5-pro": {
params: {
cachedContent: "cachedContents/prebuilt-context",
},
},
},
},
},
}
Gemini CLI JSON usage notes
Bij gebruik van de google-gemini-cli OAuth-provider normaliseert OpenClaw
de CLI JSON-uitvoer als volgt:
- Antwoordtekst komt uit het CLI JSON-veld
response. - Gebruik valt terug op
statswanneer de CLIusageleeg laat. stats.cachedwordt genormaliseerd naar OpenClawcacheRead.- Als
stats.inputontbreekt, leidt OpenClaw invoertokens af uitstats.input_tokens - stats.cached.
Environment and daemon setup
Als de Gateway als daemon draait (launchd/systemd), zorg er dan voor dat GEMINI_API_KEY
beschikbaar is voor dat proces (bijvoorbeeld in ~/.openclaw/.env of via
env.shellEnv).