Providers

Google (Gemini)

De Google-Plugin biedt toegang tot Gemini-modellen via Google AI Studio, plus beeldgeneratie, mediabegrip (afbeelding/audio/video), tekst-naar-spraak en zoeken op het web via Gemini Grounding.

Provider: google
Authenticatie: GEMINI_API_KEY of GOOGLE_API_KEY
API: Google Gemini API
Runtime-optie: agents.defaults.agentRuntime.id: "google-gemini-cli" hergebruikt Gemini CLI OAuth terwijl modelverwijzingen canoniek blijven als google/*.

Aan de slag

Kies je gewenste authenticatiemethode en volg de installatiestappen.

API-sleutel

Het beste voor: standaard toegang tot de Gemini API via Google AI Studio.

Onboarding uitvoeren

openclaw onboard --auth-choice gemini-api-key

Of geef de sleutel direct door:

openclaw onboard --non-interactive \
  --mode local \
  --auth-choice gemini-api-key \
  --gemini-api-key "$GEMINI_API_KEY"

Een standaardmodel instellen

{
  agents: {
    defaults: {
      model: { primary: "google/gemini-3.1-pro-preview" },
    },
  },
}

Controleren of het model beschikbaar is

openclaw models list --provider google

Gemini CLI (OAuth)

Het beste voor: hergebruik van een bestaande Gemini CLI-aanmelding via PKCE OAuth in plaats van een aparte API-sleutel.

De Gemini CLI installeren

De lokale opdracht gemini moet beschikbaar zijn op PATH.

# Homebrew
brew install gemini-cli

# or npm
npm install -g @google/gemini-cli

OpenClaw ondersteunt zowel Homebrew-installaties als globale npm-installaties, inclusief gangbare Windows/npm-indelingen.

Aanmelden via OAuth

openclaw models auth login --provider google-gemini-cli --set-default

Controleren of het model beschikbaar is

openclaw models list --provider google

Standaardmodel: google/gemini-3.1-pro-preview
Runtime: google-gemini-cli
Alias: gemini-cli

De Gemini API-model-id van Gemini 3.1 Pro is gemini-3.1-pro-preview. OpenClaw accepteert de kortere google/gemini-3.1-pro als gemaksalias en normaliseert deze vóór provider-aanroepen.

Omgevingsvariabelen:

OPENCLAW_GEMINI_OAUTH_CLIENT_ID
OPENCLAW_GEMINI_OAUTH_CLIENT_SECRET

(Of de GEMINI_CLI_*-varianten.)

google-gemini-cli/*-modelverwijzingen zijn legacy compatibiliteitsaliassen. Nieuwe configuraties moeten google/*-modelverwijzingen gebruiken plus de google-gemini-cli- runtime wanneer ze lokale Gemini CLI-uitvoering willen.

Mogelijkheden

Mogelijkheid	Ondersteund
Chatvoltooiingen	Ja
Beeldgeneratie	Ja
Muziekgeneratie	Ja
Tekst-naar-spraak	Ja
Realtime spraak	Ja (Google Live API)
Afbeeldingsbegrip	Ja
Audiotranscriptie	Ja
Videobegrip	Ja
Zoeken op het web (Grounding)	Ja
Denken/redeneren	Ja (Gemini 2.5+ / Gemini 3+)
Gemma 4-modellen	Ja

Zoeken op het web

De meegeleverde gemini-provider voor zoeken op het web gebruikt Gemini Google Search grounding. Configureer een speciale zoeksleutel onder plugins.entries.google.config.webSearch, of laat deze models.providers.google.apiKey hergebruiken na GEMINI_API_KEY:

{
  plugins: {
    entries: {
      google: {
        config: {
          webSearch: {
            apiKey: "AIza...", // optional if GEMINI_API_KEY or models.providers.google.apiKey is set
            baseUrl: "https://generativelanguage.googleapis.com/v1beta", // falls back to models.providers.google.baseUrl
            model: "gemini-2.5-flash",
          },
        },
      },
    },
  },
}

De volgorde van referenties is de speciale webSearch.apiKey, daarna GEMINI_API_KEY, daarna models.providers.google.apiKey. webSearch.baseUrl is optioneel en bestaat voor operator-proxy's of compatibele Gemini API-eindpunten; wanneer dit wordt weggelaten, hergebruikt Gemini zoeken op het web models.providers.google.baseUrl. Zie Gemini zoeken voor providerspecifiek toolgedrag.

Tip

Gemini 3-modellen gebruiken thinkingLevel in plaats van thinkingBudget. OpenClaw koppelt redeneerinstellingen voor Gemini 3, Gemini 3.1 en gemini-*-latest-aliassen aan thinkingLevel, zodat standaardruns/runs met lage latentie geen uitgeschakelde thinkingBudget-waarden verzenden.

/think adaptive behoudt de dynamische denksemantiek van Google in plaats van een vast OpenClaw-niveau te kiezen. Gemini 3 en Gemini 3.1 laten een vaste thinkingLevel weg zodat Google het niveau kan kiezen; Gemini 2.5 verzendt de dynamische sentinel van Google thinkingBudget: -1.

Gemma 4-modellen (bijvoorbeeld gemma-4-26b-a4b-it) ondersteunen de denkmodus. OpenClaw herschrijft thinkingBudget naar een ondersteund Google thinkingLevel voor Gemma 4. Als je denken op off zet, blijft denken uitgeschakeld in plaats van te worden gekoppeld aan MINIMAL.

Beeldgeneratie

De meegeleverde google-provider voor beeldgeneratie gebruikt standaard google/gemini-3.1-flash-image-preview.

Ondersteunt ook google/gemini-3-pro-image-preview
Genereren: tot 4 afbeeldingen per aanvraag
Bewerkmodus: ingeschakeld, tot 5 invoerafbeeldingen
Geometrie-instellingen: size, aspectRatio en resolution

Om Google als standaardprovider voor afbeeldingen te gebruiken:

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "google/gemini-3.1-flash-image-preview",
      },
    },
  },
}

Videogeneratie

De meegeleverde google-Plugin registreert ook videogeneratie via de gedeelde video_generate-tool.

Standaard videomodel: google/veo-3.1-fast-generate-preview
Modi: tekst-naar-video, afbeelding-naar-video en referentieflows met één video
Ondersteunt aspectRatio, resolution en audio
Huidige duurbegrenzing: 4 tot 8 seconden

Om Google als standaardprovider voor video te gebruiken:

{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "google/veo-3.1-fast-generate-preview",
      },
    },
  },
}

Muziekgeneratie

De meegeleverde google-Plugin registreert ook muziekgeneratie via de gedeelde music_generate-tool.

Standaard muziekmodel: google/lyria-3-clip-preview
Ondersteunt ook google/lyria-3-pro-preview
Promptinstellingen: lyrics en instrumental
Uitvoerformaat: standaard mp3, plus wav op google/lyria-3-pro-preview
Referentie-invoer: tot 10 afbeeldingen
Door sessies ondersteunde runs worden losgekoppeld via de gedeelde taak-/statusflow, inclusief action: "status"

Om Google als standaardprovider voor muziek te gebruiken:

{
  agents: {
    defaults: {
      musicGenerationModel: {
        primary: "google/lyria-3-clip-preview",
      },
    },
  },
}

Tekst-naar-spraak

De meegeleverde google-spraakprovider gebruikt het Gemini API TTS-pad met gemini-3.1-flash-tts-preview.

Standaardstem: Kore
Authenticatie: messages.tts.providers.google.apiKey, models.providers.google.apiKey, GEMINI_API_KEY of GOOGLE_API_KEY
Uitvoer: WAV voor reguliere TTS-bijlagen, Opus voor spraaknotitiedoelen, PCM voor Talk/telefonie
Uitvoer voor spraaknotities: Google PCM wordt verpakt als WAV en getranscodeerd naar 48 kHz Opus met ffmpeg

Het batch-Gemini TTS-pad van Google retourneert gegenereerde audio in de voltooide generateContent-respons. Gebruik voor gesproken gesprekken met de laagste latentie de realtime spraakprovider van Google, ondersteund door de Gemini Live API, in plaats van batch TTS.

Om Google als standaard TTS-provider te gebruiken:

{
  messages: {
    tts: {
      auto: "always",
      provider: "google",
      providers: {
        google: {
          model: "gemini-3.1-flash-tts-preview",
          voiceName: "Kore",
          audioProfile: "Speak professionally with a calm tone.",
        },
      },
    },
  },
}

Gemini API TTS gebruikt prompts in natuurlijke taal voor stijlsturing. Stel audioProfile in om een herbruikbare stijlprompt vóór de uitgesproken tekst te plaatsen. Stel speakerName in wanneer je prompttekst naar een benoemde spreker verwijst.

Gemini API TTS accepteert ook expressieve audiotags tussen vierkante haken in de tekst, zoals [whispers] of [laughs]. Om tags uit het zichtbare chatantwoord te houden terwijl ze naar TTS worden verzonden, plaats je ze binnen een [[tts:text]]...[[/tts:text]]- blok:

Here is the clean reply text.

[[tts:text]][whispers] Here is the spoken version.[[/tts:text]]

Realtime spraak

De meegeleverde google-Plugin registreert een realtime spraakprovider die wordt ondersteund door de Gemini Live API voor backend-audiobruggen zoals Voice Call en Google Meet.

Instelling	Configuratiepad	Standaard
Model	`plugins.entries.voice-call.config.realtime.providers.google.model`	`gemini-2.5-flash-native-audio-preview-12-2025`
Stem	`...google.voice`	`Kore`
Temperatuur	`...google.temperature`	(niet ingesteld)
VAD-startgevoeligheid	`...google.startSensitivity`	(niet ingesteld)
VAD-eindgevoeligheid	`...google.endSensitivity`	(niet ingesteld)
Stilteperiode	`...google.silenceDurationMs`	(niet ingesteld)
Activiteitsafhandeling	`...google.activityHandling`	Google-standaard, `start-of-activity-interrupts`
Beurtdekking	`...google.turnCoverage`	Google-standaard, `only-activity`
Automatische VAD uitschakelen	`...google.automaticActivityDetectionDisabled`	`false`
Sessiehervatting	`...google.sessionResumption`	`true`
Contextcompressie	`...google.contextWindowCompression`	`true`
API-sleutel	`...google.apiKey`	Valt terug op `models.providers.google.apiKey`, `GEMINI_API_KEY` of `GOOGLE_API_KEY`

Voorbeeldconfiguratie voor realtime Voice Call:

{
  plugins: {
    entries: {
      "voice-call": {
        enabled: true,
        config: {
          realtime: {
            enabled: true,
            provider: "google",
            providers: {
              google: {
                model: "gemini-2.5-flash-native-audio-preview-12-2025",
                voice: "Kore",
                activityHandling: "start-of-activity-interrupts",
                turnCoverage: "only-activity",
              },
            },
          },
        },
      },
    },
  },
}

Voor liveverificatie door maintainers voer je OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts uit. Het Google-deel maakt dezelfde beperkte Live API-tokenvorm aan die Control UI Talk gebruikt, opent het WebSocket-eindpunt van de browser, verzendt de initiële setuppayload en wacht op setupComplete.

Geavanceerde configuratie

Direct Gemini cache reuse

Voor directe Gemini API-runs (api: "google-generative-ai") geeft OpenClaw een geconfigureerde cachedContent-handle door aan Gemini-aanvragen.

Configureer per-model- of globale parameters met cachedContent of legacy cached_content
Als beide aanwezig zijn, wint cachedContent
Voorbeeldwaarde: cachedContents/prebuilt-context
Gemini-cachehitgebruik wordt genormaliseerd naar OpenClaw cacheRead vanuit upstream cachedContentTokenCount

{
  agents: {
    defaults: {
      models: {
        "google/gemini-2.5-pro": {
          params: {
            cachedContent: "cachedContents/prebuilt-context",
          },
        },
      },
    },
  },
}

Gemini CLI JSON usage notes

Bij gebruik van de google-gemini-cli OAuth-provider normaliseert OpenClaw de CLI JSON-uitvoer als volgt:

Antwoordtekst komt uit het CLI JSON-veld response.
Gebruik valt terug op stats wanneer de CLI usage leeg laat.
stats.cached wordt genormaliseerd naar OpenClaw cacheRead.
Als stats.input ontbreekt, leidt OpenClaw invoertokens af uit stats.input_tokens - stats.cached.

Environment and daemon setup

Als de Gateway als daemon draait (launchd/systemd), zorg er dan voor dat GEMINI_API_KEY beschikbaar is voor dat proces (bijvoorbeeld in ~/.openclaw/.env of via env.shellEnv).

Gerelateerd

Model selection

Providers, modelreferenties en failovergedrag kiezen.

Image generation

Gedeelde parameters voor afbeeldingstools en providerselectie.

Video generation

Gedeelde parameters voor videotools en providerselectie.

Music generation

Gedeelde parameters voor muziektools en providerselectie.

# Aan de slag

API-sleutel

Onboarding uitvoeren

Een standaardmodel instellen

Controleren of het model beschikbaar is

Gemini CLI (OAuth)

De Gemini CLI installeren

Aanmelden via OAuth

Controleren of het model beschikbaar is

# Mogelijkheden

# Zoeken op het web

# Beeldgeneratie

# Videogeneratie

# Muziekgeneratie

# Tekst-naar-spraak

# Realtime spraak

# Geavanceerde configuratie

# Gerelateerd

Aan de slag

Mogelijkheden

Zoeken op het web

Beeldgeneratie

Videogeneratie

Muziekgeneratie

Tekst-naar-spraak

Realtime spraak

Geavanceerde configuratie

Gerelateerd