Plugins
Google Meet-Plugin
Google Meet-Teilnehmerunterstützung für OpenClaw — das Plugin ist absichtlich explizit gestaltet:
- Es tritt nur einer expliziten
https://meet.google.com/...-URL bei. - Es kann über die Google Meet API einen neuen Meet-Bereich erstellen und dann der zurückgegebenen URL beitreten.
agentist der Standard-Antwortmodus: Echtzeittranskription hört zu, der konfigurierte OpenClaw-Agent antwortet, und reguläres OpenClaw TTS spricht in Meet.bidibleibt als Fallback-Modus für das direkte Echtzeit-Sprachmodell verfügbar.- Agents wählen das Beitrittsverhalten mit
mode: Verwenden Sieagentfür Live- Zuhören/Antworten,bidifür den direkten Echtzeit-Sprach-Fallback odertranscribe, um den Browser ohne Antwort-Bridge beizutreten/zu steuern. - Auth beginnt als persönliches Google OAuth oder als bereits angemeldetes Chrome-Profil.
- Es gibt keine automatische Einwilligungsankündigung.
- Das standardmäßige Chrome-Audio-Backend ist
BlackHole 2ch. - Chrome kann lokal oder auf einem gekoppelten Node-Host ausgeführt werden.
- Twilio akzeptiert eine Einwahlnummer plus optionale PIN oder DTMF-Sequenz; es kann keine Meet-URL direkt anwählen.
- Der CLI-Befehl ist
googlemeet;meetist für umfassendere Agent- Telekonferenz-Workflows reserviert.
Schnellstart
Installieren Sie die lokalen Audioabhängigkeiten und konfigurieren Sie einen
Provider für Echtzeittranskription sowie reguläres OpenClaw TTS. OpenAI ist der
Standard-Provider für Transkription; Google Gemini Live funktioniert ebenfalls
als separater bidi-Sprach-Fallback mit
realtime.voiceProvider: "google":
brew install blackhole-2ch sox
export OPENAI_API_KEY=sk-...
# only needed when realtime.voiceProvider is "google" for bidi mode
export GEMINI_API_KEY=...
blackhole-2ch installiert das virtuelle Audiogerät BlackHole 2ch. Der
Homebrew-Installer erfordert einen Neustart, bevor macOS das Gerät bereitstellt:
sudo reboot
Überprüfen Sie nach dem Neustart beide Komponenten:
system_profiler SPAudioDataType | grep -i BlackHole
command -v sox
Aktivieren Sie das Plugin:
{
plugins: {
entries: {
"google-meet": {
enabled: true,
config: {},
},
},
},
}
Prüfen Sie die Einrichtung:
openclaw googlemeet setup
Die Setup-Ausgabe ist agentenlesbar und modusbewusst gedacht. Sie meldet Chrome-
Profil, Node-Pinning und bei Echtzeit-Chrome-Beitritten die BlackHole/SoX-Audio-
Bridge sowie verzögerte Echtzeit-Introprüfungen. Für reine Beobachtungsbeitritte
prüfen Sie denselben Transport mit --mode transcribe; dieser Modus überspringt
Echtzeit-Audiovoraussetzungen, weil er weder über die Bridge zuhört noch über sie
spricht:
openclaw googlemeet setup --transport chrome-node --mode transcribe
Wenn Twilio-Delegation konfiguriert ist, meldet das Setup außerdem, ob das
voice-call-Plugin, Twilio-Zugangsdaten und öffentliche Webhook-Erreichbarkeit
bereit sind. Behandeln Sie jede Prüfung mit ok: false als Blocker für den
geprüften Transport und Modus, bevor Sie einen Agent bitten beizutreten.
Verwenden Sie openclaw googlemeet setup --json für Skripte oder
maschinenlesbare Ausgabe. Verwenden Sie --transport chrome,
--transport chrome-node oder --transport twilio, um einen bestimmten
Transport vorab zu prüfen, bevor ein Agent ihn versucht.
Prüfen Sie für Twilio den Transport immer ausdrücklich vorab, wenn der Standardtransport Chrome ist:
openclaw googlemeet setup --transport twilio
Das erkennt fehlende voice-call-Verdrahtung, Twilio-Zugangsdaten oder nicht
erreichbare Webhook-Bereitstellung, bevor der Agent versucht, das Meeting
anzuwählen.
Einem Meeting beitreten:
openclaw googlemeet join https://meet.google.com/abc-defg-hij
Oder lassen Sie einen Agent über das google_meet-Tool beitreten:
{
"action": "join",
"url": "https://meet.google.com/abc-defg-hij",
"transport": "chrome-node",
"mode": "agent"
}
Das agentenseitige google_meet-Tool bleibt auf Nicht-macOS-Hosts für Artefakt-,
Kalender-, Setup-, Transkriptions-, Twilio- und chrome-node-Flows verfügbar.
Lokale Chrome-Antwortaktionen werden dort blockiert, weil der gebündelte Chrome-
Audiopfad derzeit von macOS BlackHole 2ch abhängt. Verwenden Sie unter Linux
mode: "transcribe", Twilio-Einwahl oder einen macOS-chrome-node-Host für
Chrome-Antwortteilnahme.
Ein neues Meeting erstellen und beitreten:
openclaw googlemeet create --transport chrome-node --mode agent
Verwenden Sie für API-erstellte Räume Google Meet SpaceConfig.accessType, wenn
Sie möchten, dass die No-Knock-Richtlinie des Raums explizit ist, statt aus den
Standardwerten des Google-Kontos übernommen zu werden:
openclaw googlemeet create --access-type OPEN --transport chrome-node --mode agent
OPEN erlaubt allen Personen mit der Meet-URL den Beitritt ohne Anklopfen.
TRUSTED erlaubt vertrauenswürdigen Nutzern der Host-Organisation, eingeladenen
externen Nutzern und Einwahlnutzern den Beitritt ohne Anklopfen. RESTRICTED
beschränkt den No-Knock-Zutritt auf Eingeladene. Diese Einstellungen gelten nur
für den offiziellen Erstellungspfad der Google Meet API, daher müssen OAuth-
Zugangsdaten konfiguriert sein.
Wenn Sie Google Meet authentifiziert haben, bevor diese Option verfügbar war,
führen Sie openclaw googlemeet auth login --json erneut aus, nachdem Sie den
Scope meetings.space.settings zu Ihrem Google OAuth-Zustimmungsbildschirm
hinzugefügt haben.
Nur die URL erstellen, ohne beizutreten:
openclaw googlemeet create --no-join
googlemeet create hat zwei Pfade:
- API-Erstellung: Wird verwendet, wenn Google Meet OAuth-Zugangsdaten konfiguriert sind. Dies ist der deterministischste Pfad und hängt nicht vom Browser-UI-Zustand ab.
- Browser-Fallback: Wird verwendet, wenn OAuth-Zugangsdaten fehlen. OpenClaw verwendet den
gepinnten Chrome-Node, öffnet
https://meet.google.com/new, wartet, bis Google zu einer echten Meeting-Code-URL weiterleitet, und gibt dann diese URL zurück. Dieser Pfad erfordert, dass das OpenClaw Chrome-Profil auf dem Node bereits bei Google angemeldet ist. Browserautomatisierung verarbeitet Meets eigene Erststart- Mikrofonabfrage; diese Abfrage wird nicht als Google-Anmeldefehler behandelt. Beitritts- und Erstellungs-Flows versuchen außerdem, einen bestehenden Meet-Tab wiederzuverwenden, bevor sie einen neuen öffnen. Der Abgleich ignoriert harmlose URL-Abfragezeichenfolgen wieauthuser, sodass ein erneuter Agent-Versuch das bereits geöffnete Meeting fokussieren sollte, statt einen zweiten Chrome-Tab zu erstellen.
Die Befehls-/Toolausgabe enthält ein source-Feld (api oder browser), damit
Agents erklären können, welcher Pfad verwendet wurde. create tritt dem neuen
Meeting standardmäßig bei und gibt joined: true plus die Beitrittssitzung
zurück. Um nur die URL zu erzeugen, verwenden Sie in der CLI create --no-join
oder übergeben Sie dem Tool "join": false.
Oder sagen Sie einem Agent: „Erstellen Sie ein Google Meet, treten Sie ihm im
Agent-Antwortmodus bei und senden Sie mir den Link.“ Der Agent sollte
google_meet mit action: "create" aufrufen und dann die zurückgegebene
meetingUri teilen.
{
"action": "create",
"transport": "chrome-node",
"mode": "agent"
}
Für einen reinen Beobachtungs-/Browsersteuerungsbeitritt setzen Sie
"mode": "transcribe". Dadurch wird die Duplex-Echtzeit-Sprach-Bridge nicht
gestartet, BlackHole oder SoX sind nicht erforderlich, und es wird nicht in das
Meeting zurückgesprochen. Chrome-Beitritte in diesem Modus vermeiden außerdem
OpenClaws Mikrofon-/Kameraberechtigungserteilung und den Meet-Pfad Mikrofon
verwenden. Wenn Meet einen Zwischenschritt zur Audioauswahl anzeigt, versucht
die Automatisierung den Pfad ohne Mikrofon und meldet andernfalls eine manuelle
Aktion, statt das lokale Mikrofon zu öffnen. Im Transkriptionsmodus installieren
verwaltete Chrome-Transporte außerdem einen Best-Effort-Meet-Untertitelbeobachter.
googlemeet status --json und googlemeet doctor zeigen captioning,
captionsEnabledAttempted, transcriptLines, lastCaptionAt,
lastCaptionSpeaker, lastCaptionText und einen kurzen
recentTranscript-Auszug, damit Operatoren erkennen können, ob der Browser dem
Anruf beigetreten ist und ob Meet-Untertitel Text produzieren.
Verwenden Sie openclaw googlemeet test-listen <meet-url> --transport chrome-node,
wenn Sie eine Ja/Nein-Prüfung benötigen: Der Befehl tritt im Transkriptionsmodus
bei, wartet auf frische Untertitel- oder Transkriptbewegung und gibt
listenVerified, listenTimedOut, Felder für manuelle Aktionen sowie den
aktuellen Untertitelzustand zurück.
Während Echtzeitsitzungen enthält der google_meet-Status Browser- und Audio-
Bridge-Zustand wie inCall, manualActionRequired, providerConnected,
realtimeReady, audioInputActive, audioOutputActive, letzte Eingabe-/
Ausgabezeitstempel, Bytezähler und den geschlossenen Bridge-Zustand. Wenn eine
sichere Meet-Seitenabfrage erscheint, verarbeitet die Browserautomatisierung sie,
wenn sie kann. Anmeldung, Host-Zulassung und Browser-/OS-Berechtigungsabfragen
werden als manuelle Aktion mit Grund und Nachricht gemeldet, die der Agent
weitergeben kann. Verwaltete Chrome-Sitzungen geben die Intro- oder Testphrase
erst aus, nachdem der Browserzustand inCall: true meldet; andernfalls meldet
der Status speechReady: false, und der Sprechversuch wird blockiert, statt
vorzugeben, der Agent hätte in das Meeting gesprochen.
Lokale Chrome-Beitritte erfolgen über das angemeldete OpenClaw-Browserprofil.
Der Echtzeitmodus erfordert BlackHole 2ch für den von OpenClaw verwendeten
Mikrofon-/Lautsprecherpfad. Für sauberes Duplex-Audio verwenden Sie getrennte
virtuelle Geräte oder einen Loopback-artigen Graphen; ein einzelnes BlackHole-
Gerät reicht für einen ersten Smoke-Test aus, kann aber ein Echo erzeugen.
Lokaler Gateway + Parallels Chrome
Sie benötigen keinen vollständigen OpenClaw Gateway oder Modell-API-Schlüssel innerhalb einer macOS-VM, nur damit die VM Chrome besitzt. Führen Sie Gateway und Agent lokal aus und starten Sie dann einen Node-Host in der VM. Aktivieren Sie das gebündelte Plugin in der VM einmal, damit der Node den Chrome-Befehl ankündigt:
Was wo ausgeführt wird:
- Gateway-Host: OpenClaw Gateway, Agent-Arbeitsbereich, Modell-/API-Schlüssel, Echtzeit- Provider und die Google Meet-Plugin-Konfiguration.
- Parallels-macOS-VM: OpenClaw CLI/Node-Host, Google Chrome, SoX, BlackHole 2ch und ein bei Google angemeldetes Chrome-Profil.
- In der VM nicht benötigt: Gateway-Dienst, Agent-Konfiguration, OpenAI/GPT-Schlüssel oder Modell- Provider-Einrichtung.
Installieren Sie die VM-Abhängigkeiten:
brew install blackhole-2ch sox
Starten Sie die VM nach der Installation von BlackHole neu, damit macOS
BlackHole 2ch bereitstellt:
sudo reboot
Überprüfen Sie nach dem Neustart, dass die VM das Audiogerät und die SoX-Befehle sehen kann:
system_profiler SPAudioDataType | grep -i BlackHole
command -v sox
Installieren oder aktualisieren Sie OpenClaw in der VM und aktivieren Sie dann dort das gebündelte Plugin:
openclaw plugins enable google-meet
Starten Sie den Node-Host in der VM:
openclaw node run --host <gateway-host> --port 18789 --display-name parallels-macos
Wenn <gateway-host> eine LAN-IP ist und Sie TLS nicht verwenden, verweigert der
Node den Klartext-WebSocket, sofern Sie sich für dieses vertrauenswürdige private
Netzwerk nicht ausdrücklich entscheiden:
OPENCLAW_ALLOW_INSECURE_PRIVATE_WS=1 \
openclaw node run --host <gateway-lan-ip> --port 18789 --display-name parallels-macos
Verwenden Sie dieselbe Umgebungsvariable, wenn Sie den Node als LaunchAgent installieren:
OPENCLAW_ALLOW_INSECURE_PRIVATE_WS=1 \
openclaw node install --host <gateway-lan-ip> --port 18789 --display-name parallels-macos --force
openclaw node restart
OPENCLAW_ALLOW_INSECURE_PRIVATE_WS=1 ist eine Prozessumgebung, keine
openclaw.json-Einstellung. openclaw node install speichert sie in der
LaunchAgent-Umgebung, wenn sie beim Installationsbefehl vorhanden ist.
Genehmigen Sie den Node vom Gateway-Host aus:
openclaw devices list
openclaw devices approve <requestId>
Bestätigen Sie, dass der Gateway den Node sieht und dass er sowohl
googlemeet.chrome als auch Browserfähigkeit/browser.proxy ankündigt:
openclaw nodes status
Leiten Sie Meet auf dem Gateway-Host durch diesen Node:
{
gateway: {
nodes: {
allowCommands: ["googlemeet.chrome", "browser.proxy"],
},
},
plugins: {
entries: {
"google-meet": {
enabled: true,
config: {
defaultTransport: "chrome-node",
chrome: {
guestName: "OpenClaw Agent",
autoJoin: true,
reuseExistingTab: true,
},
chromeNode: {
node: "parallels-macos",
},
},
},
},
},
}
Treten Sie nun wie gewohnt vom Gateway-Host aus bei:
openclaw googlemeet join https://meet.google.com/abc-defg-hij
oder bitten Sie den Agent, das google_meet-Tool mit
transport: "chrome-node" zu verwenden.
Für einen Smoke-Test mit einem Befehl, der eine Sitzung erstellt oder wiederverwendet, eine bekannte Phrase spricht und den Sitzungszustand ausgibt:
openclaw googlemeet test-speech https://meet.google.com/abc-defg-hij
Beim Realtime-Beitritt füllt die OpenClaw-Browserautomatisierung den Gastnamen aus, klickt auf
Beitreten/Beitrittsanfrage stellen und akzeptiert Meets erste Option „Mikrofon verwenden“, wenn diese
Eingabeaufforderung erscheint. Beim reinen Beobachtungsbeitritt oder bei der browserbasierten Meeting-Erstellung fährt sie
an derselben Eingabeaufforderung ohne Mikrofon fort, wenn diese Option verfügbar ist.
Wenn das Browserprofil nicht angemeldet ist, Meet auf die Zulassung durch den Host wartet,
Chrome für einen Realtime-Beitritt Mikrofon-/Kameraberechtigungen benötigt oder Meet bei
einer Eingabeaufforderung hängen bleibt, die die Automatisierung nicht auflösen konnte, meldet das join/test-speech-Ergebnis
manualActionRequired: true mit manualActionReason und
manualActionMessage. Agenten sollten keine weiteren Beitrittsversuche unternehmen, genau diese
Meldung plus die aktuelle browserUrl/browserTitle melden und erst erneut versuchen, wenn die
manuelle Browseraktion abgeschlossen ist.
Wenn chromeNode.node ausgelassen wird, wählt OpenClaw nur dann automatisch aus, wenn genau ein
verbundener Node sowohl googlemeet.chrome als auch Browsersteuerung ankündigt. Wenn
mehrere geeignete Nodes verbunden sind, setzen Sie chromeNode.node auf die Node-ID,
den Anzeigenamen oder die Remote-IP.
Häufige Fehlerprüfungen:
Configured Google Meet node ... is not usable: offline: Der festgelegte Node ist dem Gateway bekannt, aber nicht verfügbar. Agenten sollten diesen Node als Diagnosestatus behandeln, nicht als nutzbaren Chrome-Host, und den Setup-Blocker melden, statt auf einen anderen Transport zurückzufallen, sofern der Benutzer dies nicht angefordert hat.No connected Google Meet-capable node: Starten Sieopenclaw node runin der VM, genehmigen Sie das Pairing und stellen Sie sicher, dassopenclaw plugins enable google-meetundopenclaw plugins enable browserin der VM ausgeführt wurden. Bestätigen Sie außerdem, dass der Gateway-Host beide Node-Befehle mitgateway.nodes.allowCommands: ["googlemeet.chrome", "browser.proxy"]erlaubt.BlackHole 2ch audio device not found: Installieren Sieblackhole-2chauf dem geprüften Host und starten Sie neu, bevor Sie lokales Chrome-Audio verwenden.BlackHole 2ch audio device not found on the node: Installieren Sieblackhole-2chin der VM und starten Sie die VM neu.- Chrome öffnet sich, kann aber nicht beitreten: Melden Sie sich im Browserprofil innerhalb der VM an, oder
lassen Sie
chrome.guestNamefür den Gastbeitritt gesetzt. Der automatische Gastbeitritt verwendet die OpenClaw- Browserautomatisierung über den Node-Browser-Proxy; stellen Sie sicher, dass die Node-Browser- Konfiguration auf das gewünschte Profil zeigt, zum Beispielbrowser.defaultProfile: "user"oder ein benanntes bestehendes Sitzungsprofil. - Doppelte Meet-Tabs: Lassen Sie
chrome.reuseExistingTab: trueaktiviert. OpenClaw aktiviert einen bestehenden Tab für dieselbe Meet-URL, bevor ein neuer geöffnet wird, und die browserbasierte Meeting-Erstellung verwendet einen laufendenhttps://meet.google.com/new- oder Google-Konto-Eingabeaufforderungstab wieder, bevor ein weiterer geöffnet wird. - Kein Audio: Leiten Sie in Meet Mikrofon-/Lautsprecher-Audio über den von OpenClaw verwendeten Pfad des virtuellen Audiogeräts; verwenden Sie separate virtuelle Geräte oder Loopback-ähnliches Routing für sauberes Duplex-Audio.
Installationshinweise
Die Standard-Talkback-Funktion von Chrome verwendet zwei externe Tools:
sox: Kommandozeilen-Audio-Dienstprogramm. Das Plugin verwendet explizite CoreAudio- Gerätebefehle für die standardmäßige 24-kHz-PCM16-Audiobrücke.blackhole-2ch: virtueller macOS-Audiotreiber. Er erstellt das AudiogerätBlackHole 2ch, über das Chrome/Meet routen kann.
OpenClaw bündelt oder verteilt keines der beiden Pakete. Die Dokumentation fordert Benutzer auf,
sie als Host-Abhängigkeiten über Homebrew zu installieren. SoX ist lizenziert als
LGPL-2.0-only AND GPL-2.0-only; BlackHole ist GPL-3.0. Wenn Sie einen
Installer oder eine Appliance erstellen, die BlackHole mit OpenClaw bündelt, prüfen Sie die
Upstream-Lizenzbedingungen von BlackHole oder beziehen Sie eine separate Lizenz von Existential Audio.
Transporte
Chrome
Der Chrome-Transport öffnet die Meet-URL über die OpenClaw-Browsersteuerung und tritt
als angemeldetes OpenClaw-Browserprofil bei. Unter macOS prüft das Plugin vor dem Start auf
BlackHole 2ch. Wenn konfiguriert, führt es außerdem vor dem Öffnen von Chrome einen Audiobrücken-
Health-Befehl und einen Startbefehl aus. Verwenden Sie chrome, wenn
Chrome/Audio auf dem Gateway-Host laufen; verwenden Sie chrome-node, wenn Chrome/Audio auf
einem gekoppelten Node wie einer Parallels-macOS-VM laufen. Wählen Sie für lokales Chrome das
Profil mit browser.defaultProfile; chrome.browserProfile wird an
chrome-node-Hosts übergeben.
openclaw googlemeet join https://meet.google.com/abc-defg-hij --transport chrome
openclaw googlemeet join https://meet.google.com/abc-defg-hij --transport chrome-node
Leiten Sie Chrome-Mikrofon- und Lautsprecheraudio über die lokale OpenClaw-Audiobrücke.
Wenn BlackHole 2ch nicht installiert ist, schlägt der Beitritt mit einem Setup-Fehler fehl,
statt stillschweigend ohne Audiopfad beizutreten.
Twilio
Der Twilio-Transport ist ein strikter Wählplan, der an das Voice Call Plugin delegiert wird. Er parst keine Meet-Seiten nach Telefonnummern.
Verwenden Sie dies, wenn eine Chrome-Teilnahme nicht verfügbar ist oder Sie einen Telefon-Einwahl- Fallback wünschen. Google Meet muss für das Meeting eine Telefon-Einwahlnummer und PIN bereitstellen; OpenClaw ermittelt diese nicht aus der Meet-Seite.
Aktivieren Sie das Voice Call Plugin auf dem Gateway-Host, nicht auf dem Chrome-Node:
{
plugins: {
allow: ["google-meet", "voice-call", "google"],
entries: {
"google-meet": {
enabled: true,
config: {
defaultTransport: "chrome-node",
// or set "twilio" if Twilio should be the default
},
},
"voice-call": {
enabled: true,
config: {
provider: "twilio",
inboundPolicy: "allowlist",
realtime: {
enabled: true,
provider: "google",
instructions: "Join this Google Meet as an OpenClaw agent. Be brief.",
toolPolicy: "safe-read-only",
providers: {
google: {
silenceDurationMs: 500,
startSensitivity: "high",
},
},
},
},
},
google: {
enabled: true,
},
},
},
}
Stellen Sie Twilio-Anmeldedaten über Umgebung oder Konfiguration bereit. Die Umgebung hält
Geheimnisse aus openclaw.json heraus:
export TWILIO_ACCOUNT_SID=AC...
export TWILIO_AUTH_TOKEN=...
export TWILIO_FROM_NUMBER=+15550001234
export GEMINI_API_KEY=...
Verwenden Sie stattdessen realtime.provider: "openai" mit dem OpenAI-Provider-Plugin und
OPENAI_API_KEY, wenn dies Ihr Realtime-Voice-Provider ist.
Starten oder laden Sie das Gateway nach dem Aktivieren von voice-call neu; Änderungen an der Plugin-Konfiguration
erscheinen in einem bereits laufenden Gateway-Prozess erst nach dem Neuladen.
Prüfen Sie dann:
openclaw config validate
openclaw plugins list | grep -E 'google-meet|voice-call'
openclaw googlemeet setup
Wenn die Twilio-Delegation verbunden ist, enthält googlemeet setup erfolgreiche Prüfungen für
twilio-voice-call-plugin, twilio-voice-call-credentials und
twilio-voice-call-webhook.
openclaw googlemeet join https://meet.google.com/abc-defg-hij \
--transport twilio \
--dial-in-number +15551234567 \
--pin 123456
Verwenden Sie --dtmf-sequence, wenn das Meeting eine benutzerdefinierte Sequenz benötigt:
openclaw googlemeet join https://meet.google.com/abc-defg-hij \
--transport twilio \
--dial-in-number +15551234567 \
--dtmf-sequence ww123456#
OAuth und Preflight
OAuth ist zum Erstellen eines Meet-Links optional, weil googlemeet create auf
Browserautomatisierung zurückfallen kann. Konfigurieren Sie OAuth, wenn Sie offizielle API-Erstellung,
Space-Auflösung oder Preflight-Prüfungen der Meet Media API wünschen.
Der Google Meet API-Zugriff verwendet Benutzer-OAuth: Erstellen Sie einen Google Cloud OAuth-Client,
fordern Sie die erforderlichen Scopes an, autorisieren Sie ein Google-Konto und speichern Sie anschließend das
resultierende Refresh-Token in der Google Meet Plugin-Konfiguration oder stellen Sie die
Umgebungsvariablen OPENCLAW_GOOGLE_MEET_* bereit.
OAuth ersetzt den Chrome-Beitrittspfad nicht. Chrome- und Chrome-node-Transporte treten weiterhin über ein angemeldetes Chrome-Profil, BlackHole/SoX und einen verbundenen Node bei, wenn Sie Browserteilnahme verwenden. OAuth gilt nur für den offiziellen Google Meet API-Pfad: Meeting-Spaces erstellen, Spaces auflösen und Preflight-Prüfungen der Meet Media API ausführen.
Google-Anmeldedaten erstellen
In der Google Cloud Console:
-
Erstellen oder wählen Sie ein Google Cloud-Projekt aus.
-
Aktivieren Sie Google Meet REST API für dieses Projekt.
-
Konfigurieren Sie den OAuth-Zustimmungsbildschirm.
- Intern ist für eine Google Workspace-Organisation am einfachsten.
- Extern funktioniert für persönliche/Test-Setups; solange sich die App im Testmodus befindet, fügen Sie jedes Google-Konto, das die App autorisieren soll, als Testbenutzer hinzu.
-
Fügen Sie die von OpenClaw angeforderten Scopes hinzu:
https://www.googleapis.com/auth/meetings.space.createdhttps://www.googleapis.com/auth/meetings.space.readonlyhttps://www.googleapis.com/auth/meetings.space.settingshttps://www.googleapis.com/auth/meetings.conference.media.readonly
-
Erstellen Sie eine OAuth-Client-ID.
-
Anwendungstyp: Webanwendung.
-
Autorisierte Weiterleitungs-URI:
http://localhost:8085/oauth2callback
-
-
Kopieren Sie die Client-ID und das Client-Secret.
meetings.space.created wird von Google Meet spaces.create benötigt.
meetings.space.readonly ermöglicht OpenClaw, Meet-URLs/-Codes zu Spaces aufzulösen.
meetings.space.settings ermöglicht OpenClaw, SpaceConfig-Einstellungen wie
accessType während der API-Raumerstellung zu übergeben.
meetings.conference.media.readonly ist für Preflight der Meet Media API und Medienarbeit
vorgesehen; Google kann für die tatsächliche Nutzung der Media API eine Developer-Preview-Registrierung verlangen.
Wenn Sie nur browserbasierte Chrome-Beitritte benötigen, überspringen Sie OAuth vollständig.
Refresh-Token ausstellen
Konfigurieren Sie oauth.clientId und optional oauth.clientSecret, oder übergeben Sie sie als
Umgebungsvariablen, und führen Sie dann aus:
openclaw googlemeet auth login --json
Der Befehl gibt einen oauth-Konfigurationsblock mit einem Refresh-Token aus. Er verwendet PKCE,
einen localhost-Callback unter http://localhost:8085/oauth2callback und einen manuellen
Kopieren/Einfügen-Ablauf mit --manual.
Beispiele:
OPENCLAW_GOOGLE_MEET_CLIENT_ID="your-client-id" \
OPENCLAW_GOOGLE_MEET_CLIENT_SECRET="your-client-secret" \
openclaw googlemeet auth login --json
Verwenden Sie den manuellen Modus, wenn der Browser den lokalen Callback nicht erreichen kann:
OPENCLAW_GOOGLE_MEET_CLIENT_ID="your-client-id" \
OPENCLAW_GOOGLE_MEET_CLIENT_SECRET="your-client-secret" \
openclaw googlemeet auth login --json --manual
Die JSON-Ausgabe enthält:
{
"oauth": {
"clientId": "your-client-id",
"clientSecret": "your-client-secret",
"refreshToken": "refresh-token",
"accessToken": "access-token",
"expiresAt": 1770000000000
},
"scope": "..."
}
Speichern Sie das oauth-Objekt unter der Google Meet Plugin-Konfiguration:
{
plugins: {
entries: {
"google-meet": {
enabled: true,
config: {
oauth: {
clientId: "your-client-id",
clientSecret: "your-client-secret",
refreshToken: "refresh-token",
},
},
},
},
},
}
Bevorzugen Sie Umgebungsvariablen, wenn Sie das Refresh-Token nicht in der Konfiguration haben möchten. Wenn sowohl Konfigurations- als auch Umgebungswerte vorhanden sind, löst das Plugin zuerst die Konfiguration und dann den Umgebungs-Fallback auf.
Die OAuth-Zustimmung umfasst Meet-Space-Erstellung, Lesezugriff auf Meet-Spaces und Lesezugriff auf Meet-
Konferenzmedien. Wenn Sie sich authentifiziert haben, bevor Unterstützung für die Meeting-Erstellung
existierte, führen Sie openclaw googlemeet auth login --json erneut aus, damit das Refresh-
Token den Scope meetings.space.created hat.
OAuth mit doctor prüfen
Führen Sie den OAuth-doctor aus, wenn Sie eine schnelle, nicht geheime Health-Prüfung wünschen:
openclaw googlemeet doctor --oauth --json
Dies lädt die Chrome-Runtime nicht und erfordert keinen verbundenen Chrome-Node. Es
prüft, dass OAuth-Konfiguration vorhanden ist und dass das Refresh-Token ein Access-
Token ausstellen kann. Der JSON-Bericht enthält nur Statusfelder wie ok, configured,
tokenSource, expiresAt und Prüfnachrichten; er gibt weder das Access-
Token noch das Refresh-Token oder Client-Secret aus.
Häufige Ergebnisse:
| Prüfung | Bedeutung |
|---|---|
oauth-config |
oauth.clientId plus oauth.refreshToken oder ein zwischengespeichertes Zugriffstoken ist vorhanden. |
oauth-token |
Das zwischengespeicherte Zugriffstoken ist noch gültig, oder das Refresh-Token hat ein neues Zugriffstoken ausgestellt. |
meet-spaces-get |
Die optionale Prüfung --meeting hat einen vorhandenen Meet-Space aufgelöst. |
meet-spaces-create |
Die optionale Prüfung --create-space hat einen neuen Meet-Space erstellt. |
Um auch die Aktivierung der Google Meet API und den Scope spaces.create nachzuweisen, führen Sie die
erstellende Prüfung mit Nebeneffekt aus:
openclaw googlemeet doctor --oauth --create-space --json
openclaw googlemeet create --no-join --json
--create-space erstellt eine Wegwerf-Meet-URL. Verwenden Sie dies, wenn Sie bestätigen müssen,
dass für das Google Cloud-Projekt die Meet API aktiviert ist und das autorisierte
Konto über den Scope meetings.space.created verfügt.
Um Lesezugriff für einen vorhandenen Meeting-Space nachzuweisen:
openclaw googlemeet doctor --oauth --meeting https://meet.google.com/abc-defg-hij --json
openclaw googlemeet resolve-space --meeting https://meet.google.com/abc-defg-hij
doctor --oauth --meeting und resolve-space weisen Lesezugriff auf einen vorhandenen
Space nach, auf den das autorisierte Google-Konto zugreifen kann. Ein 403 aus diesen Prüfungen
bedeutet normalerweise, dass die Google Meet REST API deaktiviert ist, dem zugestimmten Refresh-Token
der erforderliche Scope fehlt oder das Google-Konto nicht auf diesen Meet-Space zugreifen kann.
Ein Refresh-Token-Fehler bedeutet, dass Sie openclaw googlemeet auth login --json erneut ausführen und den neuen oauth-Block speichern müssen.
Für den Browser-Fallback sind keine OAuth-Anmeldedaten erforderlich. In diesem Modus stammt die Google- Authentifizierung aus dem angemeldeten Chrome-Profil auf dem ausgewählten Node, nicht aus der OpenClaw-Konfiguration.
Diese Umgebungsvariablen werden als Fallbacks akzeptiert:
OPENCLAW_GOOGLE_MEET_CLIENT_IDoderGOOGLE_MEET_CLIENT_IDOPENCLAW_GOOGLE_MEET_CLIENT_SECREToderGOOGLE_MEET_CLIENT_SECRETOPENCLAW_GOOGLE_MEET_REFRESH_TOKENoderGOOGLE_MEET_REFRESH_TOKENOPENCLAW_GOOGLE_MEET_ACCESS_TOKENoderGOOGLE_MEET_ACCESS_TOKENOPENCLAW_GOOGLE_MEET_ACCESS_TOKEN_EXPIRES_AToderGOOGLE_MEET_ACCESS_TOKEN_EXPIRES_ATOPENCLAW_GOOGLE_MEET_DEFAULT_MEETINGoderGOOGLE_MEET_DEFAULT_MEETINGOPENCLAW_GOOGLE_MEET_PREVIEW_ACKoderGOOGLE_MEET_PREVIEW_ACK
Lösen Sie eine Meet-URL, einen Code oder spaces/{id} über spaces.get auf:
openclaw googlemeet resolve-space --meeting https://meet.google.com/abc-defg-hij
Führen Sie vor Medienarbeit den Preflight aus:
openclaw googlemeet preflight --meeting https://meet.google.com/abc-defg-hij
Listen Sie Meeting-Artefakte und Anwesenheit auf, nachdem Meet Konferenzdatensätze erstellt hat:
openclaw googlemeet artifacts --meeting https://meet.google.com/abc-defg-hij
openclaw googlemeet attendance --meeting https://meet.google.com/abc-defg-hij
openclaw googlemeet export --meeting https://meet.google.com/abc-defg-hij --output ./meet-export
Mit --meeting verwenden artifacts und attendance standardmäßig den neuesten Konferenzdatensatz.
Übergeben Sie --all-conference-records, wenn Sie alle aufbewahrten Datensätze
für dieses Meeting wünschen.
Die Kalendersuche kann die Meeting-URL aus Google Calendar auflösen, bevor Meet-Artefakte gelesen werden:
openclaw googlemeet latest --today
openclaw googlemeet calendar-events --today --json
openclaw googlemeet artifacts --event "Weekly sync"
openclaw googlemeet attendance --today --format csv --output attendance.csv
--today durchsucht den heutigen primary-Kalender nach einem Calendar-Ereignis mit einem
Google Meet-Link. Verwenden Sie --event <query>, um passenden Ereignistext zu suchen, und
--calendar <id> für einen nicht primären Kalender. Die Kalendersuche erfordert eine frische
OAuth-Anmeldung, die den schreibgeschützten Calendar-Events-Scope einschließt.
calendar-events zeigt die passenden Meet-Ereignisse in der Vorschau an und markiert das Ereignis, das
latest, artifacts, attendance oder export auswählen wird.
Wenn Sie die Konferenzdatensatz-ID bereits kennen, adressieren Sie sie direkt:
openclaw googlemeet latest --meeting https://meet.google.com/abc-defg-hij
openclaw googlemeet artifacts --conference-record conferenceRecords/abc123 --json
openclaw googlemeet attendance --conference-record conferenceRecords/abc123 --json
Beenden Sie eine aktive Konferenz für einen per API erstellten Space, wenn Sie den Raum nach dem Anruf schließen möchten:
openclaw googlemeet end-active-conference https://meet.google.com/abc-defg-hij
Dies ruft Google Meet spaces.endActiveConference auf und erfordert OAuth mit dem
Scope meetings.space.created für einen Space, den das autorisierte Konto verwalten kann.
OpenClaw akzeptiert eine Meet-URL, einen Meeting-Code oder eine spaces/{id}-Eingabe und löst sie
in die API-Space-Ressource auf, bevor die aktive Konferenz beendet wird.
Dies ist getrennt von googlemeet leave: leave stoppt die lokale/Sitzungs-
Teilnahme von OpenClaw, während end-active-conference Google Meet auffordert, die aktive
Konferenz für den Space zu beenden.
Schreiben Sie einen lesbaren Bericht:
openclaw googlemeet artifacts --conference-record conferenceRecords/abc123 \
--format markdown --output meet-artifacts.md
openclaw googlemeet attendance --conference-record conferenceRecords/abc123 \
--format markdown --output meet-attendance.md
openclaw googlemeet attendance --conference-record conferenceRecords/abc123 \
--format csv --output meet-attendance.csv
openclaw googlemeet export --conference-record conferenceRecords/abc123 \
--include-doc-bodies --zip --output meet-export
openclaw googlemeet export --conference-record conferenceRecords/abc123 \
--include-doc-bodies --dry-run
artifacts gibt Metadaten des Konferenzdatensatzes sowie Ressourcenmetadaten zu Teilnehmern, Aufzeichnungen,
Transkripten, strukturierten Transkripteinträgen und Smart Notes zurück, wenn
Google sie für das Meeting bereitstellt. Verwenden Sie --no-transcript-entries, um die
Eintragssuche bei großen Meetings zu überspringen. attendance erweitert Teilnehmer zu
Teilnehmersitzungszeilen mit Zeiten für erstes/letztes Auftreten, Gesamtsitzungsdauer,
Markierungen für Verspätung/frühes Verlassen sowie zusammengeführten doppelten Teilnehmerressourcen nach angemeldetem
Benutzer oder Anzeigename. Übergeben Sie --no-merge-duplicates, um unverarbeitete Teilnehmerressourcen
getrennt zu halten, --late-after-minutes, um die Erkennung von Verspätungen anzupassen, und
--early-before-minutes, um die Erkennung von frühem Verlassen anzupassen.
export schreibt einen Ordner mit summary.md, attendance.csv,
transcript.md, artifacts.json, attendance.json und manifest.json.
manifest.json zeichnet die gewählte Eingabe, Exportoptionen, Konferenzdatensätze,
Ausgabedateien, Zählwerte, Token-Quelle, das Calendar-Ereignis, sofern eines verwendet wurde, sowie alle
Warnungen zu teilweisen Abruffehlern auf. Übergeben Sie --zip, um zusätzlich ein portables Archiv neben
den Ordner zu schreiben. Übergeben Sie --include-doc-bodies, um verknüpften Transkript- und
Smart-Note-Google-Docs-Text über Google Drive files.export zu exportieren; dies erfordert eine
frische OAuth-Anmeldung, die den schreibgeschützten Drive-Meet-Scope einschließt. Ohne
--include-doc-bodies enthalten Exporte nur Meet-Metadaten und strukturierte Transkript-
Einträge. Wenn Google einen teilweisen Artefaktfehler zurückgibt, etwa einen Smart-Note-
Listing-, Transkripteintrags- oder Drive-Dokumentkörper-Fehler, behalten Zusammenfassung und
Manifest die Warnung bei, statt den gesamten Export fehlschlagen zu lassen.
Verwenden Sie --dry-run, um dieselben Artefakt-/Anwesenheitsdaten abzurufen und das
Manifest-JSON auszugeben, ohne den Ordner oder die ZIP-Datei zu erstellen. Das ist nützlich, bevor Sie
einen großen Export schreiben oder wenn ein Agent nur Zählwerte, ausgewählte Datensätze und
Warnungen benötigt.
Agenten können dasselbe Bundle auch über das Tool google_meet erstellen:
{
"action": "export",
"conferenceRecord": "conferenceRecords/abc123",
"includeDocumentBodies": true,
"outputDir": "meet-export",
"zip": true
}
Setzen Sie "dryRun": true, um nur das Exportmanifest zurückzugeben und Dateischreibvorgänge zu überspringen.
Agenten können auch einen API-gestützten Raum mit einer expliziten Zugriffsrichtlinie erstellen:
{
"action": "create",
"transport": "chrome-node",
"mode": "agent",
"accessType": "OPEN"
}
Und sie können die aktive Konferenz für einen bekannten Raum beenden:
{
"action": "end_active_conference",
"meeting": "https://meet.google.com/abc-defg-hij"
}
Für eine listen-first-Validierung sollten Agenten test_listen verwenden, bevor sie behaupten, dass das
Meeting nützlich ist:
{
"action": "test_listen",
"url": "https://meet.google.com/abc-defg-hij",
"transport": "chrome-node",
"timeoutMs": 30000
}
Führen Sie den geschützten Live-Smoke gegen ein echtes aufbewahrtes Meeting aus:
OPENCLAW_LIVE_TEST=1 \
OPENCLAW_GOOGLE_MEET_LIVE_MEETING=https://meet.google.com/abc-defg-hij \
pnpm test:live -- extensions/google-meet/google-meet.live.test.ts
Führen Sie die Live-Browser-Prüfung mit listen-first gegen ein Meeting aus, in dem jemand sprechen wird und Meet-Untertitel verfügbar sind:
openclaw googlemeet setup --transport chrome-node --mode transcribe
openclaw googlemeet test-listen https://meet.google.com/abc-defg-hij --transport chrome-node --timeout-ms 30000
Live-Smoke-Umgebung:
OPENCLAW_LIVE_TEST=1aktiviert geschützte Live-Tests.OPENCLAW_GOOGLE_MEET_LIVE_MEETINGverweist auf eine aufbewahrte Meet-URL, einen Code oderspaces/{id}.OPENCLAW_GOOGLE_MEET_CLIENT_IDoderGOOGLE_MEET_CLIENT_IDstellt die OAuth- Client-ID bereit.OPENCLAW_GOOGLE_MEET_REFRESH_TOKENoderGOOGLE_MEET_REFRESH_TOKENstellt das Refresh-Token bereit.- Optional:
OPENCLAW_GOOGLE_MEET_CLIENT_SECRET,OPENCLAW_GOOGLE_MEET_ACCESS_TOKENundOPENCLAW_GOOGLE_MEET_ACCESS_TOKEN_EXPIRES_ATverwenden dieselben Fallback-Namen ohne das PräfixOPENCLAW_.
Der grundlegende Live-Smoke für Artefakte/Anwesenheit benötigt
https://www.googleapis.com/auth/meetings.space.readonly und
https://www.googleapis.com/auth/meetings.conference.media.readonly. Die Kalendersuche
benötigt https://www.googleapis.com/auth/calendar.events.readonly. Der Export von
Dokumentkörpern aus Drive benötigt
https://www.googleapis.com/auth/drive.meet.readonly.
Erstellen Sie einen frischen Meet-Space:
openclaw googlemeet create
Der Befehl gibt die neue meeting uri, die Quelle und die Beitrittssitzung aus. Mit OAuth-
Anmeldedaten verwendet er die offizielle Google Meet API. Ohne OAuth-Anmeldedaten
verwendet er als Fallback das angemeldete Browserprofil des angehefteten Chrome-Node. Agenten können
das Tool google_meet mit action: "create" verwenden, um in einem Schritt zu erstellen und beizutreten.
Für eine reine URL-Erstellung übergeben Sie "join": false.
Beispiel-JSON-Ausgabe aus dem Browser-Fallback:
{
"source": "browser",
"meetingUri": "https://meet.google.com/abc-defg-hij",
"joined": true,
"browser": {
"nodeId": "ba0f4e4bc...",
"targetId": "tab-1"
},
"join": {
"session": {
"id": "meet_...",
"url": "https://meet.google.com/abc-defg-hij"
}
}
}
Wenn der Browser-Fallback auf eine Google-Anmeldung oder einen Meet-Berechtigungsblocker trifft, bevor er
die URL erstellen kann, gibt die Gateway-Methode eine fehlgeschlagene Antwort zurück und das
Tool google_meet gibt strukturierte Details statt einer einfachen Zeichenfolge zurück:
{
"source": "browser",
"error": "google-login-required: Sign in to Google in the OpenClaw browser profile, then retry meeting creation.",
"manualActionRequired": true,
"manualActionReason": "google-login-required",
"manualActionMessage": "Sign in to Google in the OpenClaw browser profile, then retry meeting creation.",
"browser": {
"nodeId": "ba0f4e4bc...",
"targetId": "tab-1",
"browserUrl": "https://accounts.google.com/signin",
"browserTitle": "Sign in - Google Accounts"
}
}
Wenn ein Agent manualActionRequired: true sieht, sollte er die
manualActionMessage zusammen mit dem Browser-Node/Tab-Kontext melden und aufhören, neue
Meet-Tabs zu öffnen, bis der Operator den Browser-Schritt abgeschlossen hat.
Beispiel-JSON-Ausgabe aus der API-Erstellung:
{
"source": "api",
"meetingUri": "https://meet.google.com/abc-defg-hij",
"joined": true,
"space": {
"name": "spaces/abc-defg-hij",
"meetingCode": "abc-defg-hij",
"meetingUri": "https://meet.google.com/abc-defg-hij"
},
"join": {
"session": {
"id": "meet_...",
"url": "https://meet.google.com/abc-defg-hij"
}
}
}
Beim Erstellen eines Meet tritt OpenClaw standardmäßig bei. Der Chrome- oder Chrome-node-Transport benötigt weiterhin ein angemeldetes Google Chrome-Profil, um über den Browser beizutreten. Wenn das Profil abgemeldet ist, meldet OpenClaw manualActionRequired: true oder einen Browser-Fallback-Fehler und fordert den Operator auf, die Google-Anmeldung abzuschließen, bevor er es erneut versucht.
Setzen Sie preview.enrollmentAcknowledged: true erst, nachdem Sie bestätigt haben, dass Ihr Cloud-Projekt, der OAuth-Prinzipal und die Meeting-Teilnehmer für das Google Workspace Developer Preview Program für Meet Media APIs registriert sind.
Konfiguration
Der gemeinsame Chrome-Agent-Pfad benötigt nur ein aktiviertes Plugin, BlackHole, SoX, einen Key für einen Echtzeit-Transkriptions-Provider und einen konfigurierten OpenClaw-TTS-Provider. OpenAI ist der standardmäßige Transkriptions-Provider; setzen Sie realtime.voiceProvider auf "google" und realtime.model, um Google Gemini Live für den bidi-Modus zu verwenden, ohne den standardmäßigen Transkriptions-Provider des Agent-Modus zu ändern:
brew install blackhole-2ch sox
export OPENAI_API_KEY=sk-...
# or
export GEMINI_API_KEY=...
Legen Sie die Plugin-Konfiguration unter plugins.entries.google-meet.config fest:
{
plugins: {
entries: {
"google-meet": {
enabled: true,
config: {},
},
},
},
}
Standardwerte:
defaultTransport: "chrome"defaultMode: "agent"("realtime"wird nur als Legacy-Kompatibilitätsalias für"agent"akzeptiert; neue Tool-Aufrufe sollten"agent"verwenden)chromeNode.node: optionale Node-ID, optionaler Node-Name oder optionale IP fürchrome-nodechrome.audioBackend: "blackhole-2ch"chrome.guestName: "OpenClaw Agent": Name, der auf dem Meet-Gastbildschirm im abgemeldeten Zustand verwendet wirdchrome.autoJoin: true: Best-Effort-Ausfüllen des Gastnamens und Klick auf Jetzt teilnehmen über die OpenClaw-Browserautomatisierung aufchrome-nodechrome.reuseExistingTab: true: einen bestehenden Meet-Tab aktivieren, statt Duplikate zu öffnenchrome.waitForInCallMs: 20000: warten, bis der Meet-Tab meldet, dass er sich im Anruf befindet, bevor die Rücksprech-Einführung ausgelöst wirdchrome.audioFormat: "pcm16-24khz": Audioformat für Befehlspaare. Verwenden Sie"g711-ulaw-8khz"nur für Legacy-/benutzerdefinierte Befehlspaare, die weiterhin Telefonie-Audio ausgeben.chrome.audioBufferBytes: 4096: SoX-Verarbeitungspuffer für generierte Chrome-Audiobefehle von Befehlspaaren. Dies ist die Hälfte des standardmäßigen 8192-Byte-Puffers von SoX, wodurch die Standard-Pipe-Latenz reduziert wird und zugleich Spielraum bleibt, ihn auf ausgelasteten Hosts zu erhöhen. Werte unter dem SoX-Minimum werden auf 17 Byte begrenzt.chrome.audioInputCommand: SoX-Befehl, der aus CoreAudioBlackHole 2chliest und Audio inchrome.audioFormatschreibtchrome.audioOutputCommand: SoX-Befehl, der Audio inchrome.audioFormatliest und in CoreAudioBlackHole 2chschreibtchrome.bargeInInputCommand: optionaler lokaler Mikrofonbefehl, der vorzeichenbehaftetes 16-Bit-Little-Endian-Mono-PCM für die Erkennung menschlicher Unterbrechungen schreibt, während die Assistentenwiedergabe aktiv ist. Dies gilt derzeit für die vom Gateway gehostetechrome-Befehlspaar-Brücke.chrome.bargeInRmsThreshold: 650: RMS-Pegel, der beichrome.bargeInInputCommandals menschliche Unterbrechung zähltchrome.bargeInPeakThreshold: 2500: Spitzenpegel, der beichrome.bargeInInputCommandals menschliche Unterbrechung zähltchrome.bargeInCooldownMs: 900: Mindestverzögerung zwischen wiederholten Bereinigungen menschlicher Unterbrechungenmode: "agent": standardmäßiger Rücksprechmodus. Sprache von Teilnehmern wird vom konfigurierten Echtzeit-Transkriptions-Provider transkribiert, in einer meetingbezogenen Sub-Agent-Sitzung an den konfigurierten OpenClaw-Agent gesendet und über die normale OpenClaw-TTS-Laufzeit zurückgesprochen.mode: "bidi": Fallback-Modus für ein direktes bidirektionales Echtzeitmodell. Der Echtzeit-Sprach-Provider beantwortet Sprache von Teilnehmern direkt und kannopenclaw_agent_consultfür tiefere oder toolgestützte Antworten aufrufen.mode: "transcribe": reiner Beobachtungsmodus ohne Rücksprech-Brücke.realtime.provider: "openai": Kompatibilitäts-Fallback, der verwendet wird, wenn die untenstehenden bereichsbezogenen Provider-Felder nicht gesetzt sind.realtime.transcriptionProvider: "openai": Provider-ID, die vomagent-Modus für Echtzeit-Transkription verwendet wird.realtime.voiceProvider: Provider-ID, die vombidi-Modus für direkte Echtzeit-Sprache verwendet wird. Setzen Sie dies auf"google", um Gemini Live zu verwenden und die Transkription im Agent-Modus weiterhin auf OpenAI zu belassen.realtime.toolPolicy: "safe-read-only"realtime.instructions: kurze gesprochene Antworten, mitopenclaw_agent_consultfür tiefere Antwortenrealtime.introMessage: kurze gesprochene Bereitschaftsprüfung, wenn die Echtzeit-Brücke eine Verbindung herstellt; setzen Sie dies auf"", um still beizutretenrealtime.agentId: optionale OpenClaw-Agent-ID füropenclaw_agent_consult; Standardwert istmain
Optionale Überschreibungen:
{
defaults: {
meeting: "https://meet.google.com/abc-defg-hij",
},
browser: {
defaultProfile: "openclaw",
},
chrome: {
guestName: "OpenClaw Agent",
waitForInCallMs: 30000,
bargeInInputCommand: [
"sox",
"-q",
"-t",
"coreaudio",
"External Microphone",
"-r",
"24000",
"-c",
"1",
"-b",
"16",
"-e",
"signed-integer",
"-t",
"raw",
"-",
],
},
chromeNode: {
node: "parallels-macos",
},
defaultMode: "agent",
realtime: {
provider: "openai",
transcriptionProvider: "openai",
voiceProvider: "google",
model: "gemini-2.5-flash-native-audio-preview-12-2025",
agentId: "jay",
toolPolicy: "owner",
introMessage: "Say exactly: I'm here.",
providers: {
google: {
voice: "Kore",
},
},
},
}
ElevenLabs für Hören und Sprechen im Agent-Modus:
{
messages: {
tts: {
provider: "elevenlabs",
providers: {
elevenlabs: {
modelId: "eleven_v3",
voiceId: "pMsXgVXv3BLzUgSXRplE",
},
},
},
},
plugins: {
entries: {
"google-meet": {
config: {
realtime: {
transcriptionProvider: "elevenlabs",
providers: {
elevenlabs: {
modelId: "scribe_v2_realtime",
audioFormat: "ulaw_8000",
sampleRate: 8000,
commitStrategy: "vad",
},
},
},
},
},
},
},
}
Die persistente Meet-Stimme stammt aus messages.tts.providers.elevenlabs.voiceId. Agent-Antworten können auch pro Antwort [[tts:voiceId=... model=eleven_v3]]-Direktiven verwenden, wenn TTS-Modellüberschreibungen aktiviert sind, aber die Konfiguration ist der deterministische Standard für Meetings. Beim Beitritt sollten die Logs transcriptionProvider=elevenlabs anzeigen, und jede gesprochene Antwort sollte provider=elevenlabs model=eleven_v3 voice=<voiceId> protokollieren.
Nur-Twilio-Konfiguration:
{
defaultTransport: "twilio",
twilio: {
defaultDialInNumber: "+15551234567",
defaultPin: "123456",
},
voiceCall: {
gatewayUrl: "ws://127.0.0.1:18789",
},
}
voiceCall.enabled ist standardmäßig true; mit Twilio-Transport delegiert es den eigentlichen PSTN-Anruf, DTMF und die Einführungsbegrüßung an das Voice Call Plugin. Voice Call spielt die DTMF-Sequenz ab, bevor der Echtzeit-Medienstream geöffnet wird, und verwendet dann den gespeicherten Einführungstext als anfängliche Echtzeit-Begrüßung. Wenn voice-call nicht aktiviert ist, kann Google Meet den Wählplan weiterhin validieren und aufzeichnen, aber den Twilio-Anruf nicht platzieren.
Tool
Agenten können das google_meet-Tool verwenden:
{
"action": "join",
"url": "https://meet.google.com/abc-defg-hij",
"transport": "chrome-node",
"mode": "agent"
}
Verwenden Sie transport: "chrome", wenn Chrome auf dem Gateway-Host läuft. Verwenden Sie transport: "chrome-node", wenn Chrome auf einem gekoppelten Node wie einer Parallels-VM läuft. In beiden Fällen laufen die Modell-Provider und openclaw_agent_consult auf dem Gateway-Host, sodass die Modell-Anmeldedaten dort verbleiben. Mit dem standardmäßigen mode: "agent" übernimmt der Echtzeit-Transkriptions-Provider das Zuhören, der konfigurierte OpenClaw-Agent erzeugt die Antwort, und reguläres OpenClaw TTS spricht sie in Meet. Verwenden Sie mode: "bidi", wenn das Echtzeit-Sprachmodell direkt antworten soll. Der Rohwert mode: "realtime" wird weiterhin als Legacy-Kompatibilitätsalias für mode: "agent" akzeptiert, wird aber nicht mehr im Agent-Tool-Schema beworben. Logs im Agent-Modus enthalten beim Start der Brücke den aufgelösten Transkriptions-Provider bzw. das Modell sowie nach jeder synthetisierten Antwort den TTS-Provider, das Modell, die Stimme, das Ausgabeformat und die Abtastrate.
Verwenden Sie action: "status", um aktive Sitzungen aufzulisten oder eine Sitzungs-ID zu prüfen. Verwenden Sie action: "speak" mit sessionId und message, damit der Echtzeit-Agent sofort spricht. Verwenden Sie action: "test_speech", um die Sitzung zu erstellen oder wiederzuverwenden, eine bekannte Phrase auszulösen und den inCall-Zustand zurückzugeben, wenn der Chrome-Host ihn melden kann. test_speech erzwingt immer mode: "agent" und schlägt fehl, wenn es in mode: "transcribe" ausgeführt werden soll, weil reine Beobachtungssitzungen absichtlich keine Sprache ausgeben können. Das Ergebnis speechOutputVerified basiert darauf, dass während dieses Testaufrufs die Echtzeit-Audioausgabebytes zunehmen; daher zählt eine wiederverwendete Sitzung mit älterem Audio nicht als frische erfolgreiche Sprachprüfung. Verwenden Sie action: "leave", um eine Sitzung als beendet zu markieren.
status enthält Chrome-Zustand, sofern verfügbar:
inCall: Chrome scheint sich im Meet-Anruf zu befindenmicMuted: Best-Effort-Zustand des Meet-MikrofonsmanualActionRequired/manualActionReason/manualActionMessage: das Browserprofil benötigt manuelle Anmeldung, Zulassung durch den Meet-Host, Berechtigungen oder Reparatur der Browsersteuerung, bevor Sprache funktionieren kannspeechReady/speechBlockedReason/speechBlockedMessage: ob verwaltete Chrome-Sprache jetzt erlaubt ist.speechReady: falsebedeutet, dass OpenClaw die Einführungs-/Testphrase nicht in die Audio-Brücke gesendet hat.providerConnected/realtimeReady: Zustand der Echtzeit-SprachbrückelastInputAt/lastOutputAt: zuletzt von der Brücke gesehenes oder an sie gesendetes AudioaudioOutputRouted/audioOutputDeviceLabel: ob die Medienausgabe des Meet-Tabs aktiv an das von der Brücke verwendete BlackHole-Gerät geroutet wurdelastSuppressedInputAt/suppressedInputBytes: ignorierte loopback-Eingabe, während die Assistentenwiedergabe aktiv ist
{
"action": "speak",
"sessionId": "meet_...",
"message": "Say exactly: I'm here and listening."
}
Agent- und bidi-Modi
Der Chrome-agent-Modus ist für das Verhalten „mein Agent ist im Meeting“ optimiert. Der Echtzeit-Transkriptions-Provider hört die Meeting-Audiodaten, finale Teilnehmertranskripte werden durch den konfigurierten OpenClaw-Agent geleitet, und die Antwort wird über die normale OpenClaw-TTS-Laufzeit gesprochen. Setzen Sie mode: "bidi", wenn das Echtzeit-Sprachmodell direkt antworten soll. Nahe beieinanderliegende finale Transkriptfragmente werden vor der Konsultation zusammengeführt, damit ein gesprochener Beitrag nicht mehrere veraltete Teilantworten erzeugt. Echtzeit-Eingabe wird außerdem unterdrückt, während in die Warteschlange gestellte Assistentenaudios noch abgespielt werden, und aktuelle assistentenähnliche Transkriptechos werden vor der Agent-Konsultation ignoriert, damit BlackHole-loopback den Agent nicht dazu bringt, auf seine eigene Sprache zu antworten.
| Modus | Wer entscheidet die Antwort | Pfad der Sprachausgabe | Verwendung, wenn |
|---|---|---|---|
agent |
Der konfigurierte OpenClaw-Agent | Normale OpenClaw-TTS-Laufzeit | Sie das Verhalten „mein Agent ist im Meeting“ möchten |
bidi |
Das Echtzeit-Sprachmodell | Audioantwort des Echtzeit-Sprach-Provider | Sie die Sprachschleife mit der geringsten Latenz möchten |
Wenn das Echtzeitmodell im bidi-Modus tiefere Schlussfolgerungen, aktuelle Informationen oder normale OpenClaw-Tools benötigt, kann es openclaw_agent_consult aufrufen.
Das Consult-Tool führt im Hintergrund den regulären OpenClaw Agent mit aktuellem
Meeting-Transkriptkontext aus und gibt eine kurze gesprochene Antwort zurück. Im agent-Modus
sendet OpenClaw diese Antwort direkt an die TTS-Runtime; im bidi-Modus kann das
Realtime-Sprachmodell das Consult-Ergebnis zurück in das Meeting sprechen. Es verwendet
dieselbe gemeinsame Consult-Infrastruktur wie Voice Call.
Standardmäßig laufen Consults gegen den main-Agent. Setzen Sie realtime.agentId, wenn eine
Meet-Lane einen dedizierten OpenClaw Agent-Arbeitsbereich, Modellvorgaben,
Tool-Richtlinien, Speicher und Sitzungsverlauf konsultieren soll.
Consults im Agent-Modus verwenden einen sitzungsspezifischen Schlüssel
agent:<id>:subagent:google-meet:<session>, sodass Rückfragen den Meeting-Kontext
beibehalten und gleichzeitig die normale Agent-Richtlinie vom konfigurierten Agent
erben.
realtime.toolPolicy steuert den Consult-Lauf:
safe-read-only: macht das Consult-Tool verfügbar und beschränkt den regulären Agent aufread,web_search,web_fetch,x_search,memory_searchundmemory_get.owner: macht das Consult-Tool verfügbar und lässt den regulären Agent die normale Agent-Tool-Richtlinie verwenden.none: macht das Consult-Tool für das Realtime-Sprachmodell nicht verfügbar.
Der Consult-Sitzungsschlüssel ist pro Meet-Sitzung begrenzt, sodass nachfolgende Consult-Aufrufe während desselben Meetings vorherigen Consult-Kontext wiederverwenden können.
Um eine gesprochene Bereitschaftsprüfung zu erzwingen, nachdem Chrome dem Anruf vollständig beigetreten ist:
openclaw googlemeet speak meet_... "Say exactly: I'm here and listening."
Für den vollständigen Beitreten-und-Sprechen-Smoke-Test:
openclaw googlemeet test-speech https://meet.google.com/abc-defg-hij \
--transport chrome-node \
--message "Say exactly: I'm here and listening."
Live-Test-Checkliste
Verwenden Sie diese Sequenz, bevor Sie ein Meeting an einen unbeaufsichtigten Agent übergeben:
openclaw googlemeet setup
openclaw nodes status
openclaw googlemeet test-speech https://meet.google.com/abc-defg-hij \
--transport chrome-node \
--message "Say exactly: Google Meet speech test complete."
Erwarteter Chrome-node-Zustand:
googlemeet setupist vollständig grün.googlemeet setupenthältchrome-node-connected, wenn Chrome-node der Standardtransport ist oder ein Node festgelegt ist.nodes statuszeigt den ausgewählten Node als verbunden an.- Der ausgewählte Node kündigt sowohl
googlemeet.chromeals auchbrowser.proxyan. - Der Meet-Tab tritt dem Anruf bei und
test-speechgibt Chrome-Health mitinCall: truezurück.
Für einen entfernten Chrome-Host wie eine Parallels-macOS-VM ist dies die kürzeste sichere Prüfung nach dem Aktualisieren des Gateway oder der VM:
openclaw googlemeet setup
openclaw nodes status --connected
openclaw nodes invoke \
--node parallels-macos \
--command googlemeet.chrome \
--params '{"action":"setup"}'
Das beweist, dass das Gateway-Plugin geladen ist, der VM-Node mit dem aktuellen Token verbunden ist und die Meet-Audio-Bridge verfügbar ist, bevor ein Agent einen echten Meeting-Tab öffnet.
Für einen Twilio-Smoke-Test verwenden Sie ein Meeting, das Telefon-Einwahldaten bereitstellt:
openclaw googlemeet setup
openclaw googlemeet join https://meet.google.com/abc-defg-hij \
--transport twilio \
--dial-in-number +15551234567 \
--pin 123456
Erwarteter Twilio-Zustand:
googlemeet setupenthält grüne Prüfungen fürtwilio-voice-call-plugin,twilio-voice-call-credentialsundtwilio-voice-call-webhook.voicecallist nach dem Neuladen des Gateway in der CLI verfügbar.- Die zurückgegebene Sitzung hat
transport: "twilio"und einetwilio.voiceCallId. openclaw logs --followzeigt, dass DTMF-TwiML vor Realtime-TwiML bereitgestellt wurde, danach eine Realtime-Bridge mit der eingereihten ersten Begrüßung.googlemeet leave <sessionId>legt den delegierten Sprachanruf auf.
Fehlerbehebung
Agent sieht das Google Meet-Tool nicht
Bestätigen Sie, dass das Plugin in der Gateway-Konfiguration aktiviert ist, und laden Sie das Gateway neu:
openclaw plugins list | grep google-meet
openclaw googlemeet setup
Wenn Sie gerade plugins.entries.google-meet bearbeitet haben, starten oder laden Sie das Gateway neu.
Der laufende Agent sieht nur Plugin-Tools, die vom aktuellen Gateway-Prozess
registriert wurden.
Auf Gateway-Hosts ohne macOS bleibt das agentenseitige google_meet-Tool sichtbar,
aber lokale Chrome-Talk-back-Aktionen werden blockiert, bevor sie die Audio-Bridge erreichen.
Lokales Chrome-Talk-back-Audio hängt derzeit von macOS BlackHole 2ch ab, daher
sollten Linux-Agents mode: "transcribe", Twilio-Einwahl oder einen macOS-
chrome-node-Host anstelle des standardmäßigen lokalen Chrome-Agent-Pfads verwenden.
Kein verbundener Google Meet-fähiger Node
Führen Sie auf dem Node-Host aus:
openclaw plugins enable google-meet
openclaw plugins enable browser
OPENCLAW_ALLOW_INSECURE_PRIVATE_WS=1 \
openclaw node run --host <gateway-lan-ip> --port 18789 --display-name parallels-macos
Genehmigen Sie auf dem Gateway-Host den Node und prüfen Sie die Befehle:
openclaw devices list
openclaw devices approve <requestId>
openclaw nodes status
Der Node muss verbunden sein und googlemeet.chrome plus browser.proxy auflisten.
Die Gateway-Konfiguration muss diese Node-Befehle erlauben:
{
gateway: {
nodes: {
allowCommands: ["browser.proxy", "googlemeet.chrome"],
},
},
}
Wenn googlemeet setup bei chrome-node-connected fehlschlägt oder das Gateway-Log
gateway token mismatch meldet, installieren oder starten Sie den Node mit dem aktuellen Gateway-Token neu.
Für ein LAN-Gateway bedeutet das üblicherweise:
OPENCLAW_ALLOW_INSECURE_PRIVATE_WS=1 \
openclaw node install \
--host <gateway-lan-ip> \
--port 18789 \
--display-name parallels-macos \
--force
Laden Sie dann den Node-Dienst neu und führen Sie erneut aus:
openclaw googlemeet setup
openclaw nodes status --connected
Browser öffnet sich, aber Agent kann nicht beitreten
Führen Sie googlemeet test-listen für reine Beobachtungsbeitritte oder googlemeet test-speech
für Realtime-Beitritte aus und prüfen Sie dann die zurückgegebene Chrome-Health. Wenn einer der Probes
manualActionRequired: true meldet, zeigen Sie dem Operator manualActionMessage
an und beenden Sie Wiederholungen, bis die Browser-Aktion abgeschlossen ist.
Häufige manuelle Aktionen:
- Beim Chrome-Profil anmelden.
- Den Gast über das Meet-Hostkonto zulassen.
- Chrome-Mikrofon-/Kameraberechtigungen erteilen, wenn Chromes native Berechtigungsabfrage erscheint.
- Einen hängenden Meet-Berechtigungsdialog schließen oder reparieren.
Melden Sie nicht „nicht angemeldet“, nur weil Meet „Do you want people to hear you in the meeting?“ anzeigt. Das ist Meets Audio-Auswahl-Zwischenseite; OpenClaw klickt Use microphone per Browser-Automatisierung an, wenn verfügbar, und wartet weiter auf den echten Meeting-Zustand. Für den reinen Browser-Fallback zur Erstellung kann OpenClaw Continue without microphone anklicken, weil das Erstellen der URL den Realtime-Audiopfad nicht benötigt.
Meeting-Erstellung schlägt fehl
googlemeet create verwendet zuerst den Google Meet API-Endpunkt spaces.create,
wenn OAuth-Anmeldedaten konfiguriert sind. Ohne OAuth-Anmeldedaten fällt es
auf den festgelegten Chrome-Node-Browser zurück. Bestätigen Sie:
- Für API-Erstellung:
oauth.clientIdundoauth.refreshTokensind konfiguriert, oder passendeOPENCLAW_GOOGLE_MEET_*-Umgebungsvariablen sind vorhanden. - Für API-Erstellung: Das Refresh-Token wurde erstellt, nachdem die Erstellungsunterstützung
hinzugefügt wurde. Älteren Tokens kann der Scope
meetings.space.createdfehlen; führen Sieopenclaw googlemeet auth login --jsonerneut aus und aktualisieren Sie die Plugin-Konfiguration. - Für Browser-Fallback:
defaultTransport: "chrome-node"undchromeNode.nodezeigen auf einen verbundenen Node mitbrowser.proxyundgooglemeet.chrome. - Für Browser-Fallback: Das OpenClaw Chrome-Profil auf diesem Node ist bei Google angemeldet
und kann
https://meet.google.com/newöffnen. - Für Browser-Fallback: Wiederholungen verwenden einen vorhandenen
https://meet.google.com/new- oder Google-Konto-Aufforderungstab wieder, bevor sie einen neuen Tab öffnen. Wenn bei einem Agent ein Timeout auftritt, wiederholen Sie den Tool-Aufruf, statt manuell einen weiteren Meet-Tab zu öffnen. - Für Browser-Fallback: Wenn das Tool
manualActionRequired: truezurückgibt, verwenden Sie die zurückgegebenen Wertebrowser.nodeId,browser.targetId,browserUrlundmanualActionMessage, um den Operator anzuleiten. Wiederholen Sie nicht in einer Schleife, bis diese Aktion abgeschlossen ist. - Für Browser-Fallback: Wenn Meet „Do you want people to hear you in the
meeting?“ anzeigt, lassen Sie den Tab geöffnet. OpenClaw sollte Use microphone oder, beim
reinen Erstellungs-Fallback, Continue without microphone per Browser-
Automatisierung anklicken und weiter auf die generierte Meet-URL warten. Wenn das nicht möglich ist, sollte der
Fehler
meet-audio-choice-requirederwähnen, nichtgoogle-login-required.
Agent tritt bei, spricht aber nicht
Prüfen Sie den Realtime-Pfad:
openclaw googlemeet setup
openclaw googlemeet doctor
Verwenden Sie mode: "agent" für den normalen STT -> OpenClaw Agent -> TTS-Talk-back-Pfad
oder mode: "bidi" für den direkten Realtime-Sprach-Fallback. mode: "transcribe"
startet absichtlich keine Talk-back-Bridge. Führen Sie für reine Beobachtungs-Debugs
openclaw googlemeet status --json <session-id> aus, nachdem Teilnehmer gesprochen haben,
und prüfen Sie captioning, transcriptLines und lastCaptionText. Wenn inCall
true ist, aber transcriptLines bei 0 bleibt, sind Meet-Untertitel möglicherweise deaktiviert, niemand
hat seit der Installation des Beobachters gesprochen, die Meet-Oberfläche hat sich geändert oder Live-
Untertitel sind für die Meeting-Sprache bzw. das Konto nicht verfügbar.
googlemeet test-speech prüft immer den Realtime-Pfad und meldet, ob
Bridge-Ausgabebytes für diesen Aufruf beobachtet wurden. Wenn speechOutputVerified false und
speechOutputTimedOut true ist, hat der Realtime-Provider die
Äußerung möglicherweise akzeptiert, aber OpenClaw hat keine neuen Ausgabebytes gesehen, die die Chrome-Audio-
Bridge erreichen.
Prüfen Sie außerdem:
- Ein Realtime-Provider-Schlüssel ist auf dem Gateway-Host verfügbar, z. B.
OPENAI_API_KEYoderGEMINI_API_KEY. BlackHole 2chist auf dem Chrome-Host sichtbar.soxist auf dem Chrome-Host vorhanden.- Meet-Mikrofon und -Lautsprecher werden über den von OpenClaw verwendeten virtuellen Audiopfad geroutet.
doctorsollte bei lokalen Chrome-Realtime-Beitrittenmeet output routed: yesanzeigen.
googlemeet doctor [session-id] gibt Sitzung, Node, Anrufzustand,
manuellen Aktionsgrund, Realtime-Provider-Verbindung, realtimeReady, Audio-
Ein-/Ausgabeaktivität, letzte Audio-Zeitstempel, Byte-Zähler und Browser-URL aus.
Verwenden Sie googlemeet status [session-id] --json, wenn Sie das rohe JSON benötigen. Verwenden Sie
googlemeet doctor --oauth, wenn Sie Google Meet OAuth-Refresh prüfen müssen,
ohne Tokens offenzulegen; fügen Sie --meeting oder --create-space hinzu, wenn Sie zusätzlich einen
Google Meet API-Nachweis benötigen.
Wenn bei einem Agent ein Timeout aufgetreten ist und Sie bereits einen geöffneten Meet-Tab sehen, prüfen Sie diesen Tab, ohne einen weiteren zu öffnen:
openclaw googlemeet recover-tab
openclaw googlemeet recover-tab https://meet.google.com/abc-defg-hij
Die entsprechende Tool-Aktion ist recover_current_tab. Sie fokussiert und prüft einen
vorhandenen Meet-Tab für den ausgewählten Transport. Mit chrome verwendet sie lokale
Browser-Steuerung über das Gateway; mit chrome-node verwendet sie den konfigurierten
Chrome-Node. Sie öffnet keinen neuen Tab und erstellt keine neue Sitzung; sie meldet den
aktuellen Blocker, etwa Anmeldung, Zulassung, Berechtigungen oder Audio-Auswahlzustand.
Der CLI-Befehl spricht mit dem konfigurierten Gateway, daher muss das Gateway laufen;
chrome-node erfordert außerdem, dass der Chrome-Node verbunden ist.
Twilio-Einrichtungsprüfungen schlagen fehl
twilio-voice-call-plugin schlägt fehl, wenn voice-call nicht erlaubt oder nicht aktiviert ist.
Fügen Sie es zu plugins.allow hinzu, aktivieren Sie plugins.entries.voice-call und laden Sie das
Gateway neu.
twilio-voice-call-credentials schlägt fehl, wenn dem Twilio-Backend Konto-
SID, Auth-Token oder Anrufernummer fehlen. Setzen Sie diese auf dem Gateway-Host:
export TWILIO_ACCOUNT_SID=AC...
export TWILIO_AUTH_TOKEN=...
export TWILIO_FROM_NUMBER=+15550001234
twilio-voice-call-webhook schlägt fehl, wenn voice-call keine öffentliche Webhook-
Freigabe hat oder wenn publicUrl auf local loopback oder privaten Netzwerkbereich zeigt.
Setzen Sie plugins.entries.voice-call.config.publicUrl auf die öffentliche Provider-URL oder
konfigurieren Sie einen voice-call-Tunnel bzw. eine Tailscale-Freigabe.
Loopback- und private URLs sind für Carrier-Callbacks nicht gültig. Verwenden Sie nicht
localhost, 127.0.0.1, 0.0.0.0, 10.x, 172.16.x-172.31.x,
192.168.x, 169.254.x, fc00::/7 oder fd00::/8 als publicUrl.
Für eine stabile öffentliche URL:
{
plugins: {
entries: {
"voice-call": {
enabled: true,
config: {
provider: "twilio",
fromNumber: "+15550001234",
publicUrl: "https://voice.example.com/voice/webhook",
},
},
},
},
}
Verwenden Sie für die lokale Entwicklung eine Tunnel- oder Tailscale-Freigabe statt einer privaten Host-URL:
{
plugins: {
entries: {
"voice-call": {
config: {
tunnel: { provider: "ngrok" },
// or
tailscale: { mode: "funnel", path: "/voice/webhook" },
},
},
},
},
}
Starten oder laden Sie anschließend den Gateway neu und führen Sie Folgendes aus:
openclaw googlemeet setup --transport twilio
openclaw voicecall setup
openclaw voicecall smoke
voicecall smoke prüft standardmäßig nur die Bereitschaft. Für einen Testlauf mit einer bestimmten Nummer:
openclaw voicecall smoke --to "+15555550123"
Fügen Sie --yes nur hinzu, wenn Sie bewusst einen echten ausgehenden Benachrichtigungsanruf
auslösen möchten:
openclaw voicecall smoke --to "+15555550123" --yes
Twilio-Anruf startet, tritt dem Meeting aber nie bei
Bestätigen Sie, dass das Meet-Ereignis Details zur telefonischen Einwahl bereitstellt. Übergeben Sie die exakte Einwahlnummer und PIN oder eine benutzerdefinierte DTMF-Sequenz:
openclaw googlemeet join https://meet.google.com/abc-defg-hij \
--transport twilio \
--dial-in-number +15551234567 \
--dtmf-sequence ww123456#
Verwenden Sie führende w oder Kommas in --dtmf-sequence, wenn der Provider vor der Eingabe
der PIN eine Pause benötigt.
Wenn der Telefonanruf erstellt wird, die Meet-Teilnehmerliste den Einwahlteilnehmer aber nie anzeigt:
- Führen Sie
openclaw googlemeet doctor <session-id>aus, um die delegierte Twilio- Anruf-ID zu bestätigen, ob DTMF in die Warteschlange gestellt wurde und ob die Begrüßung angefordert wurde. - Führen Sie
openclaw voicecall status --call-id <id>aus und bestätigen Sie, dass der Anruf noch aktiv ist. - Führen Sie
openclaw voicecall tailaus und prüfen Sie, ob Twilio-Webhooks am Gateway eintreffen. - Führen Sie
openclaw logs --followaus und suchen Sie nach der Twilio-Meet-Sequenz: Google Meet delegiert den Beitritt, Voice Call speichert und liefert Pre-Connect-DTMF-TwiML, Voice Call liefert Echtzeit-TwiML für den Twilio-Anruf, anschließend fordert Google Meet Einführungssprache mitvoicecall.speakan. - Führen Sie
openclaw googlemeet setup --transport twilioerneut aus; eine grüne Setup-Prüfung ist erforderlich, beweist aber nicht, dass die Meeting-PIN-Sequenz korrekt ist. - Bestätigen Sie, dass die Einwahlnummer zur selben Meet-Einladung und Region gehört wie die PIN.
- Erhöhen Sie
voiceCall.dtmfDelayMsgegenüber dem Standardwert von 12 Sekunden, wenn Meet langsam antwortet oder das Anruftranskript weiterhin die Aufforderung zur PIN-Eingabe zeigt, nachdem Pre-Connect-DTMF gesendet wurde. - Wenn der Teilnehmer beitritt, Sie die Begrüßung aber nicht hören, prüfen Sie
openclaw logs --followauf die Post-DTMF-Anforderungvoicecall.speakund entweder die TTS-Wiedergabe über den Medienstream oder den Twilio-OPENCLAW_DOCS_MARKER:calloutOpen:U2F5-Fallback. Wenn das Anruftranskript weiterhin „enter the meeting PIN“ enthält, ist die Telefonverbindung dem Meet-Raum noch nicht beigetreten, sodass Meeting-Teilnehmer keine Sprache hören.
Wenn Webhooks nicht eintreffen, debuggen Sie zuerst das Voice Call Plugin: Der Provider muss
plugins.entries.voice-call.config.publicUrl oder den konfigurierten Tunnel erreichen.
Siehe Problembehandlung für Voice Call.
Hinweise
Die offizielle Medien-API von Google Meet ist auf Empfang ausgerichtet, daher benötigt das Sprechen in einen Meet- Anruf weiterhin einen Teilnehmerpfad. Dieses Plugin macht diese Grenze sichtbar: Chrome übernimmt die Browser-Teilnahme und das lokale Audio-Routing; Twilio übernimmt die Teilnahme per Telefoneinwahl.
Chrome-Talk-Back-Modi benötigen BlackHole 2ch plus eines der folgenden Elemente:
chrome.audioInputCommandpluschrome.audioOutputCommand: OpenClaw verwaltet die Bridge und leitet Audio inchrome.audioFormatzwischen diesen Befehlen und dem ausgewählten Provider weiter. Der Agent-Modus verwendet Echtzeit-Transkription plus reguläres TTS; der Bidi-Modus verwendet den Echtzeit-Voice-Provider. Der Standard-Chrome-Pfad ist 24 kHz PCM16 mitchrome.audioBufferBytes: 4096; 8 kHz G.711 mu-law bleibt für ältere Befehlspaare verfügbar.chrome.audioBridgeCommand: Ein externer Bridge-Befehl verwaltet den gesamten lokalen Audiopfad und muss nach dem Starten oder Validieren seines Daemons beendet werden. Dies ist nur fürbidigültig, da deragent-Modus direkten Zugriff auf Befehlspaare für TTS benötigt.
Wenn ein Agent im Agent-Modus das Tool google_meet aufruft, forkt die Meeting-Beratungssitzung
das aktuelle Transkript des Aufrufers, bevor sie auf Teilnehmer-
sprache antwortet. Die Meet-Sitzung bleibt weiterhin getrennt (agent:<agentId>:subagent:google-meet:<sessionId>),
sodass Meeting-Folgeaktionen das Aufrufertranskript nicht direkt verändern.
Für sauberes Duplex-Audio leiten Sie Meet-Ausgabe und Meet-Mikrofon über getrennte virtuelle Geräte oder einen virtuellen Gerätegraphen im Loopback-Stil. Ein einzelnes gemeinsam genutztes BlackHole-Gerät kann andere Teilnehmer zurück in den Anruf spiegeln.
Mit der Chrome-Bridge aus Befehlspaaren kann chrome.bargeInInputCommand ein
separates lokales Mikrofon abhören und die Assistentenwiedergabe löschen, sobald der Mensch
zu sprechen beginnt. Dadurch bleibt menschliche Sprache vor der Assistentenausgabe, selbst wenn die gemeinsam genutzte
BlackHole-Loopback-Eingabe während der Assistentenwiedergabe vorübergehend unterdrückt wird.
Wie chrome.audioInputCommand und chrome.audioOutputCommand ist dies ein
lokaler, vom Betreiber konfigurierter Befehl. Verwenden Sie einen ausdrücklich vertrauenswürdigen Befehlspfad oder
eine Argumentliste, und verweisen Sie nicht auf Skripte aus nicht vertrauenswürdigen Speicherorten.
googlemeet speak löst die aktive Talk-Back-Audio-Bridge für eine Chrome-
Sitzung aus. googlemeet leave stoppt diese Bridge. Für Twilio-Sitzungen, die
über das Voice Call Plugin delegiert werden, legt leave auch den zugrunde liegenden Sprachanruf auf.
Verwenden Sie googlemeet end-active-conference, wenn Sie auch die aktive
Google-Meet-Konferenz für einen API-verwalteten Space schließen möchten.