Messages and delivery

Streaming und Chunking

OpenClaw hat zwei getrennte Streaming-Ebenen:

Block-Streaming (Kanäle): gibt abgeschlossene Blöcke aus, während der Assistent schreibt. Das sind normale Kanalnachrichten (keine Token-Deltas).
Preview-Streaming (Telegram/Discord/Slack): aktualisiert während der Generierung eine temporäre Preview-Nachricht.

Derzeit gibt es kein echtes Token-Delta-Streaming zu Kanalnachrichten. Preview-Streaming ist nachrichtenbasiert (Senden + Bearbeitungen/Anhänge).

Block-Streaming (Kanalnachrichten)

Block-Streaming sendet Assistentenausgaben in groben Chunks, sobald sie verfügbar werden.

Model output
  └─ text_delta/events
       ├─ (blockStreamingBreak=text_end)
       │    └─ chunker emits blocks as buffer grows
       └─ (blockStreamingBreak=message_end)
            └─ chunker flushes at message_end
                   └─ channel send (block replies)

Legende:

text_delta/events: Modell-Stream-Ereignisse (können bei nicht streamenden Modellen spärlich sein).
chunker: EmbeddedBlockChunker, der Min-/Max-Grenzen + Break-Präferenz anwendet.
channel send: tatsächliche ausgehende Nachrichten (Block-Antworten).

Steuerungen:

agents.defaults.blockStreamingDefault: "on"/"off" (standardmäßig aus).
Kanal-Overrides: *.blockStreaming (und Varianten pro Konto), um pro Kanal "on"/"off" zu erzwingen.
agents.defaults.blockStreamingBreak: "text_end" oder "message_end".
agents.defaults.blockStreamingChunk: { minChars, maxChars, breakPreference? }.
agents.defaults.blockStreamingCoalesce: { minChars?, maxChars?, idleMs? } (gestreamte Blöcke vor dem Senden zusammenführen).
Harte Kanalobergrenze: *.textChunkLimit (z. B. channels.whatsapp.textChunkLimit).
Kanal-Chunk-Modus: *.chunkMode (standardmäßig length, newline teilt vor dem Chunking nach Länge an Leerzeilen (Absatzgrenzen)).
Weiche Discord-Obergrenze: channels.discord.maxLinesPerMessage (Standard 17) teilt hohe Antworten, um UI-Abschneiden zu vermeiden.

Grenzsemantik:

text_end: Blöcke streamen, sobald der Chunker sie ausgibt; bei jedem text_end flushen.
message_end: warten, bis die Assistentennachricht fertig ist, dann die gepufferte Ausgabe flushen.

message_end verwendet weiterhin den Chunker, wenn der gepufferte Text maxChars überschreitet, sodass am Ende mehrere Chunks ausgegeben werden können.

Medienzustellung mit Block-Streaming

MEDIA:-Direktiven sind normale Zustellungsmetadaten. Wenn Block-Streaming einen Medienblock früh sendet, merkt sich OpenClaw diese Zustellung für den Turn. Wenn die finale Assistenten-Payload dieselbe Medien-URL wiederholt, entfernt die finale Zustellung das doppelte Medium, statt den Anhang erneut zu senden.

Exakt doppelte finale Payloads werden unterdrückt. Wenn die finale Payload eigenen Text um Medien hinzufügt, die bereits gestreamt wurden, sendet OpenClaw den neuen Text dennoch und hält das Medium bei einmaliger Zustellung. Das verhindert doppelte Sprachnachrichten oder Dateien in Kanälen wie Telegram, wenn ein Agent während des Streamings MEDIA: ausgibt und der Provider es auch in der abgeschlossenen Antwort enthält.

Chunking-Algorithmus (untere/obere Grenzen)

Block-Chunking wird durch EmbeddedBlockChunker implementiert:

Untere Grenze: nicht ausgeben, bis der Puffer >= minChars ist (außer bei erzwungener Ausgabe).
Obere Grenze: Splits vor maxChars bevorzugen; bei erzwungener Ausgabe bei maxChars splitten.
Break-Präferenz: paragraph → newline → sentence → whitespace → harter Break.
Code-Fences: niemals innerhalb von Fences splitten; bei erzwungener Ausgabe bei maxChars den Fence schließen + wieder öffnen, damit Markdown gültig bleibt.

maxChars wird auf das textChunkLimit des Kanals begrenzt, sodass Sie kanalbezogene Obergrenzen nicht überschreiten können.

Coalescing (gestreamte Blöcke zusammenführen)

Wenn Block-Streaming aktiviert ist, kann OpenClaw aufeinanderfolgende Block-Chunks zusammenführen, bevor sie gesendet werden. Das reduziert „Einzeilen-Spam“ und liefert trotzdem fortlaufende Ausgabe.

Coalescing wartet auf Idle-Lücken (idleMs), bevor geflusht wird.
Puffer werden durch maxChars begrenzt und geflusht, wenn sie diese Grenze überschreiten.
minChars verhindert, dass winzige Fragmente gesendet werden, bis genug Text angesammelt wurde (der finale Flush sendet immer den verbleibenden Text).
Der Joiner wird aus blockStreamingChunk.breakPreference abgeleitet (paragraph → \n\n, newline → \n, sentence → Leerzeichen).
Kanal-Overrides sind über *.blockStreamingCoalesce verfügbar (einschließlich Konfigurationen pro Konto).
Der Standardwert für Coalesce-minChars wird für Signal/Slack/Discord auf 1500 angehoben, sofern er nicht überschrieben wird.

Menschlich wirkende Pausen zwischen Blöcken

Wenn Block-Streaming aktiviert ist, können Sie zwischen Block-Antworten (nach dem ersten Block) eine randomisierte Pause hinzufügen. Dadurch wirken Antworten mit mehreren Sprechblasen natürlicher.

Konfiguration: agents.defaults.humanDelay (pro Agent über agents.list[].humanDelay überschreibbar).
Modi: off (Standard), natural (800-2500 ms), custom (minMs/maxMs).
Gilt nur für Block-Antworten, nicht für finale Antworten oder Tool-Zusammenfassungen.

„Chunks streamen oder alles“

Das entspricht:

Chunks streamen: blockStreamingDefault: "on" + blockStreamingBreak: "text_end" (während der Erstellung ausgeben). Nicht-Telegram-Kanäle benötigen außerdem *.blockStreaming: true.
Alles am Ende streamen: blockStreamingBreak: "message_end" (einmal flushen, bei sehr langen Inhalten möglicherweise mehrere Chunks).
Kein Block-Streaming: blockStreamingDefault: "off" (nur finale Antwort).

Kanalhinweis: Block-Streaming ist aus, sofern *.blockStreaming nicht explizit auf true gesetzt ist. Kanäle können eine Live-Preview streamen (channels.<channel>.streaming), ohne Block-Antworten zu senden.

Konfigurationshinweis: Die blockStreaming*-Defaults liegen unter agents.defaults, nicht in der Root-Konfiguration.

Preview-Streaming-Modi

Kanonischer Schlüssel: channels.<channel>.streaming

Modi:

off: Preview-Streaming deaktivieren.
partial: einzelne Preview, die durch den neuesten Text ersetzt wird.
block: Preview wird in gechunkten/angehängten Schritten aktualisiert.
progress: Fortschritts-/Status-Preview während der Generierung, finale Antwort nach Abschluss.

streaming.mode: "block" ist ein Preview-Streaming-Modus für bearbeitungsfähige Kanäle wie Discord und Telegram. Er aktiviert dort keine Block-Zustellung im Kanal. Verwenden Sie streaming.block.enabled oder den Legacy-Kanalschlüssel blockStreaming, wenn Sie normale Block-Antworten wünschen. Microsoft Teams ist die Ausnahme: Es hat keinen Draft-Preview-Block-Transport, daher wird streaming.mode: "block" auf Teams-Block-Zustellung statt auf natives Partial-/Progress-Streaming abgebildet.

Kanalzuordnung

Kanal	`off`	`partial`	`block`	`progress`
Telegram	✅	✅	✅	bearbeitbarer Fortschritts-Draft
Discord	✅	✅	✅	bearbeitbarer Fortschritts-Draft
Slack	✅	✅	✅	✅
Mattermost	✅	✅	✅	✅
MS Teams	✅	✅	✅	nativer Fortschritts-Stream

Nur Slack:

channels.slack.streaming.nativeTransport schaltet Slack-native Streaming-API-Aufrufe um, wenn channels.slack.streaming.mode="partial" (Standard: true).
Slack-natives Streaming und Slack-Assistenten-Threadstatus benötigen ein Antwort-Thread-Ziel. Top-Level-DMs zeigen diese Preview im Thread-Stil nicht an, können aber weiterhin Slack-Draft-Preview-Beiträge und Bearbeitungen verwenden.

Migration von Legacy-Schlüsseln:

Telegram: Legacy-streamMode und skalare/boolesche streaming-Werte werden erkannt und über Doctor-/Konfigurationskompatibilitätspfade zu streaming.mode migriert.
Discord: streamMode + boolesches streaming bleiben Runtime-Aliasse für das streaming-Enum; führen Sie openclaw doctor --fix aus, um persistierte Konfiguration umzuschreiben.
Slack: streamMode bleibt ein Runtime-Alias für streaming.mode; boolesches streaming bleibt ein Runtime-Alias für streaming.mode plus streaming.nativeTransport; Legacy-nativeStreaming bleibt ein Runtime-Alias für streaming.nativeTransport. Führen Sie openclaw doctor --fix aus, um persistierte Konfiguration umzuschreiben.

Runtime-Verhalten

Telegram:

Verwendet sendMessage + editMessageText für Preview-Aktualisierungen in DMs und Gruppen/Themen.
Finaler Text bearbeitet die aktive Preview direkt; lange finale Antworten verwenden diese Nachricht für den ersten Chunk wieder und senden nur die verbleibenden Chunks.
Der Modus progress hält Tool-Fortschritt in einem bearbeitbaren Status-Draft, löscht diesen Draft bei Abschluss und sendet die finale Antwort über normale Zustellung.
Wenn die finale Bearbeitung fehlschlägt, bevor der abgeschlossene Text bestätigt wurde, verwendet OpenClaw normale finale Zustellung und bereinigt die veraltete Preview.
Preview-Streaming wird übersprungen, wenn Telegram-Block-Streaming explizit aktiviert ist (um doppeltes Streaming zu vermeiden).
/reasoning stream kann Reasoning in eine transiente Preview schreiben, die nach der finalen Zustellung gelöscht wird.

Discord:

Verwendet Senden + Bearbeiten von Preview-Nachrichten.
Der Modus block verwendet Draft-Chunking (draftChunk).
Preview-Streaming wird übersprungen, wenn Discord-Block-Streaming explizit aktiviert ist.
Finale Medien-, Fehler- und Explicit-Reply-Payloads brechen ausstehende Previews ab, ohne einen neuen Draft zu flushen, und verwenden dann normale Zustellung.

Slack:

partial kann Slack-natives Streaming (chat.startStream/append/stop) verwenden, wenn verfügbar.
block verwendet Draft-Previews im Append-Stil.
progress verwendet Status-Preview-Text und danach die finale Antwort.
Top-Level-DMs ohne Antwort-Thread verwenden Draft-Preview-Beiträge und Bearbeitungen statt Slack-nativem Streaming.
Native und Draft-Preview-Streaming unterdrücken Block-Antworten für diesen Turn, sodass eine Slack-Antwort nur über einen Zustellpfad gestreamt wird.
Finale Medien-/Fehler-Payloads und Progress-Finals erstellen keine wegwerfbaren Draft-Nachrichten; nur Text-/Block-Finals, die die Preview bearbeiten können, flushen ausstehenden Draft-Text.

Mattermost:

Streamt Thinking, Tool-Aktivität und partiellen Antworttext in einen einzelnen Draft-Preview-Beitrag, der direkt finalisiert wird, wenn die finale Antwort sicher gesendet werden kann.
Fällt auf das Senden eines neuen finalen Beitrags zurück, wenn der Preview-Beitrag gelöscht wurde oder zum Finalisierungszeitpunkt anderweitig nicht verfügbar ist.
Finale Medien-/Fehler-Payloads brechen ausstehende Preview-Aktualisierungen vor der normalen Zustellung ab, statt einen temporären Preview-Beitrag zu flushen.

Matrix:

Draft-Previews werden direkt finalisiert, wenn der finale Text das Preview-Event wiederverwenden kann.
Nur-Medien-, Fehler- und Reply-Target-Mismatch-Finals brechen ausstehende Preview-Aktualisierungen vor der normalen Zustellung ab; eine bereits sichtbare veraltete Preview wird redigiert.

Tool-Fortschritts-Preview-Aktualisierungen

Preview-Streaming kann auch Tool-Fortschritts-Aktualisierungen enthalten - kurze Statuszeilen wie „Web wird durchsucht“, „Datei wird gelesen“ oder „Tool wird aufgerufen“ -, die während laufender Tools vor der finalen Antwort in derselben Preview-Nachricht erscheinen. Dadurch bleiben mehrstufige Tool-Turns visuell aktiv, statt zwischen der ersten Thinking-Preview und der finalen Antwort stumm zu bleiben.

Unterstützte Oberflächen:

Discord, Slack, Telegram und Matrix streamen Tool-Fortschritt standardmäßig in die Live-Vorschau-Bearbeitung, wenn Vorschau-Streaming aktiv ist. Microsoft Teams verwendet in persönlichen Chats seinen nativen Fortschrittsstream.
Telegram wird seit v2026.4.22 mit aktivierten Tool-Fortschrittsaktualisierungen in der Vorschau ausgeliefert; wenn sie aktiviert bleiben, bleibt dieses veröffentlichte Verhalten erhalten.
Mattermost bindet Tool-Aktivitäten bereits in seinen einzelnen Entwurfsvorschau-Beitrag ein (siehe oben).
Tool-Fortschrittsbearbeitungen folgen dem aktiven Vorschau-Streamingmodus; sie werden übersprungen, wenn Vorschau-Streaming off ist oder wenn Block-Streaming die Nachricht übernommen hat. Bei Telegram ist streaming.mode: "off" nur final: Allgemeines Fortschrittsrauschen wird ebenfalls unterdrückt, statt als eigenständige Statusmeldungen zugestellt zu werden, während Genehmigungsaufforderungen, Medien-Payloads und Fehler weiterhin normal weitergeleitet werden.
Um Vorschau-Streaming beizubehalten, aber Tool-Fortschrittszeilen auszublenden, setzen Sie streaming.preview.toolProgress für diesen Kanal auf false. Um Tool-Fortschrittszeilen sichtbar zu lassen und gleichzeitig Befehls-/Ausführungstext auszublenden, setzen Sie streaming.preview.commandText auf "status" oder streaming.progress.commandText auf "status"; der Standardwert ist "raw", um das veröffentlichte Verhalten beizubehalten. Diese Richtlinie wird von Entwurfs-/Fortschrittskanälen gemeinsam genutzt, die OpenClaws kompakten Fortschrittsrenderer verwenden, darunter Discord, Matrix, Microsoft Teams, Mattermost, Slack-Entwurfsvorschauen und Telegram. Um Vorschau-Bearbeitungen vollständig zu deaktivieren, setzen Sie streaming.mode auf off.
Ausgewählte Zitatantworten in Telegram sind eine Ausnahme: Wenn replyToMode nicht "off" ist und ausgewählter Zitattext vorhanden ist, überspringt OpenClaw den Antwort-Vorschaustream für diesen Durchlauf, sodass Tool-Fortschrittszeilen in der Vorschau nicht gerendert werden können. Antworten auf aktuelle Nachrichten ohne ausgewählten Zitattext behalten Vorschau-Streaming weiterhin bei. Details finden Sie in der Telegram-Kanaldokumentation.

Fortschrittszeilen sichtbar lassen, aber rohen Befehls-/Ausführungstext ausblenden:

{
  "channels": {
    "telegram": {
      "streaming": {
        "mode": "partial",
        "preview": {
          "toolProgress": true,
          "commandText": "status"
        }
      }
    }
  }
}

Verwenden Sie dieselbe Struktur unter einem anderen kompakten Fortschrittskanal-Schlüssel, zum Beispiel channels.discord, channels.matrix, channels.msteams, channels.mattermost oder Slack-Entwurfsvorschauen. Für den Fortschrittsentwurfsmodus legen Sie dieselbe Richtlinie unter streaming.progress ab:

{
  "channels": {
    "telegram": {
      "streaming": {
        "mode": "progress",
        "progress": {
          "toolProgress": true,
          "commandText": "status"
        }
      }
    }
  }
}

Verwandt

Refaktorierung des Nachrichtenlebenszyklus - Zielentwurf für gemeinsame Vorschau, Bearbeitung, Stream und Finalisierung
Fortschrittsentwürfe - sichtbare Nachrichten zu laufenden Arbeiten, die während langer Durchläufe aktualisiert werden
Nachrichten - Nachrichtenlebenszyklus und Zustellung
Wiederholung - Wiederholungsverhalten bei Zustellungsfehlern
Kanäle - Streaming-Unterstützung je Kanal

# Block-Streaming (Kanalnachrichten)

# Medienzustellung mit Block-Streaming

# Chunking-Algorithmus (untere/obere Grenzen)

# Coalescing (gestreamte Blöcke zusammenführen)

# Menschlich wirkende Pausen zwischen Blöcken

# „Chunks streamen oder alles“

# Preview-Streaming-Modi

# Kanalzuordnung

# Runtime-Verhalten

# Tool-Fortschritts-Preview-Aktualisierungen

# Verwandt