Sessions and memory

Compaction

Ogni modello ha una finestra di contesto: il numero massimo di token che può elaborare. Quando una conversazione si avvicina a quel limite, OpenClaw compatta i messaggi meno recenti in un riepilogo in modo che la chat possa continuare.

Come funziona

I turni di conversazione meno recenti vengono riassunti in una voce compatta.
Il riepilogo viene salvato nella trascrizione della sessione.
I messaggi recenti vengono mantenuti intatti.

Quando OpenClaw divide la cronologia in blocchi di Compaction, mantiene le chiamate agli strumenti dell'assistente abbinate alle rispettive voci toolResult. Se un punto di divisione cade all'interno di un blocco di strumenti, OpenClaw sposta il limite in modo che la coppia resti insieme e la coda corrente non riassunta venga preservata.

La cronologia completa della conversazione resta su disco. La Compaction cambia solo ciò che il modello vede al turno successivo.

Compaction automatica

La Compaction automatica è attiva per impostazione predefinita. Viene eseguita quando la sessione si avvicina al limite di contesto, oppure quando il modello restituisce un errore di overflow del contesto (in questo caso OpenClaw compatta e riprova).

Vedrai:

🧹 Auto-compaction complete in modalità dettagliata.
/status che mostra 🧹 Compactions: <count>.

Firme di overflow riconosciute

OpenClaw rileva l'overflow del contesto da questi pattern di errore dei provider:

request_too_large
context length exceeded
input exceeds the maximum number of tokens
input token count exceeds the maximum number of input tokens
input is too long for the model
ollama error: context length exceeded

Compaction manuale

Digita /compact in qualsiasi chat per forzare una Compaction. Aggiungi istruzioni per guidare il riepilogo:

/compact Focus on the API design decisions

Quando agents.defaults.compaction.keepRecentTokens è impostato, la Compaction manuale rispetta quel punto di taglio Pi e mantiene la coda recente nel contesto ricostruito. Senza un budget esplicito da mantenere, la Compaction manuale si comporta come un checkpoint rigido e continua solo dal nuovo riepilogo.

Configurazione

Configura la Compaction in agents.defaults.compaction nel tuo openclaw.json. Le opzioni più comuni sono elencate sotto; per il riferimento completo, consulta Approfondimento sulla gestione delle sessioni.

Usare un modello diverso

Per impostazione predefinita, la Compaction usa il modello principale dell'agente. Imposta agents.defaults.compaction.model per delegare la sintesi a un modello più capace o specializzato. L'override accetta qualsiasi stringa provider/model-id:

{
  "agents": {
    "defaults": {
      "compaction": {
        "model": "openrouter/anthropic/claude-sonnet-4-6"
      }
    }
  }
}

Funziona anche con modelli locali, per esempio un secondo modello Ollama dedicato alla sintesi:

{
  "agents": {
    "defaults": {
      "compaction": {
        "model": "ollama/llama3.1:8b"
      }
    }
  }
}

Quando non è impostata, la Compaction parte dal modello della sessione attiva. Se la sintesi fallisce con un errore del provider idoneo al fallback del modello, OpenClaw riprova quel tentativo di Compaction tramite la catena di fallback dei modelli già esistente della sessione. La scelta di fallback è temporanea e non viene riscritta nello stato della sessione. Un override esplicito di agents.defaults.compaction.model resta esatto e non eredita la catena di fallback della sessione.

Conservazione degli identificatori

La sintesi della Compaction preserva per impostazione predefinita gli identificatori opachi (identifierPolicy: "strict"). Usa l'override identifierPolicy: "off" per disabilitarla, oppure identifierPolicy: "custom" più identifierInstructions per indicazioni personalizzate.

Protezione sui byte della trascrizione attiva

Quando agents.defaults.compaction.maxActiveTranscriptBytes è impostato, OpenClaw attiva la normale Compaction locale prima di un'esecuzione se il JSONL attivo raggiunge quella dimensione. Questo è utile per sessioni di lunga durata in cui la gestione del contesto lato provider può mantenere sano il contesto del modello mentre la trascrizione locale continua a crescere. Non divide i byte JSONL grezzi; chiede alla normale pipeline di Compaction di creare un riepilogo semantico.

Trascrizioni successive

Quando agents.defaults.compaction.truncateAfterCompaction è abilitato, OpenClaw non riscrive sul posto la trascrizione esistente. Crea una nuova trascrizione attiva successiva dal riepilogo della Compaction, dallo stato preservato e dalla coda non riassunta, poi mantiene il JSONL precedente come sorgente del checkpoint archiviato. Le trascrizioni successive eliminano anche i duplicati esatti di turni utente lunghi che arrivano all'interno di una breve finestra di nuovo tentativo, così le tempeste di retry del canale non vengono portate nella successiva trascrizione attiva dopo la Compaction.

I checkpoint pre-Compaction vengono conservati solo finché restano sotto il limite di dimensione dei checkpoint di OpenClaw; le trascrizioni attive sovradimensionate vengono comunque compattate, ma OpenClaw salta il grande snapshot di debug invece di raddoppiare l'uso del disco.

Avvisi di Compaction

Per impostazione predefinita, la Compaction viene eseguita silenziosamente. Imposta notifyUser per mostrare brevi messaggi di stato quando la Compaction inizia e termina:

{
  agents: {
    defaults: {
      compaction: {
        notifyUser: true,
      },
    },
  },
}

Flush della memoria

Prima della Compaction, OpenClaw può eseguire un turno di flush silenzioso della memoria per archiviare su disco note durevoli. Imposta agents.defaults.compaction.memoryFlush.model quando questo turno di manutenzione deve usare un modello locale invece del modello della conversazione attiva:

{
  "agents": {
    "defaults": {
      "compaction": {
        "memoryFlush": {
          "model": "ollama/qwen3:8b"
        }
      }
    }
  }
}

L'override del modello per il flush della memoria è esatto e non eredita la catena di fallback della sessione attiva. Consulta Memoria per dettagli e configurazione.

Provider di Compaction collegabili

I Plugin possono registrare un provider di Compaction personalizzato tramite registerCompactionProvider() sull'API del Plugin. Quando un provider è registrato e configurato, OpenClaw gli delega la sintesi invece di usare la pipeline LLM integrata.

Per usare un provider registrato, imposta il suo id nella tua configurazione:

{
  "agents": {
    "defaults": {
      "compaction": {
        "provider": "my-provider"
      }
    }
  }
}

Impostare un provider forza automaticamente mode: "safeguard". I provider ricevono le stesse istruzioni di Compaction e la stessa policy di conservazione degli identificatori del percorso integrato, e OpenClaw preserva comunque il contesto del suffisso dei turni recenti e dei turni divisi dopo l'output del provider.

Compaction e sfoltimento

	Compaction	Sfoltimento
Cosa fa	Riassume la conversazione meno recente	Taglia i vecchi risultati degli strumenti
Salvato?	Sì (nella trascrizione della sessione)	No (solo in memoria, per richiesta)
Ambito	Intera conversazione	Solo risultati degli strumenti

Lo sfoltimento della sessione è un complemento più leggero che taglia l'output degli strumenti senza riassumerlo.

Risoluzione dei problemi

Compaction troppo frequente? La finestra di contesto del modello potrebbe essere piccola, oppure gli output degli strumenti potrebbero essere grandi. Prova ad abilitare lo sfoltimento della sessione.

Il contesto sembra obsoleto dopo la Compaction? Usa /compact Focus on <topic> per guidare il riepilogo, oppure abilita il flush della memoria affinché le note sopravvivano.

Hai bisogno di ripartire da zero? /new avvia una nuova sessione senza compattare.

Per la configurazione avanzata (token di riserva, conservazione degli identificatori, motori di contesto personalizzati, Compaction lato server OpenAI), consulta l'Approfondimento sulla gestione delle sessioni.

Correlati

Sessione: gestione e ciclo di vita della sessione.
Sfoltimento della sessione: taglio dei risultati degli strumenti.
Contesto: come viene costruito il contesto per i turni dell'agente.
Hook: hook del ciclo di vita della Compaction (before_compaction, after_compaction).

# Come funziona

# Compaction automatica

# Compaction manuale

# Configurazione

# Usare un modello diverso

# Conservazione degli identificatori

# Protezione sui byte della trascrizione attiva

# Trascrizioni successive

# Avvisi di Compaction

# Flush della memoria

# Provider di Compaction collegabili

# Compaction e sfoltimento

# Risoluzione dei problemi

# Correlati

Come funziona

Compaction automatica

Compaction manuale

Configurazione

Usare un modello diverso

Conservazione degli identificatori

Protezione sui byte della trascrizione attiva

Trascrizioni successive

Avvisi di Compaction

Flush della memoria

Provider di Compaction collegabili

Compaction e sfoltimento

Risoluzione dei problemi

Correlati