Fundamentals
Moteur de contexte
Un moteur de contexte contrôle la façon dont OpenClaw construit le contexte du modèle pour chaque exécution : quels messages inclure, comment résumer l’historique ancien et comment gérer le contexte au-delà des limites des sous-agents.
OpenClaw est livré avec un moteur legacy intégré et l’utilise par défaut - la plupart des utilisateurs n’ont jamais besoin de modifier cela. Installez et sélectionnez un moteur Plugin uniquement lorsque vous souhaitez un comportement différent d’assemblage, de Compaction ou de rappel intersessions.
Démarrage rapide
Vérifier quel moteur est actif
openclaw doctor
# or inspect config directly:
cat ~/.openclaw/openclaw.json | jq '.plugins.slots.contextEngine'
Installer un moteur Plugin
Les plugins de moteur de contexte s’installent comme n’importe quel autre Plugin OpenClaw.
Depuis npm
openclaw plugins install @martian-engineering/lossless-claw
Depuis un chemin local
openclaw plugins install -l ./my-context-engine
Activer et sélectionner le moteur
// openclaw.json
{
plugins: {
slots: {
contextEngine: "lossless-claw", // must match the plugin's registered engine id
},
entries: {
"lossless-claw": {
enabled: true,
// Plugin-specific config goes here (see the plugin's docs)
},
},
},
}
Redémarrez le Gateway après l’installation et la configuration.
Revenir à legacy (facultatif)
Définissez contextEngine sur "legacy" (ou supprimez entièrement la clé - "legacy" est la valeur par défaut).
Fonctionnement
Chaque fois qu’OpenClaw exécute un prompt de modèle, le moteur de contexte intervient à quatre points du cycle de vie :
1. Ingestion
Appelé lorsqu’un nouveau message est ajouté à la session. Le moteur peut stocker ou indexer le message dans son propre magasin de données.
2. Assemblage
Appelé avant chaque exécution de modèle. Le moteur renvoie un ensemble ordonné de messages (et un systemPromptAddition facultatif) qui tiennent dans le budget de tokens.
3. Compactage
Appelé lorsque la fenêtre de contexte est pleine, ou lorsque l’utilisateur exécute /compact. Le moteur résume l’historique ancien pour libérer de l’espace.
4. Après le tour
Appelé après la fin d’une exécution. Le moteur peut persister l’état, déclencher une Compaction en arrière-plan ou mettre à jour des index.
Pour le harnais Codex non-ACP fourni, OpenClaw applique le même cycle de vie en projetant le contexte assemblé dans les instructions développeur de Codex et dans le prompt du tour courant. Codex reste propriétaire de son historique de fil natif et de son compacteur natif.
Cycle de vie des sous-agents (facultatif)
OpenClaw appelle deux hooks facultatifs du cycle de vie des sous-agents :
prepareSubagentSpawnmethodPrépare l’état de contexte partagé avant le démarrage d’une exécution enfant. Le hook reçoit les clés de session parent/enfant, contextMode (isolated ou fork), les ids/fichiers de transcription disponibles et une TTL facultative. S’il renvoie un handle de rollback, OpenClaw l’appelle lorsque le lancement échoue après une préparation réussie.
onSubagentEndedmethodNettoie lorsqu’une session de sous-agent se termine ou est balayée.
Ajout au prompt système
La méthode assemble peut renvoyer une chaîne systemPromptAddition. OpenClaw la préfixe au prompt système de l’exécution. Cela permet aux moteurs d’injecter des consignes dynamiques de rappel, des instructions de récupération ou des indices contextuels sans nécessiter de fichiers statiques dans l’espace de travail.
Le moteur legacy
Le moteur legacy intégré préserve le comportement d’origine d’OpenClaw :
- Ingestion : aucune opération (le gestionnaire de session gère directement la persistance des messages).
- Assemblage : transfert direct (le pipeline existant sanitize → validate → limit dans le runtime gère l’assemblage du contexte).
- Compactage : délègue à la Compaction de résumé intégrée, qui crée un résumé unique des messages anciens et conserve les messages récents intacts.
- Après le tour : aucune opération.
Le moteur legacy n’enregistre pas d’outils et ne fournit pas de systemPromptAddition.
Lorsque plugins.slots.contextEngine n’est pas défini (ou qu’il est défini sur "legacy"), ce moteur est utilisé automatiquement.
Moteurs Plugin
Un Plugin peut enregistrer un moteur de contexte à l’aide de l’API Plugin :
export default function register(api) {
api.registerContextEngine("my-engine", (ctx) => ({
info: {
id: "my-engine",
name: "My Context Engine",
ownsCompaction: true,
},
async ingest({ sessionId, message, isHeartbeat }) {
// Store the message in your data store
return { ingested: true };
},
async assemble({ sessionId, messages, tokenBudget, availableTools, citationsMode }) {
// Return messages that fit the budget
return {
messages: buildContext(messages, tokenBudget),
estimatedTokens: countTokens(messages),
systemPromptAddition: buildMemorySystemPromptAddition({
availableTools: availableTools ?? new Set(),
citationsMode,
}),
};
},
async compact({ sessionId, force }) {
// Summarize older context
return { ok: true, compacted: true };
},
}));
}
La factory ctx inclut des valeurs facultatives config, agentDir et workspaceDir afin que les plugins puissent initialiser un état par agent ou par espace de travail avant l’exécution du premier hook de cycle de vie.
Activez-le ensuite dans la configuration :
{
plugins: {
slots: {
contextEngine: "my-engine",
},
entries: {
"my-engine": {
enabled: true,
},
},
},
}
L’interface ContextEngine
Membres requis :
| Membre | Type | Objectif |
|---|---|---|
info |
Propriété | Id du moteur, nom, version et s’il possède la Compaction |
ingest(params) |
Méthode | Stocker un seul message |
assemble(params) |
Méthode | Construire le contexte pour une exécution de modèle (renvoie AssembleResult) |
compact(params) |
Méthode | Résumer/réduire le contexte |
assemble renvoie un AssembleResult avec :
messagesMessage[]requiredLes messages ordonnés à envoyer au modèle.
estimatedTokensnumberrequiredL’estimation par le moteur du nombre total de tokens dans le contexte assemblé. OpenClaw l’utilise pour les décisions de seuil de Compaction et les rapports de diagnostic.
systemPromptAdditionstringPréfixé au prompt système.
promptAuthority"assembled" | "preassembly_may_overflow"Contrôle l’estimation de tokens que le runner utilise pour les précontrôles préventifs de dépassement. La valeur par défaut est "assembled", ce qui signifie que seule l’estimation du prompt assemblé est vérifiée - ce qui convient aux moteurs qui renvoient un contexte fenêtré et autonome. Définissez sur "preassembly_may_overflow" uniquement lorsque votre vue assemblée peut masquer un risque de dépassement dans la transcription sous-jacente ; le runner prend alors le maximum entre l’estimation assemblée et l’estimation de l’historique de session préassemblage (non fenêtré) lorsqu’il décide s’il faut compacter préventivement. Dans tous les cas, les messages que vous renvoyez restent ce que le modèle voit - promptAuthority n’affecte que le précontrôle.
compact renvoie un CompactResult. Lorsque la Compaction fait tourner la transcription active, result.sessionId et result.sessionFile identifient la session successeure que la prochaine nouvelle tentative ou le prochain tour doit utiliser.
Membres facultatifs :
| Membre | Type | Objectif |
|---|---|---|
bootstrap(params) |
Méthode | Initialiser l’état du moteur pour une session. Appelé une fois lorsque le moteur voit une session pour la première fois (par exemple, import d’historique). |
ingestBatch(params) |
Méthode | Ingérer un tour terminé sous forme de lot. Appelé après la fin d’une exécution, avec tous les messages de ce tour en une seule fois. |
afterTurn(params) |
Méthode | Travail de cycle de vie après exécution (persister l’état, déclencher une Compaction en arrière-plan). |
prepareSubagentSpawn(params) |
Méthode | Configurer l’état partagé pour une session enfant avant son démarrage. |
onSubagentEnded(params) |
Méthode | Nettoyer après la fin d’un sous-agent. |
dispose() |
Méthode | Libérer les ressources. Appelé lors de l’arrêt du Gateway ou du rechargement d’un Plugin - pas par session. |
ownsCompaction
ownsCompaction contrôle si la Compaction automatique intégrée dans la tentative de Pi reste activée pour l’exécution :
ownsCompaction : true
Le moteur possède le comportement de Compaction. OpenClaw désactive la Compaction automatique intégrée de Pi pour cette exécution, et l’implémentation compact() du moteur est responsable de /compact, de la Compaction de récupération après dépassement et de toute Compaction proactive qu’il souhaite effectuer dans afterTurn(). OpenClaw peut toujours exécuter la protection pré-prompt contre les dépassements ; lorsqu’elle prédit que la transcription complète dépassera la limite, le chemin de récupération appelle compact() du moteur actif avant de soumettre un autre prompt.
ownsCompaction : false ou non défini
La Compaction automatique intégrée de Pi peut toujours s’exécuter pendant l’exécution du prompt, mais la méthode compact() du moteur actif est toujours appelée pour /compact et la récupération après dépassement.
Cela signifie qu’il existe deux modèles de Plugin valides :
Mode propriétaire
Implémentez votre propre algorithme de Compaction et définissez ownsCompaction: true.
Mode délégation
Définissez ownsCompaction: false et faites appeler delegateCompactionToRuntime(...) depuis openclaw/plugin-sdk/core par compact() pour utiliser le comportement de Compaction intégré d’OpenClaw.
Un compact() sans opération est dangereux pour un moteur actif non propriétaire, car il désactive le chemin normal de Compaction /compact et de récupération après dépassement pour ce slot de moteur.
Référence de configuration
{
plugins: {
slots: {
// Select the active context engine. Default: "legacy".
// Set to a plugin id to use a plugin engine.
contextEngine: "legacy",
},
},
}
Relation avec la Compaction et la mémoire
Compaction
La Compaction est l’une des responsabilités du moteur de contexte. Le moteur hérité délègue à la synthèse intégrée d’OpenClaw. Les moteurs Plugin peuvent implémenter n’importe quelle stratégie de compaction (résumés DAG, récupération vectorielle, etc.).
Plugins de mémoire
Les plugins de mémoire (plugins.slots.memory) sont distincts des moteurs de contexte. Les plugins de mémoire fournissent la recherche/récupération ; les moteurs de contexte contrôlent ce que le modèle voit. Ils peuvent fonctionner ensemble - un moteur de contexte peut utiliser les données d’un plugin de mémoire pendant l’assemblage. Les moteurs Plugin qui veulent utiliser le chemin de prompt de mémoire active doivent privilégier buildMemorySystemPromptAddition(...) depuis openclaw/plugin-sdk/core, qui convertit les sections du prompt de mémoire active en un systemPromptAddition prêt à être préfixé. Si un moteur a besoin d’un contrôle de plus bas niveau, il peut toujours extraire les lignes brutes depuis openclaw/plugin-sdk/memory-host-core via buildActiveMemoryPromptSection(...).
Élagage de session
La suppression en mémoire des anciens résultats d’outils s’exécute toujours, quel que soit le moteur de contexte actif.
Conseils
- Utilisez
openclaw doctorpour vérifier que votre moteur se charge correctement. - Si vous changez de moteur, les sessions existantes continuent avec leur historique actuel. Le nouveau moteur prend le relais pour les exécutions futures.
- Les erreurs de moteur sont journalisées et affichées dans les diagnostics. Si un moteur Plugin ne parvient pas à s’enregistrer ou si l’id du moteur sélectionné ne peut pas être résolu, OpenClaw ne revient pas automatiquement au moteur précédent ; les exécutions échouent jusqu’à ce que vous corrigiez le plugin ou repassiez
plugins.slots.contextEngineà"legacy". - Pour le développement, utilisez
openclaw plugins install -l ./my-enginepour lier un répertoire de plugin local sans le copier.
Connexe
- Compaction - synthèse des longues conversations
- Contexte - comment le contexte est construit pour les tours d’agent
- Architecture des Plugin - enregistrement des plugins de moteur de contexte
- Manifeste de Plugin - champs du manifeste de plugin
- Plugins - vue d’ensemble des plugins