Sessions and memory

Compaction

Mọi mô hình đều có một cửa sổ ngữ cảnh: số token tối đa mà nó có thể xử lý. Khi một cuộc trò chuyện tiến gần đến giới hạn đó, OpenClaw Compaction các tin nhắn cũ hơn thành một bản tóm tắt để cuộc trò chuyện có thể tiếp tục.

Cách hoạt động

  1. Các lượt trò chuyện cũ hơn được tóm tắt thành một mục cô đọng.
  2. Bản tóm tắt được lưu trong bản ghi phiên.
  3. Các tin nhắn gần đây được giữ nguyên.

Khi OpenClaw chia lịch sử thành các đoạn Compaction, nó giữ các lệnh gọi công cụ của trợ lý đi kèm với các mục toolResult tương ứng. Nếu điểm chia nằm bên trong một khối công cụ, OpenClaw sẽ di chuyển ranh giới để cặp đó vẫn ở cùng nhau và phần đuôi hiện tại chưa được tóm tắt được bảo toàn.

Toàn bộ lịch sử trò chuyện vẫn nằm trên đĩa. Compaction chỉ thay đổi nội dung mà mô hình thấy ở lượt tiếp theo.

Compaction tự động

Compaction tự động được bật theo mặc định. Nó chạy khi phiên gần chạm giới hạn ngữ cảnh, hoặc khi mô hình trả về lỗi tràn ngữ cảnh (trong trường hợp đó OpenClaw thực hiện Compaction và thử lại).

Bạn sẽ thấy:

  • 🧹 Auto-compaction complete ở chế độ chi tiết.
  • /status hiển thị 🧹 Compactions: <count>.
Chữ ký tràn được nhận diện

OpenClaw phát hiện tràn ngữ cảnh từ các mẫu lỗi nhà cung cấp sau:

  • request_too_large
  • context length exceeded
  • input exceeds the maximum number of tokens
  • input token count exceeds the maximum number of input tokens
  • input is too long for the model
  • ollama error: context length exceeded

Compaction thủ công

Nhập /compact trong bất kỳ cuộc trò chuyện nào để buộc Compaction. Thêm hướng dẫn để định hướng bản tóm tắt:

/compact Focus on the API design decisions

Khi agents.defaults.compaction.keepRecentTokens được đặt, Compaction thủ công sẽ tôn trọng điểm cắt Pi đó và giữ phần đuôi gần đây trong ngữ cảnh được dựng lại. Nếu không có ngân sách giữ lại rõ ràng, Compaction thủ công hoạt động như một điểm kiểm tra cứng và tiếp tục chỉ từ bản tóm tắt mới.

Cấu hình

Cấu hình Compaction trong agents.defaults.compaction trong openclaw.json của bạn. Các nút điều chỉnh phổ biến nhất được liệt kê bên dưới; để xem tài liệu tham khảo đầy đủ, hãy xem Phân tích sâu về quản lý phiên.

Sử dụng một mô hình khác

Theo mặc định, Compaction dùng mô hình chính của agent. Đặt agents.defaults.compaction.model để ủy quyền việc tóm tắt cho một mô hình có năng lực hơn hoặc chuyên biệt hơn. Ghi đè này chấp nhận bất kỳ chuỗi provider/model-id nào:

{
  "agents": {
    "defaults": {
      "compaction": {
        "model": "openrouter/anthropic/claude-sonnet-4-6"
      }
    }
  }
}

Cách này cũng hoạt động với các mô hình cục bộ, ví dụ một mô hình Ollama thứ hai chuyên dùng cho việc tóm tắt:

{
  "agents": {
    "defaults": {
      "compaction": {
        "model": "ollama/llama3.1:8b"
      }
    }
  }
}

Khi không được đặt, Compaction bắt đầu với mô hình phiên đang hoạt động. Nếu việc tóm tắt thất bại với lỗi nhà cung cấp đủ điều kiện dự phòng mô hình, OpenClaw thử lại lần Compaction đó thông qua chuỗi dự phòng mô hình hiện có của phiên. Lựa chọn dự phòng là tạm thời và không được ghi lại vào trạng thái phiên. Một ghi đè agents.defaults.compaction.model rõ ràng vẫn chính xác và không kế thừa chuỗi dự phòng của phiên.

Bảo toàn định danh

Tóm tắt Compaction mặc định bảo toàn các định danh mờ (identifierPolicy: "strict"). Ghi đè bằng identifierPolicy: "off" để tắt, hoặc identifierPolicy: "custom" cùng với identifierInstructions để có hướng dẫn tùy chỉnh.

Bộ bảo vệ byte bản ghi đang hoạt động

Khi agents.defaults.compaction.maxActiveTranscriptBytes được đặt, OpenClaw kích hoạt Compaction cục bộ thông thường trước một lần chạy nếu JSONL đang hoạt động đạt đến kích thước đó. Điều này hữu ích cho các phiên chạy lâu, nơi quản lý ngữ cảnh phía nhà cung cấp có thể giữ ngữ cảnh mô hình khỏe mạnh trong khi bản ghi cục bộ tiếp tục tăng. Nó không chia nhỏ byte JSONL thô; nó yêu cầu pipeline Compaction thông thường tạo một bản tóm tắt ngữ nghĩa.

Bản ghi kế nhiệm

Khi agents.defaults.compaction.truncateAfterCompaction được bật, OpenClaw không ghi lại bản ghi hiện có tại chỗ. Nó tạo một bản ghi kế nhiệm đang hoạt động mới từ bản tóm tắt Compaction, trạng thái được bảo toàn và phần đuôi chưa được tóm tắt, rồi giữ JSONL trước đó làm nguồn điểm kiểm tra đã lưu trữ. Bản ghi kế nhiệm cũng loại bỏ các lượt người dùng dài trùng lặp chính xác đến trong một cửa sổ thử lại ngắn, để các cơn bão thử lại của kênh không được mang vào bản ghi đang hoạt động tiếp theo sau Compaction.

Các điểm kiểm tra trước Compaction chỉ được giữ lại khi chúng vẫn nằm dưới giới hạn kích thước điểm kiểm tra của OpenClaw; các bản ghi đang hoạt động quá lớn vẫn được Compaction, nhưng OpenClaw bỏ qua snapshot gỡ lỗi lớn thay vì tăng gấp đôi dung lượng đĩa sử dụng.

Thông báo Compaction

Theo mặc định, Compaction chạy im lặng. Đặt notifyUser để hiển thị các thông báo trạng thái ngắn khi Compaction bắt đầu và hoàn tất:

{
  agents: {
    defaults: {
      compaction: {
        notifyUser: true,
      },
    },
  },
}

Xả bộ nhớ

Trước Compaction, OpenClaw có thể chạy một lượt xả bộ nhớ im lặng để lưu các ghi chú bền vững vào đĩa. Đặt agents.defaults.compaction.memoryFlush.model khi lượt dọn dẹp này nên dùng một mô hình cục bộ thay vì mô hình cuộc trò chuyện đang hoạt động:

{
  "agents": {
    "defaults": {
      "compaction": {
        "memoryFlush": {
          "model": "ollama/qwen3:8b"
        }
      }
    }
  }
}

Ghi đè mô hình xả bộ nhớ là chính xác và không kế thừa chuỗi dự phòng của phiên đang hoạt động. Xem Bộ nhớ để biết chi tiết và cấu hình.

Nhà cung cấp Compaction có thể cắm thêm

Plugin có thể đăng ký nhà cung cấp Compaction tùy chỉnh qua registerCompactionProvider() trên API Plugin. Khi một nhà cung cấp được đăng ký và cấu hình, OpenClaw ủy quyền việc tóm tắt cho nhà cung cấp đó thay vì pipeline LLM tích hợp sẵn.

Để dùng một nhà cung cấp đã đăng ký, hãy đặt id của nó trong cấu hình của bạn:

{
  "agents": {
    "defaults": {
      "compaction": {
        "provider": "my-provider"
      }
    }
  }
}

Việc đặt một provider tự động buộc mode: "safeguard". Nhà cung cấp nhận cùng hướng dẫn Compaction và chính sách bảo toàn định danh như đường dẫn tích hợp sẵn, và OpenClaw vẫn bảo toàn ngữ cảnh hậu tố lượt gần đây và lượt bị chia sau đầu ra của nhà cung cấp.

Compaction so với cắt tỉa

Compaction Cắt tỉa
Chức năng Tóm tắt cuộc trò chuyện cũ hơn Cắt bớt kết quả công cụ cũ
Được lưu? Có (trong bản ghi phiên) Không (chỉ trong bộ nhớ, theo từng yêu cầu)
Phạm vi Toàn bộ cuộc trò chuyện Chỉ kết quả công cụ

Cắt tỉa phiên là một phần bổ trợ nhẹ hơn, cắt bớt đầu ra công cụ mà không tóm tắt.

Khắc phục sự cố

Compaction quá thường xuyên? Cửa sổ ngữ cảnh của mô hình có thể nhỏ, hoặc đầu ra công cụ có thể lớn. Hãy thử bật cắt tỉa phiên.

Ngữ cảnh có vẻ cũ sau Compaction? Dùng /compact Focus on <topic> để định hướng bản tóm tắt, hoặc bật xả bộ nhớ để các ghi chú được giữ lại.

Cần một khởi đầu sạch? /new bắt đầu một phiên mới mà không Compaction.

Để cấu hình nâng cao (token dự trữ, bảo toàn định danh, công cụ ngữ cảnh tùy chỉnh, Compaction phía máy chủ OpenAI), hãy xem Phân tích sâu về quản lý phiên.

Liên quan

  • Phiên: quản lý phiên và vòng đời.
  • Cắt tỉa phiên: cắt bớt kết quả công cụ.
  • Ngữ cảnh: cách ngữ cảnh được dựng cho các lượt agent.
  • Hooks: hook vòng đời Compaction (before_compaction, after_compaction).