Что представляет собой окно контекста? Полный гайд 2026

Суть

Команда разработчиков представила новый инструмент для Deep Agents SDK и интерфейса командной строки (CLI). Теперь искусственные агенты могут самостоятельно инициировать сжатие своего контекстного окна в наиболее подходящие для этого моменты. Это решение меняет традиционный подход к управлению рабочей памятью больших языковых моделей (LLM), передавая контроль от жестких алгоритмов самим нейросетям.

Контекст

Сжатие контекста — это базовая операция, которая уменьшает объем информации в рабочей памяти агента. По мере общения старые сообщения заменяются кратким резюме, которое сохраняет суть прогресса, необходимого для выполнения задачи. Это действие критически важно из-за ограниченного размера контекстного окна моделей и явления "гниения контекста" (context rot), когда обилие устаревшей информации начинает сбивать модель с толку.

Исторически системы управления агентами (harnesses) контролировали этот процесс с помощью фиксированных порогов. Например, стандартный профиль мог запускать очистку, когда заполнялось 85% доступного лимита токенов. Однако такой дизайн далек от идеала. Автоматика может запустить сжатие в самом разгаре сложного изменения программного кода, когда важна каждая деталь, вместо того чтобы сделать это при переходе к новой задаче.

Детали

Новый инструмент реализован как промежуточное программное обеспечение (middleware) в Deep Agents SDK. Когда агент решает вызвать инструмент сжатия, система сохраняет последние сообщения (около 10% от доступного контекста), а всю предшествующую переписку превращает в сжатое резюме.

Изображение из источника

В системном промпте модели даются инструкции о том, когда именно стоит применять этот инструмент. Оптимальные сценарии включают:

Четкие границы задач: когда пользователь сигнализирует о переходе к новой теме, или агент завершил текущий этап работы.
После извлечения результатов: когда агент проанализировал большой объем данных и сформулировал вывод или факт.
Перед поглощением новой информации: если агенту предстоит прочитать длинный документ или написать объемный черновик.
Перед сложным многоэтапным процессом: например, перед началом масштабного рефакторинга архитектуры.
При изменении вводных: когда новые требования пользователя делают предыдущий контекст недействительным.

Анализ

Это нововведение является отличной иллюстрацией так называемого "горького урока" (the bitter lesson) в исследованиях искусственного интеллекта. Суть этого принципа в том, что общие методы, использующие вычислительные мощности и возможности самих моделей, в долгосрочной перспективе всегда побеждают подходы, основанные на жестких правилах, написанных человеком.

Вместо того чтобы разработчики пытались предусмотреть все возможные сценарии и вручную настраивать пороги срабатывания для каждого отдельного приложения, система просто делегирует эту задачу агенту. Тестирование показало, что модели ведут себя консервативно и не злоупотребляют функцией, но когда они ее используют, это происходит в моменты, действительно улучшающие рабочий процесс.

Перспектива

Автономное сжатие контекста — это относительно небольшая функция, но она указывает на более широкое направление в проектировании ИИ-агентов. Будущее архитектуры агентов движется в сторону предоставления моделям большей автономии над своими внутренними процессами.

Автономное сжатие контекста: как ИИ-агенты учатся управлять собственной памятью

Суть

Контекст

Детали

Анализ

Перспектива

TL;DR

Главное

Ключевые факты

Инсайт

Читайте также

IBM выпускает коллекцию Granite 4.1: Эффективность и новые подходы к обучению

Стратегия OpenAI в кибербезопасности: как защитить инфраструктуру в эпоху искусственного интеллекта

Anthropic объединяет Claude с профессиональным софтом для креативной индустрии

Гайды по теме