Современные ИИ-агенты отлично справляются с выполнением разовых инструкций, но страдают от проблемы, которую исследователи называют синдромом «вечного стажёра». Каждый новый день они начинают с чистого листа, забывая специфику вашей среды. IBM Research представила ALTK-Evolve — систему, которая меняет этот подход, позволяя агентам извлекать уроки из прошлого опыта и применять их в новых ситуациях.
До сих пор попытки наделить агентов памятью сводились к простому добавлению предыдущих диалогов или журналов действий в контекст запроса. Это заставляло модель заново перечитывать историю, но не помогало ей делать обобщения. Как отмечает команда IBM, агентам нужны фундаментальные принципы, а не стенограммы прошлых бесед. ALTK-Evolve решает эту задачу, превращая сырые следы взаимодействия в структурированные руководства.
Система работает как непрерывный цикл, состоящий из двух потоков. Нисходящий поток (наблюдение и извлечение) фиксирует полную траекторию работы агента: реплики пользователя, размышления модели, вызовы инструментов и результаты. Затем специальные модули анализируют эти данные, находя структурные паттерны. Восходящий поток (улучшение и извлечение) работает в фоновом режиме: он объединяет дубликаты, удаляет слабые правила и повышает приоритет проверенных стратегий. В результате формируется компактная библиотека качественных инструкций.
Когда агент сталкивается с новой задачей, система не вываливает на него весь накопленный опыт. Вместо этого механизм поиска извлекает только те правила, которые релевантны в данный момент, и аккуратно внедряет их в контекст. Это позволяет избежать переполнения контекстного окна и снижает уровень информационного шума.
Эффективность подхода была проверена на бенчмарке AppWorld, где агенты выполняют многошаговые задачи через программные интерфейсы (API). Результаты показали, что наличие такой памяти повышает общую надежность выполнения задач на 8.9 процентных пункта. Наибольший прирост зафиксирован на сложных задачах, требующих нетривиальной логики — там успешность выросла с 19.1% до 33.3% (относительный рост на 74%). Агент действительно начал понимать принципы работы, а не просто заучивать последовательности действий.
Для разработчиков IBM предусмотрела несколько путей интеграции. Существует вариант без написания кода (через плагины для Claude Code и Codex), подход с минимальным кодированием для существующих фреймворков и глубокая интеграция через протокол контекстного контекста (MCP) для создания плотного цикла обучения.
Появление ALTK-Evolve указывает на важный сдвиг в индустрии. Развитие автономных систем переходит от создания всё более сложных стартовых инструкций к разработке механизмов непрерывного самообучения. В будущем ценность агента будет определяться не только базовой моделью, но и тем уникальным опытом, который он смог накопить и структурировать в процессе работы в конкретной корпоративной среде.