В чем главная проблема большинства современных мульти-агентных AI-систем?

Основная проблема в том, что большинство таких систем гомогенны: под капотом у разных «агентов» работает одна и та же языковая модель, что приводит к неэффективному использованию ресурсов и переплате за API.

Как один AI-агент может выполнять задачи так же эффективно, как целая команда?

Один агент может достичь тех же результатов, если его последовательно направлять через правильный диалог, имитируя шаги, которые ранее выполняла бы команда из нескольких «виртуальных сотрудников» с одной и той же базовой моделью.

Что такое алгоритм OneFlow и как он работает?

OneFlow — это алгоритм, который автоматически перестраивает сложные многоагентные рабочие процессы для выполнения одной языковой моделью. Он оптимизирует процесс, сохраняя качество и значительно повышая скорость и экономичность.

Почему использование одного AI-агента выгоднее с точки зрения скорости и стоимости?

Одиночный агент экономичнее и быстрее благодаря переиспользованию KV-кэша. Ему не требуется заново загружать контекст для каждого «нового» участника беседы, что сокращает вычислительные затраты и время обработки.

Означает ли это, что мульти-агентные системы полностью устарели?

Не совсем. Мульти-агентные системы по-прежнему имеют смысл, если они гетерогенны, то есть используют разные языковые модели для выполнения специализированных задач, которые не могут делить общий кэш памяти.

«Мульти-агентный» обман: почему один LLM работает лучше ц...

Вы тоже поверили в хайп вокруг AutoGen, CrewAI и LangGraph? Идея казалась гениальной: создаем команду виртуальных сотрудников (кодер, тестировщик, менеджер), даем им роли, и они решают задачи лучше, чем один ChatGPT.

Оказывается, мы просто сжигали видеокарты.

Свежее исследование, опубликованное на arXiv («Rethinking the Value of Multi-Agent Workflow»), переворачивает игру. Ученые задались вопросом: а что, если вся эта «магия» взаимодействия агентов — фикция?

Театр одного актера

Проблема большинства современных систем в том, что они гомогенны. То есть, под капотом у «менеджера» и «кодера» крутится одна и та же модель (например, GPT-4o), просто с разными промптами. Это похоже на одного актера, который бегает за кулисы, меняет парики и разговаривает сам с собой.

Исследователи доказали: если взять одного агента и заставить его последовательно выполнять те же шаги через правильный диалог, результат будет идентичным.

OneFlow: Алгоритм убийца

Авторы представили алгоритм OneFlow. Он берет сложный рабочий процесс, который раньше требовал толпы агентов, и автоматически перекраивает его под исполнение одной моделью.

Результаты шокируют:

Качество: Одиночный агент справляется с задачами (код, математика, планирование) так же хорошо, как и оптимизированные команды.
Скорость и цена: Одиночка выигрывает за счет переиспользования KV-кэша (KV cache reuse). Ему не нужно заново загружать контекст для каждого «нового» участника беседы.

Конец эпохи агентов?

Не совсем. Исследование делает важную оговорку: это работает только для систем, где все агенты используют одну и ту же модель.

Если ваша система гетерогенная (например, Claude 3.5 пишет код, а GPT-4o его проверяет) — мульти-агентность все еще имеет смысл, так как они не могут делить общий кэш памяти.

Но для 90% стартапов, которые просто плодят клонов одной модели, это сигнал: прекратите усложнять. Вы не создаете «рой интеллектов», вы просто переплачиваете за API.

«Мульти-агентный» обман: почему один LLM работает лучше целой команды

Театр одного актера

OneFlow: Алгоритм убийца

Конец эпохи агентов?

TL;DR

Главное

Ключевые факты

Инсайт

Читайте также

Экономика автономных агентов: почему стоимость токенов падает, а бюджеты на ИИ растут

Модели OpenAI GPT-5.6 стали доступны в Amazon Bedrock: новые уровни производительности и безопасности

Система SceneSmith от MIT: генерация виртуальных сред для обучения роботов с помощью ИИ-агентов

Гайды по теме