«Мульти-агентный» обман: почему один LLM работает лучше целой команды
Весь 2025 год мы строили сложные системы из десятков AI-агентов. Новое исследование доказывает: это была пустая трата ресурсов. Один правильно настроенный бот уделывает их всех.
Весь 2025 год мы строили сложные системы из десятков AI-агентов. Новое исследование доказывает: это была пустая трата ресурсов. Один правильно настроенный бот уделывает их всех.
2 мин

Вы тоже поверили в хайп вокруг AutoGen, CrewAI и LangGraph? Идея казалась гениальной: создаем команду виртуальных сотрудников (кодер, тестировщик, менеджер), даем им роли, и они решают задачи лучше, чем один ChatGPT.
Оказывается, мы просто сжигали видеокарты.
Свежее исследование, опубликованное на arXiv («Rethinking the Value of Multi-Agent Workflow»), переворачивает игру. Ученые задались вопросом: а что, если вся эта «магия» взаимодействия агентов — фикция?
Проблема большинства современных систем в том, что они гомогенны. То есть, под капотом у «менеджера» и «кодера» крутится одна и та же модель (например, GPT-4o), просто с разными промптами. Это похоже на одного актера, который бегает за кулисы, меняет парики и разговаривает сам с собой.
Исследователи доказали: если взять одного агента и заставить его последовательно выполнять те же шаги через правильный диалог, результат будет идентичным.
Авторы представили алгоритм OneFlow. Он берет сложный рабочий процесс, который раньше требовал толпы агентов, и автоматически перекраивает его под исполнение одной моделью.
Результаты шокируют:
Не совсем. Исследование делает важную оговорку: это работает только для систем, где все агенты используют одну и ту же модель.
Если ваша система гетерогенная (например, Claude 3.5 пишет код, а GPT-4o его проверяет) — мульти-агентность все еще имеет смысл, так как они не могут делить общий кэш памяти.
Но для 90% стартапов, которые просто плодят клонов одной модели, это сигнал: прекратите усложнять. Вы не создаете «рой интеллектов», вы просто переплачиваете за API.
Сложные системы из множества одинаковых AI-агентов неэффективны: один агент с правильным алгоритмом (OneFlow) дает то же качество, но дешевле и быстрее.
Тренд на «агентность» часто является инженерным оверхедом: реальная польза от разделения ролей появляется только при использовании физически разных моделей (например, смешивании GPT и Llama).