Смена правил: почему ИИ начал управлять другими нейросетями
Точность использования инструментов выросла с 50% до 90%. Это меняет архитектуру всего рынка: большие модели становятся «начальниками», нанимающими узких специалистов.
Точность использования инструментов выросла с 50% до 90%. Это меняет архитектуру всего рынка: большие модели становятся «начальниками», нанимающими узких специалистов.
2 мин

Еще два года назад GPT-4 проваливал более 50% задач, связанных с вызовом внешних функций. Модели галлюцинировали параметры, путали API и забывали контекст посреди диалога. Это делало идею полностью автономных агентов красивой мечтой, но нерабочим бизнес-планом.
Сегодня мы пересекли невидимый, но критический рубеж. Современные SOTA-модели (State of the Art) превышают 90% точности в бенчмарках по вызову инструментов. На практике, в моделях вроде Gemini 3, результаты еще выше. Это не просто улучшение метрик — это фундаментальный сдвиг в том, как работает искусственный интеллект.
Талантливые модели, как и талантливые люди, теперь получают повышение до менеджерских позиций. Claude управляет исполнением кода. Gemini маршрутизирует запросы между CRM и чатами. GPT-5 готовится координировать публичные биржевые исследования.
Оказалось, что для простого вызова функции нам действительно нужны модели с триллионами параметров. Эксперименты с «малыми моделями действий» (small action models) провалились в продакшене. Им не хватало контекста и понимания мира. Чтобы быть хорошим менеджером, нужно понимать не только инструкцию, но и нюансы ситуации.
Однако экономика диктует свои условия. Держать «триллионного» менеджера на каждой задаче дорого. Здесь на сцену выходит дистилляция: новые методы позволяют создавать модели на 40% меньше и на 60% быстрее, сохраняя при этом 97% производительности оригинала.
Рынок перестраивается в звездную систему. Фронтир-модель (самая мощная и умная) становится исполнительным директором. Она не делает работу руками. Она маршрутизирует задачи узким специалистам. И эти специалисты — главный шанс для новых компаний.
Когда точность вызова инструментов была 50%, разработчики строили монолиты, пытаясь удержать все внутри одной нейросети, чтобы ничего не сломалось. Когда точность достигла 90%, стало выгодно отдавать задачи на аутсорс специализированным агентам.
Гиганты вроде OpenAI и Google будут владеть слоем оркестрации — «директорами». Но они не могут создать лучшего специалиста в каждой нише. Стартапы, которые создадут лучший агент для браузера, лучшую систему поиска или лучшего BI-аналитика, встроятся в эти созвездия.
Новая возможность не в том, чтобы тренировать самую большую модель. А в том, чтобы создать специалиста, которому «директор» позвонит в первую очередь.
Рынок переходит от единых монолитных моделей к системе, где мощный ИИ управляет сетью узкоспециализированных агентов.
Главная возможность для стартапов сейчас — не создавать конкурента GPT, а строить «узкого специалиста», которого GPT будет нанимать для работы.