Что такое "разрыв внедрения" в контексте ИИ-агентов?

"Разрыв внедрения" (deployment overhang) означает, что технические возможности ИИ-моделей работать автономно уже превышают тот уровень свободы, который пользователи готовы им предоставить на практике. Это указывает на недоиспользование потенциала агентов.

Как Anthropic определяет ИИ-агента в своем исследовании?

В рамках исследования Anthropic определяет ИИ-агента как систему, оснащенную инструментами для выполнения действий, таких как запуск кода, вызов API или отправка сообщений. Это позволяет агенту взаимодействовать с внешней средой.

Почему опытные пользователи ИИ-агентов чаще прерывают их работу?

Опытные пользователи чаще прерывают агентов вручную, даже предоставляя им больше автономии, чтобы скорректировать курс, если видят отклонение. Это отражает модель сотрудничества "доверяй, но направляй", где человек сохраняет контроль.

В каких сферах чаще всего используются автономные ИИ-агенты?

Почти 50% активности агентов через API приходится на разработку программного обеспечения. Также наблюдается рост их применения в здравоохранении, финансах и кибербезопасности, несмотря на высокие риски этих областей.

Почему реальное время автономной работы ИИ-агентов намного меньше их потенциала?

Медианное время автономной работы составляет около 45 секунд, хотя тесты показывают способность моделей работать часами. Это происходит потому, что пользователи предпочитают итеративный подход, постоянно корректируя действия агента, вместо того чтобы полностью делегировать задачу.

Anthropic: как люди на самом деле используют автономных И...

Anthropic: как люди на самом деле используют автономных ИИ-агентов

Исследование миллионов взаимодействий с Claude Code и API показывает: пользователи постепенно передают агентам больше автономии, но реальное применение всё ещё отстает от технических возможностей моделей.

18.02.2026, 21:01

Обновлено:05.05.2026, 10:14

3 мин чтения

11 просмотров

Суть исследования

Компания Anthropic опубликовала результаты масштабного анализа того, как люди используют ИИ-агентов в реальных условиях. Исследование, охватывающее миллионы взаимодействий через инструмент Claude Code и публичный API, ставит целью понять степень автономии, которую пользователи готовы доверить искусственному интеллекту.

Главный вывод: мы наблюдаем «разрыв внедрения» (deployment overhang). Технические возможности моделей работать автономно уже превышают тот уровень свободы, который им предоставляют пользователи на практике. Однако доверие растет: опытные инженеры всё чаще позволяют агентам работать без постоянного надзора.

Контекст: проблема измерения

Изучать ИИ-агентов сложно по нескольким причинам:

Нет единого определения, что такое «агент».
Сфера развивается слишком быстро (от простых чатов к многоагентным системам).
Разработчики моделей часто не видят архитектуру конечных приложений клиентов через API.

Изображение из источника

Anthropic приняла рабочее определение агента как ИИ-системы, оснащенной инструментами для выполнения действий (запуск кода, вызов API, отправка сообщений). Анализ проводился по двум направлениям: глубокий разбор сессий в собственном продукте Claude Code и широкий анализ вызовов инструментов через публичный API.