Anthropic выпускает Claude Sonnet 4.6: шаг к автономному использованию компьютера
Новая модель Sonnet 4.6 приближается к уровню Opus, предлагая улучшения в написании кода, планировании и управлении интерфейсами программ без использования API.
Новая модель Sonnet 4.6 приближается к уровню Opus, предлагая улучшения в написании кода, планировании и управлении интерфейсами программ без использования API.
3 мин

Anthropic представила новую версию своей модели среднего звена — Claude Sonnet 4.6. Это обновление позиционируется как значительный шаг вперед в ключевых областях: написание программного кода, сложное планирование и, что особенно важно, способность модели управлять компьютером подобно человеку.
Главная новость заключается в том, что по производительности Sonnet 4.6 вплотную приближается к флагманской модели предыдущего поколения (Opus 4.5), оставаясь при этом в более доступной ценовой категории. Это делает продвинутые возможности искусственного интеллекта экономически оправданными для широкого спектра бизнес-задач.
Еще в октябре 2024 года Anthropic впервые показала экспериментальную функцию «использования компьютера» (computer use). Идея заключалась в том, чтобы научить нейросеть взаимодействовать с софтом не через программные интерфейсы (API), а через визуальный интерфейс — нажимая на кнопки и вводя текст, как это делает обычный пользователь.

Chart comparing several Sonnet model scores on the OSWorld benchmark
Тогда технология была сырой и медленной. Спустя полтора года, в версии Sonnet 4.6, мы видим качественный скачок. Модель теперь увереннее справляется с навигацией по сложным таблицам, заполнением многоступенчатых веб-форм и работой сразу в нескольких вкладках браузера. Это открывает путь к автоматизации устаревшего корпоративного ПО, для которого никогда не создавались современные API.
Вот ключевые особенности релиза:

Изображение из источника
Рынок ИИ движется к тому, что возможности, ранее доступные только в самых дорогих и медленных моделях (класса Opus или GPT-4), спускаются в сегмент более быстрых и дешевых моделей.
Sonnet 4.6 показывает результаты, сопоставимые с Opus 4.6 в задачах анализа документов (OfficeQA) и даже превосходит предыдущие версии в задачах на безопасность и устойчивость к инъекциям промптов. Для бизнеса это означает, что сложные агентские сценарии — где ИИ самостоятельно выполняет цепочку действий — становятся рентабельными.
Отзывы партнеров (GitHub, Replit, Databricks) подтверждают этот тренд: модель стала лучше выявлять баги и реже «галлюцинировать» при выполнении многошаговых инструкций.
Выпуск Sonnet 4.6 закрепляет тренд на создание «агентных» моделей. Мы уходим от парадигмы «чат-бот, который отвечает на вопросы» к парадигме «работник, который выполняет действия».
Хотя модель все еще уступает лучшим операторам-людям в скорости и точности использования компьютера, динамика улучшений за последние 16 месяцев впечатляет. Если темпы сохранятся, в ближайший год мы можем увидеть массовое внедрение ИИ-агентов, способных самостоятельно выполнять рутинную офисную работу в устаревших CRM и ERP системах без необходимости сложной технической интеграции.
Sonnet 4.6 делает возможности флагманских моделей доступными по цене среднего сегмента, значительно улучшая навыки программирования и автономного управления компьютером.
Главный прорыв не в мощности вычислений, а в способности модели работать с устаревшим софтом через визуальный интерфейс, что снимает необходимость в разработке дорогих API-коннекторов.