Что нового в Claude Sonnet 4.6?

Claude Sonnet 4.6 представляет значительные улучшения в написании кода, сложном планировании и способности управлять компьютерными интерфейсами как человек. По производительности она приближается к флагманской модели Opus 4.5, оставаясь при этом в более доступной ценовой категории.

Как Claude Sonnet 4.6 взаимодействует с программами?

Модель научилась взаимодействовать с софтом не через программные интерфейсы (API), а через визуальный интерфейс. Она может нажимать на кнопки и вводить текст, подобно обычному пользователю, что позволяет автоматизировать работу с устаревшим корпоративным ПО.

Какие преимущества Sonnet 4.6 дает бизнесу?

Для бизнеса Sonnet 4.6 делает продвинутые возможности ИИ экономически оправданными, позволяя автоматизировать сложные задачи и работу с устаревшими системами. Модель стала лучше выявлять баги и реже «галлюцинировать» при выполнении многошаговых инструкций, что повышает надежность агентских сценариев.

Каково контекстное окно у Claude Sonnet 4.6?

В бета-версии Claude Sonnet 4.6 доступно контекстное окно в 1 миллион токенов. Это позволяет загружать в модель целые кодовые базы или десятки научных статей за один раз для анализа и обработки.

Anthropic выпускает Claude Sonnet 4.6: шаг к автономному ...

Суть обновления

Anthropic представила новую версию своей модели среднего звена — Claude Sonnet 4.6. Это обновление позиционируется как значительный шаг вперед в ключевых областях: написание программного кода, сложное планирование и, что особенно важно, способность модели управлять компьютером подобно человеку.

Главная новость заключается в том, что по производительности Sonnet 4.6 вплотную приближается к флагманской модели предыдущего поколения (Opus 4.5), оставаясь при этом в более доступной ценовой категории. Это делает продвинутые возможности искусственного интеллекта экономически оправданными для широкого спектра бизнес-задач.

Контекст: эволюция «компьютерного зрения» для интерфейсов

Еще в октябре 2024 года Anthropic впервые показала экспериментальную функцию «использования компьютера» (computer use). Идея заключалась в том, чтобы научить нейросеть взаимодействовать с софтом не через программные интерфейсы (API), а через визуальный интерфейс — нажимая на кнопки и вводя текст, как это делает обычный пользователь.

Chart comparing several Sonnet model scores on the OSWorld benchmark

Тогда технология была сырой и медленной. Спустя полтора года, в версии Sonnet 4.6, мы видим качественный скачок. Модель теперь увереннее справляется с навигацией по сложным таблицам, заполнением многоступенчатых веб-форм и работой сразу в нескольких вкладках браузера. Это открывает путь к автоматизации устаревшего корпоративного ПО, для которого никогда не создавались современные API.

Детали и технические характеристики

Вот ключевые особенности релиза:

Контекстное окно: В бета-версии доступно окно в 1 миллион токенов. Это позволяет загружать в модель целые кодовые базы или десятки научных статей за один раз.
Производительность в коде: Разработчики, получившие ранний доступ, в 70% случаев предпочли Sonnet 4.6 предыдущей версии (Sonnet 4.5). Модель реже дублирует логику и лучше понимает контекст задачи.
Стратегическое мышление: В бенчмарке Vending-Bench Arena (симуляция управления бизнесом) модель продемонстрировала новую стратегию: она инвестировала в мощности на раннем этапе, жертвуя прибылью, чтобы резко увеличить доходность в конце. Это признак улучшения долгосрочного планирования.
Цена: Стоимость осталась на уровне Sonnet 4.5 — $3 за миллион токенов на вход и $15 на выход.

Анализ: демократизация интеллекта уровня Opus

Изображение из источника

Рынок ИИ движется к тому, что возможности, ранее доступные только в самых дорогих и медленных моделях (класса Opus или GPT-4), спускаются в сегмент более быстрых и дешевых моделей.

Sonnet 4.6 показывает результаты, сопоставимые с Opus 4.6 в задачах анализа документов (OfficeQA) и даже превосходит предыдущие версии в задачах на безопасность и устойчивость к инъекциям промптов. Для бизнеса это означает, что сложные агентские сценарии — где ИИ самостоятельно выполняет цепочку действий — становятся рентабельными.

Отзывы партнеров (GitHub, Replit, Databricks) подтверждают этот тренд: модель стала лучше выявлять баги и реже «галлюцинировать» при выполнении многошаговых инструкций.

Перспектива

Выпуск Sonnet 4.6 закрепляет тренд на создание «агентных» моделей. Мы уходим от парадигмы «чат-бот, который отвечает на вопросы» к парадигме «работник, который выполняет действия».

Хотя модель все еще уступает лучшим операторам-людям в скорости и точности использования компьютера, динамика улучшений за последние 16 месяцев впечатляет. Если темпы сохранятся, в ближайший год мы можем увидеть массовое внедрение ИИ-агентов, способных самостоятельно выполнять рутинную офисную работу в устаревших CRM и ERP системах без необходимости сложной технической интеграции.