Компания Anthropic представила Claude Opus 4.8 — обновленную версию своей старшей модели. Главными нововведениями стали не только улучшенные метрики в бенчмарках, но и новые механизмы контроля: теперь пользователи могут напрямую управлять тем, сколько вычислительных усилий модель тратит на решение задачи. При этом базовая стоимость использования осталась прежней.
Развитие больших языковых моделей (LLM) постепенно смещается от простого наращивания базы знаний к улучшению их способности действовать автономно. Индустрия нуждается в надежных агентах, способных выполнять многоэтапные задачи без постоянного контроля человека. Предыдущие версии Opus уже показывали хорошие результаты, но разработчикам требовалась большая предсказуемость и гибкость в управлении ресурсами.
Claude Opus 4.8 предлагает несколько существенных технических обновлений. Во-первых, появилась функция контроля усилий (effort control). Пользователи могут выбирать, насколько глубоко модель должна «обдумывать» ответ. На высоких настройках Claude тратит больше токенов на внутренние рассуждения, что повышает качество, а на низких — отвечает быстрее и экономит лимиты. По умолчанию установлен высокий уровень усилий.
Introducing Claude Opus 4.8
Во-вторых, в среде Claude Code представлены «динамические рабочие процессы» (dynamic workflows). Эта функция позволяет модели планировать задачу и запускать сотни параллельных подагентов в рамках одной сессии. Это открывает возможность для масштабных операций, таких как миграция сотен тысяч строк кода с автоматической проверкой результатов.
Ценовая политика для стандартных запросов не изменилась: 5 долларов за миллион входных токенов и 25 долларов за миллион выходных. Однако быстрый режим (fast mode), в котором модель работает в 2.5 раза быстрее, стал в три раза дешевле по сравнению с предыдущими поколениями.
Разработчики также получили важное обновление в Messages API. Теперь системные инструкции можно передавать внутри массива сообщений. Это позволяет менять контекст, лимиты токенов или права доступа прямо во время выполнения задачи, не сбрасывая кэш промптов.
Особое внимание уделено проблеме «галлюцинаций» и излишней самоуверенности ИИ. Внутренние тесты показывают, что Opus 4.8 в четыре раза реже оставляет без внимания ошибки в написанном коде по сравнению с версией 4.7. Модель чаще признает свою неуверенность и реже делает необоснованные заявления об успешном выполнении работы, если доказательств недостаточно.
Внедрение настройки «усилий» — это важный шаг к популяризации концепции масштабирования вычислений на этапе вывода (inference-time compute). Anthropic дает корпоративным клиентам инструмент для балансировки между стоимостью, скоростью и качеством. Улучшенная честность и способность к самопроверке делают модель более пригодной для юридических, финансовых и инженерных задач, где цена ошибки критически высока.
Opus 4.8 позиционируется как осязаемое, но не революционное улучшение. Однако компания уже анонсировала следующий шаг. В ближайшие недели ожидается релиз нового класса моделей под кодовым названием Mythos, которые сейчас проходят закрытое тестирование в сфере кибербезопасности. Это означает, что семейство Opus вскоре может уступить место еще более мощным системам.