Компания Anthropic объявила о выпуске своей новой большой языковой модели (LLM) — Claude Opus 4.7. Это обновление примечательно не столько сырым приростом вычислительной мощности, сколько качественным скачком в способности системы выполнять сложные, длительные задачи без постоянного вмешательства человека.
Сегодня индустрия искусственного интеллекта постепенно отходит от концепции простых диалоговых ботов. Пользователям, особенно в корпоративном секторе, требуются надежные автономные агенты, способные планировать свои действия и исправлять собственные ошибки. Opus 4.7 позиционируется именно как такой инструмент, ориентированный в первую очередь на инженеров и разработчиков программного обеспечения.
Разработка сложных систем требует от моделей умения удерживать контекст на протяжении долгого времени. Согласно заявлениям ранних тестировщиков, Opus 4.7 демонстрирует высокую устойчивость к зацикливанию — проблеме, когда модель бесконечно повторяет одни и те же ошибочные действия. Система научилась лучше распознавать логические ошибки еще на этапе планирования и корректно сообщать об отсутствии нужных данных, вместо того чтобы придумывать правдоподобные, но неверные ответы (галлюцинировать).
Помимо навыков программирования, модель получила улучшенное компьютерное зрение, позволяющее анализировать изображения в высоком разрешении. Это полезно для работы со сложными техническими схемами, химическими структурами и графическими интерфейсами. При этом стоимость использования через программный интерфейс (API) осталась на уровне предыдущей версии 4.6 и составляет 5 долларов за миллион входных токенов и 25 долларов за миллион выходных.
Важный аспект релиза — безопасность. Недавно Anthropic анонсировала проект Glasswing, посвященный изучению рисков ИИ в сфере кибербезопасности. Opus 4.7 служит своеобразным испытательным полигоном. Компания намеренно ограничила кибернетические возможности этой модели по сравнению со своей более мощной, но пока закрытой системой Mythos Preview. В Opus 4.7 встроены автоматические фильтры, блокирующие запросы, связанные с запрещенным или высокорисковым использованием в сфере информационной безопасности.
Для специалистов, занимающихся легитимными исследованиями уязвимостей, Anthropic запустила специальную программу верификации (Cyber Verification Program). Такой подход позволяет компании собирать данные о работе защитных механизмов в реальных условиях.
Стратегия Anthropic выглядит продуманной. Выпуская Opus 4.7, компания решает сразу две задачи: предоставляет разработчикам более надежный инструмент для асинхронных рабочих процессов и тестирует системы безопасности перед будущим релизом моделей класса Mythos.
Время покажет, насколько заявленная устойчивость модели подтвердится при массовом использовании. Однако уже сейчас очевидно, что вектор развития ИИ смещается в сторону предсказуемости, самопроверки и глубокой интеграции в профессиональные рабочие процессы.