Выпуск Claude Mythos: незапланированные навыки поиска уязвимостей и смена парадигмы безопасности
Новая модель Anthropic объемом 10 триллионов параметров продемонстрировала эмерджентные способности к поиску уязвимостей. Это меняет подход к безопасности и создает структурное преимущество на рынке.

Компания Anthropic представила свою новую разработку — систему Claude Mythos. Это событие примечательно не только масштабом самой модели, но и тем, как именно она проявила свои возможности в области кибербезопасности.
Во время тестирования модель смогла обнаружить уязвимость 27-летней давности в одной из самых защищенных операционных систем, а также 16-летний дефект в программном обеспечении для работы с видео. Традиционные инструменты анализа проверяли этот код миллионы раз, но не находили скрытых ошибок.
Самое важное в этой новости кроется в отчете команды безопасности (red team) Anthropic. Разработчики не обучали Mythos целенаправленно искать уязвимости нулевого дня (zero-day). Эти выдающиеся навыки проявились совершенно самостоятельно.
В индустрии искусственного интеллекта это называется эмерджентными свойствами — когда при достижении определенного масштаба система начинает демонстрировать способности, которые в нее изначально не закладывали. В случае с Mythos глубокий анализ безопасности стал побочным продуктом (collateral output) общего улучшения логики, понимания архитектуры кода и автономности. Те же алгоритмы, которые делают большие языковые модели (LLM) эффективными при написании и исправлении программ, делают их невероятно результативными при поиске брешей.
Масштаб новой разработки впечатляет: около 10 триллионов параметров, что примерно в шесть раз превышает размер любой предыдущей передовой системы. Именно этот беспрецедентный скачок в объеме вычислений привел к качественному изменению способностей.
Это возвращает нас к главному вопросу о масштабировании искусственного интеллекта. Мы до сих пор не знаем, какие еще скрытые возможности дремлют в архитектурах подобного размера. Однако мы уже можем прогнозировать, как это отразится на технологическом бизнесе.
Доступ к передовым моделям становится определяющим фактором успеха. Anthropic развернула Mythos в соответствии со строгими стандартами безопасности ASL-3. Этот протокол применяется к системам, которые существенно повышают риск катастрофического неправомерного использования. Доступ в рамках закрытой программы Project Glasswing получили лишь немногим более сорока организаций. Остальному рынку придется ждать.



