Суть
Компания Anthropic подтвердила создание новой языковой модели Claude Mythos, которая значительно превосходит предыдущие версии. Однако публичный релиз был отложен: модель оказалась настолько эффективной в поиске и эксплуатации программных уязвимостей, что ее открытый выпуск сочли слишком рискованным. Параллельно с этим компания Meta прервала долгое молчание в сфере передовых разработок и анонсировала собственную модель Muse Spark.
Контекст
Гонка передовых моделей искусственного интеллекта (frontier models) традиционно сопровождалась быстрыми релизами. Компании стремились как можно скорее показать превосходство в бенчмарках. Однако по мере роста возможностей систем на первый план выходят вопросы безопасности. Способность ИИ анализировать огромные массивы кода делает его идеальным инструментом как для защиты, так и для нападения. Решение Anthropic ограничить доступ к своей лучшей разработке демонстрирует новый этап развития индустрии, где возможности алгоритмов требуют жесткого контроля.
Детали
Утечка информации о Claude Mythos подтвердилась впечатляющими результатами тестов. По сравнению с версией Opus 4.6, новая модель показала скачок на бенчмарке SWE-bench Pro с 53.4% до 77.8%, а на Terminal-Bench 2.0 — с 65.4% до 82%.
Главная причина задержки публичного доступа кроется в навыках кибербезопасности. В тестах на генерацию эксплойтов для браузера Firefox модель Opus смогла создать лишь 2 рабочих варианта из сотен попыток. Mythos успешно сгенерировал 181 рабочий эксплойт. Более того, система обнаружила критические ошибки многолетней давности в базовом программном обеспечении: 27-летний баг в OpenBSD и 16-летний баг во FFmpeg.
Вместо открытого релиза Anthropic запустила проект Glasswing. Доступ к предварительной версии Mythos получили 12 компаний для поиска уязвимостей в критически важной инфраструктуре. В рамках инициативы Anthropic выделяет 100 миллионов долларов в виде кредитов на использование модели и 4 миллиона долларов в качестве пожертвований организациям, занимающимся безопасностью открытого исходного кода.
На фоне этих событий Meta представила модель Muse Spark. По предварительным оценкам, ее возможности находятся между Sonnet 4.6 и Opus 4.6. Пока модель недоступна для широкого использования, но компания обещает открыть доступ через API и планирует выпустить версии с открытым исходным кодом.
Анализ
Действия Anthropic подчеркивают проблему двойного назначения передовых ИИ-систем. Модель, способная находить уязвимости нулевого дня в старом коде, является бесценным инструментом для аудиторов безопасности, но в руках злоумышленников превращается в мощное кибероружие. Закрытое тестирование через проект Glasswing — это попытка направить потенциал технологии в конструктивное русло, минимизируя риски.
Возвращение Meta в гонку передовых моделей показывает, что стратегия компании по интеграции ИИ в свои продукты продолжается, несмотря на длительное отсутствие громких анонсов. Улучшение поиска в Instagram с помощью ИИ доказывает, что Meta фокусируется на практическом применении технологий в экосистеме своих приложений.
Перспектива
В ближайшем будущем мы, вероятно, увидим разделение рынка передовых моделей. Системы с исключительными аналитическими способностями в написании кода будут поставляться в закрытом контуре для корпоративных клиентов и государственных структур. Публичные версии будут проходить более строгую фильтрацию (alignment), что может искусственно снижать их эффективность в некоторых технических задачах ради общей безопасности. Подход Anthropic может стать отраслевым стандартом для релиза моделей следующего поколения.