Что такое Claude Mythos и почему Anthropic не выпустила ее публично?

Claude Mythos — это новая языковая модель Anthropic, значительно превосходящая предыдущие версии. Ее публичный релиз был отложен из-за исключительной эффективности в поиске и эксплуатации программных уязвимостей, что сочли слишком рискованным для открытого доступа.

Насколько Claude Mythos эффективна в поиске уязвимостей?

Модель показала впечатляющие результаты, сгенерировав 181 рабочий эксплойт для Firefox, в то время как предыдущая версия Opus создала всего 2. Она также обнаружила критические ошибки многолетней давности в базовом ПО, включая 27-летний баг в OpenBSD.

Что такое проект Glasswing и кто получает доступ к Claude Mythos?

Проект Glasswing — это инициатива Anthropic, в рамках которой 12 компаний получили доступ к предварительной версии Mythos. Цель проекта — использовать мощные возможности модели для поиска уязвимостей в критически важной инфраструктуре в контролируемой среде.

Что известно о новой модели Meta Muse Spark?

Muse Spark — это новая языковая модель от Meta, чьи возможности, по предварительным оценкам, находятся между Claude Sonnet 4.6 и Opus 4.6. Компания планирует открыть доступ к ней через API и выпустить версии с открытым исходным кодом.

Как действия Anthropic повлияют на будущее развитие ИИ-моделей?

Решение Anthropic подчеркивает проблему двойного назначения ИИ и может стать отраслевым стандартом. Вероятно, мы увидим разделение рынка: мощные аналитические модели будут поставляться в закрытом контуре для корпоративных и государственных структур, а публичные версии пройдут более строгую фильтрацию ради безопасности.

Скрытая модель Anthropic и неожиданный анонс Meta: новые ...

Суть

Компания Anthropic подтвердила создание новой языковой модели Claude Mythos, которая значительно превосходит предыдущие версии. Однако публичный релиз был отложен: модель оказалась настолько эффективной в поиске и эксплуатации программных уязвимостей, что ее открытый выпуск сочли слишком рискованным. Параллельно с этим компания Meta прервала долгое молчание в сфере передовых разработок и анонсировала собственную модель Muse Spark.

Контекст

Гонка передовых моделей искусственного интеллекта (frontier models) традиционно сопровождалась быстрыми релизами. Компании стремились как можно скорее показать превосходство в бенчмарках. Однако по мере роста возможностей систем на первый план выходят вопросы безопасности. Способность ИИ анализировать огромные массивы кода делает его идеальным инструментом как для защиты, так и для нападения. Решение Anthropic ограничить доступ к своей лучшей разработке демонстрирует новый этап развития индустрии, где возможности алгоритмов требуют жесткого контроля.

Детали

Утечка информации о Claude Mythos подтвердилась впечатляющими результатами тестов. По сравнению с версией Opus 4.6, новая модель показала скачок на бенчмарке SWE-bench Pro с 53.4% до 77.8%, а на Terminal-Bench 2.0 — с 65.4% до 82%.

Главная причина задержки публичного доступа кроется в навыках кибербезопасности. В тестах на генерацию эксплойтов для браузера Firefox модель Opus смогла создать лишь 2 рабочих варианта из сотен попыток. Mythos успешно сгенерировал 181 рабочий эксплойт. Более того, система обнаружила критические ошибки многолетней давности в базовом программном обеспечении: 27-летний баг в OpenBSD и 16-летний баг во FFmpeg.

Изображение из источника

Вместо открытого релиза Anthropic запустила проект Glasswing. Доступ к предварительной версии Mythos получили 12 компаний для поиска уязвимостей в критически важной инфраструктуре. В рамках инициативы Anthropic выделяет 100 миллионов долларов в виде кредитов на использование модели и 4 миллиона долларов в качестве пожертвований организациям, занимающимся безопасностью открытого исходного кода.

На фоне этих событий Meta представила модель Muse Spark. По предварительным оценкам, ее возможности находятся между Sonnet 4.6 и Opus 4.6. Пока модель недоступна для широкого использования, но компания обещает открыть доступ через API и планирует выпустить версии с открытым исходным кодом.

Анализ

Действия Anthropic подчеркивают проблему двойного назначения передовых ИИ-систем. Модель, способная находить уязвимости нулевого дня в старом коде, является бесценным инструментом для аудиторов безопасности, но в руках злоумышленников превращается в мощное кибероружие. Закрытое тестирование через проект Glasswing — это попытка направить потенциал технологии в конструктивное русло, минимизируя риски.

Возвращение Meta в гонку передовых моделей показывает, что стратегия компании по интеграции ИИ в свои продукты продолжается, несмотря на длительное отсутствие громких анонсов. Улучшение поиска в Instagram с помощью ИИ доказывает, что Meta фокусируется на практическом применении технологий в экосистеме своих приложений.

Перспектива

В ближайшем будущем мы, вероятно, увидим разделение рынка передовых моделей. Системы с исключительными аналитическими способностями в написании кода будут поставляться в закрытом контуре для корпоративных клиентов и государственных структур. Публичные версии будут проходить более строгую фильтрацию (alignment), что может искусственно снижать их эффективность в некоторых технических задачах ради общей безопасности. Подход Anthropic может стать отраслевым стандартом для релиза моделей следующего поколения.

Скрытая модель Anthropic и неожиданный анонс Meta: новые рубежи безопасности ИИ

TL;DR

Главное

Ключевые факты

Инсайт

Читайте также

Проблема оценки ИИ-программистов: почему бенчмарк SWE-Bench Pro признан ненадежным

AWS представила шлюз для приложений Claude: централизованное управление ИИ-инструментами

Создание MCP-сервера для электронной коммерции на базе Amazon Bedrock и Mistral AI

Гайды по теме