Суть
Компания Anthropic опубликовала результаты совместного проекта с Mozilla, разработчиком браузера Firefox. В ходе эксперимента искусственный интеллект Claude Opus 4.6 использовался для поиска уязвимостей в коде браузера. Результаты оказались впечатляющими: всего за две недели модель обнаружила 22 уязвимости, из которых 14 получили статус высокой степени критичности. Это составляет почти пятую часть всех серьезных уязвимостей Firefox, исправленных за весь предыдущий год. Этот кейс демонстрирует переход от теоретических тестов к реальному применению больших языковых моделей (LLM) в задачах кибербезопасности.
Контекст
Долгое время способность ИИ находить ошибки в коде проверялась на синтетических тестах, таких как CyberGym. Однако реальные программные продукты, особенно такие сложные и хорошо протестированные, как современные браузеры, представляют собой гораздо более трудную задачу. Firefox используется сотнями миллионов людей, и его код годами шлифуется сообществом разработчиков и экспертов по безопасности.
В конце 2025 года инженеры Anthropic заметили, что их модели стали легко справляться со стандартными тестами. Чтобы проверить реальные возможности ИИ, они решили направить усилия на поиск «уязвимостей нулевого дня» (zero-day) — ошибок, о которых еще никто не знает.
Детали и цифры
Процесс поиска был построен не просто на чтении кода моделью. Использовалась концепция «верификаторов задач» (task verifiers). Это инструменты, которые позволяют ИИ проверять собственные гипотезы в реальном времени. Например, если модель предполагала наличие ошибки, она писала тест, чтобы подтвердить сбой.
A graph showing how Opus 4.6 was responsible for a substantial increase in the number of Firefox security vulnerabilities detected per month.
Ключевые моменты эксперимента:
- Скорость: Первая серьезная уязвимость (Use After Free — ошибка работы с памятью) была найдена всего через 20 минут после начала сканирования движка JavaScript.
- Масштаб: Было просканировано около 6000 файлов на языке C++.
- Результативность: ИИ отправил 112 уникальных отчетов, большинство из которых привели к исправлениям в версии Firefox 148.
- Стоимость атаки: Исследователи также проверили, может ли ИИ написать эксплойт (вредоносный код, использующий уязвимость). Потратив около 4000 долларов на API, модель смогла создать лишь два примитивных рабочих эксплойта. Это показывает, что на данный момент ИИ гораздо эффективнее в защите (поиске ошибок), чем в нападении.
Анализ
Этот эксперимент меняет парадигму взаимодействия между исследователями безопасности и разработчиками (мейнтейнерами). Обычно проверка отчетов о багах занимает у людей много времени. Anthropic предложила новый стандарт: отчет должен содержать не только описание проблемы, но и минимальный тестовый пример, доказывающий ошибку, а также черновой вариант исправления (патча), написанный ИИ.
Для индустрии это сигнал о том, что порог входа в поиск уязвимостей снижается, но требования к качеству отчетов растут. ИИ берет на себя рутинную работу по первичному анализу огромных массивов кода, позволяя людям фокусироваться на архитектурных проблемах и верификации сложных сценариев.
Перспектива
Мы наблюдаем зарождение эры «автономных агентов-патчеров». В будущем процесс обнаружения уязвимости и создания заплатки для нее может сократиться с недель до часов. Mozilla уже начала внедрять инструменты на базе Claude во внутренние процессы безопасности.
Однако остается важный нюанс: хотя ИИ пока плохо справляется с созданием сложных эксплойтов, способных обойти современные защитные механизмы (например, «песочницы» браузеров), этот разрыв будет сокращаться. Гонка между ИИ-защитниками и ИИ-атакующими только начинается, и компаниям критически важно внедрять автоматизированную защиту быстрее, чем злоумышленники освоят автоматизированные атаки.