Что такое Codex Security от OpenAI?

Codex Security — это новый агент безопасности приложений от OpenAI, разработанный для автоматического обнаружения, проверки и предложения исправлений для сложных уязвимостей в коде. Его ключевое отличие — глубокое понимание контекста проекта для минимизации ложных срабатываний.

Как Codex Security отличает реальные угрозы от ложных?

Инструмент анализирует всю архитектуру проекта и его бизнес-логику, чтобы понять, насколько критична уязвимость в данной конфигурации системы. Это позволяет ему эффективно фильтровать информационный шум и фокусироваться на действительно эксплуатируемых проблемах.

Какие этапы включает работа Codex Security?

Работа агента состоит из трех основных этапов: построение модели угроз на основе анализа репозитория, приоритизация и валидация найденных уязвимостей в изолированных средах, а затем предложение контекстно-зависимых исправлений.

Может ли Codex Security самостоятельно проверять уязвимости?

Да, Codex Security способен самостоятельно валидировать уязвимости, запуская проверки в изолированных средах (песочницах). Это позволяет ему создавать доказательства концепции (PoC) и подтверждать, что обнаруженная уязвимость действительно эксплуатируема.

Как Codex Security влияет на безопасность Open Source проектов?

OpenAI активно использует Codex Security для аудита открытого программного обеспечения, обнаруживая и помогая исправлять уязвимости в таких проектах, как OpenSSH, GnuTLS и Chromium. Это способствует повышению общей безопасности критически важных систем.

Codex Security: агент для поиска уязвимостей, который пон...

Суть события

OpenAI объявила о запуске исследовательского предварительного просмотра (research preview) своего нового инструмента — Codex Security. Это агент безопасности приложений, ранее известный под внутренним кодовым именем Aardvark. Главная задача системы — находить сложные уязвимости в коде, проверять их реальность и предлагать готовые исправления.

Ключевое отличие Codex Security от существующих статических анализаторов заключается в работе с контекстом. Большинство современных инструментов безопасности заваливают разработчиков ложными срабатываниями, помечая маловажные ошибки как критические. Новый агент OpenAI пытается решить эту проблему, анализируя архитектуру проекта целиком, чтобы отделять реальные угрозы от информационного шума.

Контекст

Проблема безопасности кода становится все острее по мере того, как разработка ускоряется с помощью тех же ИИ-агентов. Если раньше код писали люди и проверяли люди, то теперь генеративные модели создают огромные объемы кода, и ручная проверка становится узким местом.

5.4 Thinking Art Card

Традиционные инструменты (SAST/DAST) часто работают по шаблонам, не понимая бизнес-логики приложения. Это приводит к так называемой «усталости от предупреждений» (alert fatigue), когда команды безопасности просто игнорируют отчеты из-за большого количества мусора. Codex Security позиционируется как решение, которое не просто находит ошибку, но и понимает, насколько она критична именно в данной конфигурации системы.

Технические детали

Работа Codex Security строится на трех этапах:

Построение модели угроз. Агент сканирует репозиторий, чтобы понять структуру системы: что она делает, кому доверяет и где находятся самые уязвимые точки входа. Пользователь может редактировать эту модель, корректируя понимание агента.
Приоритизация и валидация. Используя модель угроз, агент ищет уязвимости и категоризирует их по реальному влиянию. Важная особенность — возможность запускать проверки в изолированных средах (песочницах). Это позволяет создать доказательство концепции (PoC) и подтвердить, что уязвимость действительно эксплуатируема.
Исправление с учетом контекста. Система предлагает патчи, которые учитывают окружающий код и намерения разработчика, чтобы исправление безопасности не сломало основной функционал.

В ходе бета-тестирования OpenAI заявила о снижении количества ложных срабатываний на 50% и уменьшении числа находок с завышенной критичностью на 90%.

Результаты и влияние на Open Source

ChatGPT Excel 1x1

За последние 30 дней бета-теста Codex Security просканировал более 1,2 миллиона коммитов. Критические проблемы были найдены менее чем в 0,1% случаев, что говорит о высокой точности фильтрации.

OpenAI активно использует этот инструмент для проверки открытого программного обеспечения (Open Source), на котором строятся современные системы. В результате были обнаружены и исправлены уязвимости в таких проектах, как OpenSSH, GnuTLS, PHP и Chromium. В приложении к анонсу компания перечислила конкретные CVE (идентификаторы уязвимостей), найденные агентом, включая переполнения буфера и обходы аутентификации.

Анализ и перспективы

Выход Codex Security знаменует переход от простых «помощников в написании кода» к автономным агентам, способным выполнять сложные инженерные задачи. Способность самостоятельно валидировать уязвимость (то есть пытаться взломать систему в безопасной среде) — это серьезный шаг вперед по сравнению с обычным чтением кода.

Для индустрии это означает потенциальное снижение порога входа в качественную безопасность (AppSec). Малые команды, у которых нет бюджета на штат экспертов по безопасности, смогут получить уровень защиты, сопоставимый с крупными корпорациями.

Инструмент становится доступен пользователям ChatGPT Enterprise, Business и Edu. В ближайшем будущем стоит ожидать интеграции подобных агентов непосредственно в CI/CD пайплайны (конвейеры непрерывной интеграции), где они будут блокировать уязвимый код еще до того, как он попадет в основную ветку разработки.

Codex Security: агент для поиска уязвимостей, который понимает контекст проекта

Суть события

Контекст

Технические детали

Результаты и влияние на Open Source

Анализ и перспективы

TL;DR

Главное

Ключевые факты

Инсайт

Читайте также

Создание корпоративной базы знаний: опыт Cerebras в поиске по разрозненным данным

Автономные ИИ-агенты обещают высокую доходность, но выявляют кризис управления в компаниях

Оценка Claude Fable 5 на сложных задачах программирования: опыт команды Cursor

Гайды по теме