Суть
Команда OpenAI провела масштабный эксперимент, который может фундаментально изменить подход к разработке программного обеспечения. В течение пяти месяцев они создавали и развивали внутренний программный продукт, в котором 0 строк кода были написаны человеком. Весь код — логика приложения, тесты, конфигурации CI, документация и инструменты — был сгенерирован моделью Codex под управлением людей.
Это не просто прототип: у продукта есть ежедневные пользователи, он проходит циклы развертывания, ломается и чинится. Главный итог эксперимента — скорость разработки выросла примерно в 10 раз по сравнению с традиционным подходом. Люди здесь выступают в роли рулевых, а AI-агенты — в роли исполнителей.
Контекст
Традиционно использование AI в программировании ограничивалось ролью «умного помощника» (copilot), который дописывает функции или предлагает рефакторинг. Однако индустрия движется к агентному подходу, где AI не просто дополняет, а полностью выполняет задачи.
Эксперимент начался в августе 2025 года с абсолютно пустого репозитория. Даже первичная структура проекта и инструкции для самих агентов были написаны AI. Целью было выяснить, что происходит с профессией инженера, когда его главная задача перестает быть написанием кода, а смещается в сторону проектирования среды, в которой агенты могут работать надежно.
Детали
Масштаб проекта впечатляет. За пять месяцев репозиторий разросся до миллиона строк кода. Вот ключевые технические особенности процесса:
- Производительность: Небольшая команда из трех инженеров обрабатывала в среднем 3.5 пул-реквеста (запроса на изменение кода) на человека в день. При расширении команды до семи человек скорость только возросла.
- Цикл Ральфа Виггама: Процесс разработки построен на цикле обратной связи. Агент пишет код, сам его проверяет, запускает тесты, получает отзывы от других агентов-рецензентов и исправляет ошибки до тех пор, пока задача не будет решена.
- Инфраструктура для агентов: Чтобы AI мог работать эффективно, инженерам пришлось сделать приложение «читаемым» для машины. Логи, метрики и даже интерфейс (через протокол Chrome DevTools) были адаптированы так, чтобы агент мог «видеть» ошибки и самостоятельно их воспроизводить.
- Документация как карта: Вместо одной огромной инструкции команда создала структурированную базу знаний внутри репозитория. Это позволяет агентам находить нужный контекст, не перегружаясь лишней информацией.
Анализ
Этот кейс демонстрирует смену парадигмы: переход от написания кода к инженерии управления (harness engineering). Главным препятствием стала не способность модели писать код, а отсутствие у неё контекста и инструментов для проверки своей работы.
Инженеры столкнулись с тем, что их работа превратилась в создание «строительных лесов» и спецификаций. Если агент не справлялся, решение заключалось не в том, чтобы переписать код за него, а в том, чтобы улучшить инструкции или инструменты диагностики. Это требует высокой дисциплины: любые знания, которые существуют только в головах разработчиков или в чатах, для агента невидимы. Поэтому репозиторий становится единственным источником правды.
Перспектива
Опыт OpenAI показывает, что в будущем «узким горлышком» разработки станет не скорость написания кода, а человеческое внимание и способность проверять качество работы агентов (QA).
Вероятно, мы увидим появление новых инструментов для разработчиков, ориентированных не на людей, а на агентов — специальные форматы логов, интерфейсы отладки и системы управления контекстом. Профессия программиста не исчезнет, но трансформируется: от ремесленника, вытачивающего детали, к архитектору, управляющему фабрикой роботов.