Как OpenAI удалось создать программный продукт, не написав ни одной строки кода вручную?

OpenAI провела эксперимент, в котором сложный внутренний продукт был полностью разработан AI-агентами на базе модели Codex. Люди выступали в роли архитекторов и управляющих, делегируя написание всего кода, тестов и документации искусственному интеллекту.

Какова новая роль инженера в разработке с использованием AI-агентов?

Роль инженера трансформируется из непосредственного написания кода в «инженерию управления» (harness engineering). Специалисты фокусируются на проектировании среды, создании инструкций и инструментов диагностики, чтобы AI-агенты могли надежно выполнять задачи.

Насколько быстрее разработка программного обеспечения с помощью AI-агентов?

Эксперимент OpenAI показал, что скорость разработки увеличивается примерно в 10 раз по сравнению с традиционными методами. Небольшая команда из трех инженеров обрабатывала в среднем 3.5 пул-реквеста на человека в день, что свидетельствует о высокой эффективности.

Как AI-агенты обеспечивают качество и исправляют ошибки в своем коде?

Процесс разработки построен на цикле обратной связи, где агент сам пишет код, проверяет его, запускает тесты и получает отзывы от других агентов-рецензентов. На основе этой информации он самостоятельно исправляет ошибки до полного решения задачи.

Исчезнет ли профессия программиста из-за развития AI в разработке?

Профессия программиста не исчезнет, но существенно трансформируется. Вместо написания кода вручную, разработчики станут архитекторами и управляющими «фабрикой роботов», фокусируясь на проектировании систем и контроле качества работы AI-агентов.

Инженеры без кода: как OpenAI создали продукт на миллион ...

Суть

Команда OpenAI провела масштабный эксперимент, который может фундаментально изменить подход к разработке программного обеспечения. В течение пяти месяцев они создавали и развивали внутренний программный продукт, в котором 0 строк кода были написаны человеком. Весь код — логика приложения, тесты, конфигурации CI, документация и инструменты — был сгенерирован моделью Codex под управлением людей.

Это не просто прототип: у продукта есть ежедневные пользователи, он проходит циклы развертывания, ломается и чинится. Главный итог эксперимента — скорость разработки выросла примерно в 10 раз по сравнению с традиционным подходом. Люди здесь выступают в роли рулевых, а AI-агенты — в роли исполнителей.

Контекст

Традиционно использование AI в программировании ограничивалось ролью «умного помощника» (copilot), который дописывает функции или предлагает рефакторинг. Однако индустрия движется к агентному подходу, где AI не просто дополняет, а полностью выполняет задачи.

Эксперимент начался в августе 2025 года с абсолютно пустого репозитория. Даже первичная структура проекта и инструкции для самих агентов были написаны AI. Целью было выяснить, что происходит с профессией инженера, когда его главная задача перестает быть написанием кода, а смещается в сторону проектирования среды, в которой агенты могут работать надежно.

Детали

Масштаб проекта впечатляет. За пять месяцев репозиторий разросся до миллиона строк кода. Вот ключевые технические особенности процесса:

Производительность: Небольшая команда из трех инженеров обрабатывала в среднем 3.5 пул-реквеста (запроса на изменение кода) на человека в день. При расширении команды до семи человек скорость только возросла.
Цикл Ральфа Виггама: Процесс разработки построен на цикле обратной связи. Агент пишет код, сам его проверяет, запускает тесты, получает отзывы от других агентов-рецензентов и исправляет ошибки до тех пор, пока задача не будет решена.
Инфраструктура для агентов: Чтобы AI мог работать эффективно, инженерам пришлось сделать приложение «читаемым» для машины. Логи, метрики и даже интерфейс (через протокол Chrome DevTools) были адаптированы так, чтобы агент мог «видеть» ошибки и самостоятельно их воспроизводить.
Документация как карта: Вместо одной огромной инструкции команда создала структурированную базу знаний внутри репозитория. Это позволяет агентам находить нужный контекст, не перегружаясь лишней информацией.

Анализ

Этот кейс демонстрирует смену парадигмы: переход от написания кода к инженерии управления (harness engineering). Главным препятствием стала не способность модели писать код, а отсутствие у неё контекста и инструментов для проверки своей работы.

Инженеры столкнулись с тем, что их работа превратилась в создание «строительных лесов» и спецификаций. Если агент не справлялся, решение заключалось не в том, чтобы переписать код за него, а в том, чтобы улучшить инструкции или инструменты диагностики. Это требует высокой дисциплины: любые знания, которые существуют только в головах разработчиков или в чатах, для агента невидимы. Поэтому репозиторий становится единственным источником правды.

Перспектива

Опыт OpenAI показывает, что в будущем «узким горлышком» разработки станет не скорость написания кода, а человеческое внимание и способность проверять качество работы агентов (QA).

Вероятно, мы увидим появление новых инструментов для разработчиков, ориентированных не на людей, а на агентов — специальные форматы логов, интерфейсы отладки и системы управления контекстом. Профессия программиста не исчезнет, но трансформируется: от ремесленника, вытачивающего детали, к архитектору, управляющему фабрикой роботов.

Инженеры без кода: как OpenAI создали продукт на миллион строк, не написав ни одной вручную

Суть

Контекст

Детали

Анализ

Перспектива

TL;DR

Главное

Ключевые факты

Инсайт

Читайте также

Как Braintrust ускоряет разработку с помощью Codex и GPT-5.5

Руководство по оценке передовых ИИ-моделей: новые стандарты от создателей ChatGPT

Агентная организация на практике: как Endava масштабирует экспертизу с помощью Codex

Гайды по теме