OpenAI выпускает GPT-5.4: фокус на профессиональных агентах и управлении компьютером
Новая модель GPT-5.4 предлагает нативное управление интерфейсами, контекст в 1 миллион токенов и улучшенные возможности для сложных профессиональных задач.
Новая модель GPT-5.4 предлагает нативное управление интерфейсами, контекст в 1 миллион токенов и улучшенные возможности для сложных профессиональных задач.
3 мин

OpenAI объявила о выпуске GPT-5.4 — новой флагманской модели, ориентированной на профессиональное использование и агентские сценарии. Главная особенность релиза — это не просто очередное улучшение текстовой генерации, а глубокая интеграция возможностей «использования компьютера» (Computer Use). Модель теперь способна нативно взаимодействовать с интерфейсами программ, управлять браузером и выполнять сложные многоступенчатые задачи с меньшим количеством ошибок. Это шаг от чат-ботов к полноценным цифровым сотрудникам.
Долгое время индустрия двигалась к созданию автономных агентов. Предыдущие версии, такие как GPT-5.2 и GPT-5.3-Codex, уже показывали хорошие результаты в кодинге и анализе, но часто спотыкались на задачах, требующих визуального понимания интерфейсов или длительного планирования. Разработчикам приходилось создавать сложные надстройки, чтобы заставить нейросеть «видеть» экран и кликать мышкой.
GPT-5.4 решает эту проблему архитектурно. Она объединяет лучшие качества предыдущих моделей: логическое мышление (reasoning), навыки программирования и теперь — способность напрямую управлять операционной системой. Это происходит на фоне растущей конкуренции, где эффективность модели измеряется не только качеством текста, но и способностью довести реальную рабочую задачу до конца без участия человека.

Side by side example of spreadsheet outputs from GPT-5.2 vs GPT-5.4
Новая модель доступна в нескольких вариантах, включая GPT-5.4 Thinking (с режимом расширенного размышления) и версию для API/Codex. Вот ключевые характеристики:
Самый важный сдвиг — это легитимизация «агентского» подхода на уровне базовой модели. Если раньше агенты были экспериментальными надстройками, то теперь OpenAI предоставляет инструменты для их создания «из коробки».

5.3 Instant Art Card
Во-первых, это меняет рынок автоматизации. Показатели в бенчмарках GDPval (выполнение профессиональных задач) достигли 83%, что говорит о готовности модели к реальной офисной работе: созданию презентаций, сложным расчетам в Excel и анализу юридических документов. Интеграция с Excel и улучшенные навыки верстки презентаций намекают на то, что OpenAI целится в корпоративный сектор Enterprise еще агрессивнее.
Во-вторых, разработчики получают мощный инструмент. API теперь позволяет создавать приложения, которые могут надежно управлять браузером (успех в WebArena-Verified — 67.3%). Это открывает дорогу для нового класса ассистентов, которые могут самостоятельно бронировать билеты, заполнять сложные формы или управлять CRM-системами.
Мы видим четкий тренд: модели становятся менее «разговорчивыми» и более «деятельными». Увеличение контекстного окна до 1 миллиона токенов и снижение стоимости токенов (благодаря оптимизации эффективности) сделают возможным создание агентов, которые работают в фоне часами, выполняя рутинные задачи.
Однако стоит сохранять здоровый скептицизм. Бенчмарки — это контролируемая среда. Реальный мир с его непредсказуемыми интерфейсами и сбоями программного обеспечения станет настоящим испытанием для заявленных возможностей GPT-5.4. Тем не менее, барьер для входа в создание сложных AI-агентов сегодня стал значительно ниже.
GPT-5.4 превращает ИИ из чат-бота в оператора ПК, способного нативно управлять интерфейсами и выполнять сложные рабочие задачи с высокой точностью.
Превосходство модели над человеком в управлении интерфейсом (75% против 72.4% в OSWorld) сигнализирует о начале эры, когда ИИ станет основным пользователем программного обеспечения, изначально созданного для людей.