Что нового в GPT-5.4?

GPT-5.4 — это флагманская модель OpenAI, ориентированная на профессиональное использование и агентские сценарии. Её ключевая особенность — нативное управление компьютером, позволяющее модели взаимодействовать с интерфейсами программ и выполнять сложные многоступенчатые задачи.

Может ли GPT-5.4 управлять компьютером?

Да, GPT-5.4 способна нативно управлять компьютером, взаимодействуя с интерфейсами программ и браузером. Она достигла 75% успеха в бенчмарке OSWorld-Verified по управлению рабочим столом, что превосходит средний человеческий уровень.

Для каких профессиональных задач подходит GPT-5.4?

GPT-5.4 готова к реальной офисной работе, включая создание презентаций, сложные расчеты в Excel и анализ юридических документов. Её эффективность в выполнении профессиональных задач (GDPval) достигла 83%.

Насколько большой объем информации может запоминать GPT-5.4?

Модель GPT-5.4 поддерживает контекст до 1 миллиона токенов, что позволяет ей удерживать в памяти огромные массивы документации или историю длительных сессий. Это критически важно для планирования и выполнения сложных задач.

Что такое режим Thinking в GPT-5.4?

Режим Thinking в ChatGPT позволяет модели предоставлять пользователю предварительный план своих действий перед генерацией полного ответа. Это дает возможность скорректировать направление мысли ИИ и повысить точность выполнения задачи.

OpenAI выпускает GPT-5.4: фокус на профессиональных агент...

Суть события

OpenAI объявила о выпуске GPT-5.4 — новой флагманской модели, ориентированной на профессиональное использование и агентские сценарии. Главная особенность релиза — это не просто очередное улучшение текстовой генерации, а глубокая интеграция возможностей «использования компьютера» (Computer Use). Модель теперь способна нативно взаимодействовать с интерфейсами программ, управлять браузером и выполнять сложные многоступенчатые задачи с меньшим количеством ошибок. Это шаг от чат-ботов к полноценным цифровым сотрудникам.

Контекст

Долгое время индустрия двигалась к созданию автономных агентов. Предыдущие версии, такие как GPT-5.2 и GPT-5.3-Codex, уже показывали хорошие результаты в кодинге и анализе, но часто спотыкались на задачах, требующих визуального понимания интерфейсов или длительного планирования. Разработчикам приходилось создавать сложные надстройки, чтобы заставить нейросеть «видеть» экран и кликать мышкой.

GPT-5.4 решает эту проблему архитектурно. Она объединяет лучшие качества предыдущих моделей: логическое мышление (reasoning), навыки программирования и теперь — способность напрямую управлять операционной системой. Это происходит на фоне растущей конкуренции, где эффективность модели измеряется не только качеством текста, но и способностью довести реальную рабочую задачу до конца без участия человека.

Side by side example of spreadsheet outputs from GPT-5.2 vs GPT-5.4

Технические детали и факты

Новая модель доступна в нескольких вариантах, включая GPT-5.4 Thinking (с режимом расширенного размышления) и версию для API/Codex. Вот ключевые характеристики:

Нативное управление компьютером: Модель достигла 75% успеха в бенчмарке OSWorld-Verified (управление рабочим столом), что значительно выше показателя GPT-5.2 (47.3%) и даже превосходит средний человеческий уровень (72.4%).
Огромный контекст: Поддержка до 1 миллиона токенов позволяет модели удерживать в памяти огромные массивы документации или историю длительных сессий, что критично для планирования сложных задач.
Режим Thinking: В ChatGPT модель теперь предоставляет предварительный план своих действий. Это позволяет пользователю скорректировать направление мысли ИИ еще до того, как он начнет генерировать полный ответ.
Снижение галлюцинаций: По внутренним тестам, вероятность фактических ошибок в отдельных утверждениях снизилась на 33% по сравнению с GPT-5.2.
Работа с изображениями: Введена поддержка работы с изображениями в оригинальном разрешении (до 10 мегапикселей), что критически важно для точного распознавания мелких элементов интерфейса.

Анализ: что это меняет для индустрии

Самый важный сдвиг — это легитимизация «агентского» подхода на уровне базовой модели. Если раньше агенты были экспериментальными надстройками, то теперь OpenAI предоставляет инструменты для их создания «из коробки».

5.3 Instant Art Card

Во-первых, это меняет рынок автоматизации. Показатели в бенчмарках GDPval (выполнение профессиональных задач) достигли 83%, что говорит о готовности модели к реальной офисной работе: созданию презентаций, сложным расчетам в Excel и анализу юридических документов. Интеграция с Excel и улучшенные навыки верстки презентаций намекают на то, что OpenAI целится в корпоративный сектор Enterprise еще агрессивнее.

Во-вторых, разработчики получают мощный инструмент. API теперь позволяет создавать приложения, которые могут надежно управлять браузером (успех в WebArena-Verified — 67.3%). Это открывает дорогу для нового класса ассистентов, которые могут самостоятельно бронировать билеты, заполнять сложные формы или управлять CRM-системами.

Перспектива

Мы видим четкий тренд: модели становятся менее «разговорчивыми» и более «деятельными». Увеличение контекстного окна до 1 миллиона токенов и снижение стоимости токенов (благодаря оптимизации эффективности) сделают возможным создание агентов, которые работают в фоне часами, выполняя рутинные задачи.

Однако стоит сохранять здоровый скептицизм. Бенчмарки — это контролируемая среда. Реальный мир с его непредсказуемыми интерфейсами и сбоями программного обеспечения станет настоящим испытанием для заявленных возможностей GPT-5.4. Тем не менее, барьер для входа в создание сложных AI-агентов сегодня стал значительно ниже.