Суть
Компания OpenAI анонсировала выпуск новых компактных языковых моделей — GPT-5.4 mini и GPT-5.4 nano. Это событие примечательно не столько улучшением метрик, сколько изменением подхода к построению интеллектуальных систем. Новые модели созданы специально для сценариев, где критически важны низкая задержка (latency) и экономическая эффективность, в частности — для работы в качестве субагентов (subagents) и программирования.
Контекст
В последние годы индустрия искусственного интеллекта постепенно отходит от использования одной гигантской и дорогой модели для решения абсолютно всех задач. Разработчики осознали, что для многих рутинных операций — классификации, поиска по кодовой базе, извлечения данных — избыточная вычислительная мощность не требуется. Возникла потребность в паттерне оркестрации, когда мощная модель берет на себя роль планировщика, а выполнение конкретных шагов делегирует более легким, быстрым и дешевым моделям.
Codex doesn't include SAST > art card
Детали
Модель GPT-5.4 mini демонстрирует значительный прирост производительности по сравнению с предыдущим поколением (GPT-5 mini), работая при этом более чем в два раза быстрее. В бенчмарках, оценивающих навыки программирования (SWE-Bench Pro) и взаимодействия с графическими интерфейсами (OSWorld-Verified), она вплотную приближается к показателям флагманской GPT-5.4.
Стоимость использования GPT-5.4 mini в API составляет 0.75 доллара за миллион входных токенов и 4.50 доллара за миллион выходных. Модель поддерживает окно контекста в 400 тысяч токенов, работу с изображениями, вызов функций и веб-поиск.
Версия GPT-5.4 nano представляет собой самое компактное и доступное решение в линейке. Ее цена — всего 0.20 доллара за миллион токенов на вход. Она предназначена для базовых задач, где скорость и низкая стоимость имеют абсолютный приоритет.
Learning Blocks ArtCard 1x1
Анализ
Ключевой вывод из этого релиза заключается в том, что OpenAI делает ставку на мультиагентные системы. В официальном сообщении прямо упоминается интеграция с инструментом Codex, где большая модель GPT-5.4 берет на себя координацию и финальную оценку, параллельно запуская несколько субагентов на базе GPT-5.4 mini для проверки файлов или навигации по коду.
Такой подход позволяет существенно снизить затраты разработчиков. Использование mini-версии в Codex потребляет лишь 30% квоты флагманской модели, что делает массовое распараллеливание задач экономически оправданным. Кроме того, высокие результаты GPT-5.4 mini в мультимодальных задачах (включая распознавание скриншотов) открывают путь к созданию быстрых систем компьютерного зрения, работающих в реальном времени.
Перспектива
Появление мощных, но дешевых моделей класса "mini" и "nano" ускорит внедрение автономных агентов в повседневные рабочие процессы. Мы, вероятно, увидим рост числа приложений, которые незаметно для пользователя запускают десятки параллельных запросов к малым моделям для сбора и предварительной обработки информации. В будущем конкуренция между разработчиками ИИ будет разворачиваться не только в плоскости максимального интеллекта флагманов, но и в том, кто сможет предоставить лучшую экосистему для бесшовного взаимодействия больших и малых моделей.