Новое поколение языковых моделей: выход GPT-5.4 и автономные агенты
Обзор последних событий в AI-индустрии: релиз GPT-5.4, новые корпоративные инструменты от Anthropic и успехи автономных агентов в исследованиях.
Обзор последних событий в AI-индустрии: релиз GPT-5.4, новые корпоративные инструменты от Anthropic и успехи автономных агентов в исследованиях.
2 мин

Индустрия искусственного интеллекта продолжает смещать фокус с простых диалоговых интерфейсов на автономные системы. На этой неделе мы увидели сразу несколько подтверждений этого тренда: от обновления флагманских моделей до появления специализированной инфраструктуры для агентов.
Главным событием стал выпуск модели GPT-5.4 от OpenAI в вариантах для размышлений (thinking) и профессионального использования (pro). Компания интегрировала вычислительные мощности специализированной модели Codex в основную линейку. Новая версия получила контекстное окно размером в 1 миллион токенов, улучшенное компьютерное зрение и повышенную эффективность использования внешних инструментов. Модель стала значительно лучше справляться с управлением компьютером и финансовыми задачами. При этом стоимость использования немного возросла по сравнению с GPT-5.2 и теперь составляет 2.5 доллара за миллион токенов на входе и 15 долларов на выходе.
Параллельно с развитием базовых моделей, компании активно выстраивают корпоративную инфраструктуру. OpenAI запустила расширение для использования ChatGPT прямо в таблицах Excel и представила инструмент безопасности Codex Security, который развился из проекта Aardvark. Для усиления этого направления компания также приобрела Promptfoo — инструмент тестирования безопасности искусственного интеллекта с открытым исходным кодом.
Конкуренты из Anthropic также сосредоточились на корпоративном сегменте. Они выпустили инструмент Code Review, который использует команду агентов для автоматической проверки каждого запроса на слияние кода (pull request). Средняя стоимость такой проверки составляет от 15 до 25 долларов. Кроме того, компания запустила собственный маркетплейс, позволяющий предприятиям консолидировать расходы на различные сервисы.
Особый интерес представляет проект Андрея Карпаты под названием autoresearch. Это система, в которой агенты автономно итеративно улучшают код обучения больших языковых моделей (LLM). За два дня работы на восьми графических процессорах H100 система нашла 20 реальных улучшений, обеспечив ускорение работы на 11 процентов. Этот пример наглядно показывает, как агенты начинают не просто писать код по заданию, но и самостоятельно генерировать идеи для оптимизации.
На фоне развития прикладных инструментов продолжаются и фундаментальные исследования. Стартап Advanced Machine Intelligence (AMI Labs), основанный бывшим главным научным сотрудником Meta Янном Лекуном, привлек более 1 миллиарда долларов при оценке в 3.5 миллиарда. Команда сосредоточится на разработке моделей мира (world models) и исследованиях, выходящих за рамки традиционных текстовых моделей.
Все эти события указывают на формирование новой парадигмы. Разработка программного обеспечения все больше автоматизируется, а главными вызовами становятся безопасность, контроль над агентами и создание надежной инфраструктуры для их работы. В ближайшем будущем мы, вероятно, увидим появление стандартизированных сред выполнения для агентов, систем управления доступом и новых подходов к архитектуре приложений.
Фокус индустрии окончательно сместился с генерации текста на создание автономных агентов, способных самостоятельно писать код, проводить исследования и управлять компьютером.
Безопасность и аудит AI-агентов становятся отдельным крупным рынком: OpenAI покупает профильные стартапы, а Anthropic запускает платные инструменты для проверки кода, написанного машинами.