Автоматизация рабочих процессов и специализированные ИИ-модели: главные обновления недели
Обзор новых инструментов: как Codex превращает рутину в автоматизированные навыки, а GPT-5.5-Cyber помогает находить уязвимости в программном обеспечении.
Обзор новых инструментов: как Codex превращает рутину в автоматизированные навыки, а GPT-5.5-Cyber помогает находить уязвимости в программном обеспечении.
3 мин

Индустрия искусственного интеллекта продолжает движение от универсальных чат-ботов к специализированным агентам и системам автоматизации. Последние обновления показывают, что разработчики фокусируются на интеграции ИИ непосредственно в рабочие процессы, минимизируя необходимость ручного написания запросов.
Исторически взаимодействие с большими языковыми моделями (LLM) требовало от пользователя подробного описания задачи на каждом этапе. Теперь фокус смещается на системы, способные наблюдать за действиями человека и самостоятельно формировать алгоритмы для их повторения. Это снижает порог входа для автоматизации рутинных задач и повышает общую производительность.
Одним из наиболее заметных нововведений стала функция Record & Replay в Codex. Система позволяет пользователю один раз продемонстрировать повторяющийся рабочий процесс — например, заполнение отчета о расходах или подачу заявления на отпуск. После этого Codex анализирует действия и превращает их в проверяемый и редактируемый навык (skill), который можно использовать многократно. Подобный подход также реализуется в редакторе Cursor через команду автоматизации, которая самостоятельно настраивает триггеры и инструкции для агентов.
В сфере кибербезопасности OpenAI расширяет свою программу Daybreak, предоставляя доверенным партнерам доступ к новой версии модели GPT-5.5-Cyber. Эта специализированная система способна воспроизводить сложные программные ошибки эффективнее, чем предыдущие решения вроде Mythos. Главная цель инициативы — помочь разработчикам быстрее находить и исправлять уязвимости в программном обеспечении с открытым исходным кодом.
Параллельно развиваются инструменты для маршрутизации задач. Компания Sakana AI выпустила программный интерфейс (API) Fugu, который автоматически выбирает и координирует работу нескольких различных моделей для решения сложных задач. Версия Fugu Ultra демонстрирует высокие результаты в тестах производительности программной инженерии (SWE-bench Pro), хотя разработчики отмечают, что в реальных условиях пользователи все еще могут сталкиваться с ограничениями.
Anthropic также не отстает, добавив в Claude Code функцию Artifacts для корпоративных клиентов. Это позволяет создавать интерактивные HTML-страницы с базовой функциональностью, которые удобно использовать для демонстрации проектов или совместной работы.
Несмотря на очевидный прогресс в автоматизации разработки, исследователи отмечают концептуальную проблему. Как подчеркивает профессор Итан Моллик, современные ИИ-агенты остаются слишком ориентированными на программный код. В разработке программного обеспечения код служит абсолютным источником истины, что делает оценку результатов работы ИИ относительно простой. Однако при попытке масштабировать эти системы на другие сферы интеллектуального труда возникает сложность: в обычных бизнес-процессах контекст и неявные знания играют гораздо большую роль, чем строгие алгоритмы.
В ближайшем будущем мы, вероятно, увидим формирование компаний нового типа, где базовый интеллектуальный труд будет максимально удешевлен благодаря агентам. В такой парадигме главными дефицитными ресурсами станут глубокое понимание бизнес-контекста и доверие между участниками процессов. Развитие инструментов вроде Codex Record & Replay — лишь первый шаг к созданию инфраструктуры, в которой ИИ-агенты будут не просто помощниками, а полноценными исполнителями рутинных бизнес-функций.
Разработчики ИИ смещают фокус с создания универсальных моделей на разработку систем, способных автоматически записывать и воспроизводить рабочие процессы пользователя.
Успешная автоматизация в программировании трудно переносится на другие сферы интеллектуального труда, так как ИИ-модели привыкли опираться на код как на единственный источник истины, игнорируя неявный бизнес-контекст.