На конференции Microsoft Build 2026 состоялся важный анонс: Microsoft и NVIDIA объединяют усилия для создания единой инфраструктуры под автономные ИИ-модели (агенты). Компании представили полный стек решений, который позволяет разработчикам создавать, тестировать и масштабировать ИИ-агентов на любом уровне — от персональных компьютеров до глобальных облачных сервисов.
Индустрия постепенно переходит от простых диалоговых систем к автономным агентам, способным выполнять многошаговые задачи без участия человека. Однако для реализации этого потенциала недостаточно только качественных моделей. Требуется быстрое аппаратное обеспечение, безопасная среда выполнения, высокоскоростной доступ к данным и модели, оптимизированные для длительных логических рассуждений.
Для решения этих задач NVIDIA и Microsoft анонсировали обновления на всех уровнях вычислительной архитектуры.
В сегменте персональных устройств представлены ноутбуки и ПК серии RTX Spark, оснащенные до 128 ГБ объединенной памяти и обеспечивающие производительность в 1 петафлопс. Для более сложных корпоративных задач анонсирована рабочая станция DGX Station for Windows. Она базируется на новом чипе GB300 Grace Blackwell Ultra, имеет до 748 ГБ памяти и позволяет запускать модели размером до 1 триллиона параметров локально.
На уровне облачной инфраструктуры (Azure) в сервис Microsoft Foundry добавлены открытые модели NVIDIA. Среди них выделяется Nemotron 3 Ultra, предназначенная для сложных корпоративных задач, и Cosmos 3 — мультимодальная модель для физического ИИ и робототехники. Кроме того, модели семейства Claude от Anthropic теперь работают на серверах GB300 Blackwell Ultra в облаке Azure.
Важным техническим шагом стала интеграция изолированной среды NVIDIA OpenShell в GitHub Copilot. Когда агенты переходят от помощи в написании кода к его автономному выполнению, возникает проблема безопасности. OpenShell решает ее, помещая каждого агента в изолированный контейнер (sandbox). Любой исходящий запрос к файлам или сети проверяется на соответствие политикам безопасности, которые хранятся в виде кода и могут обновляться на лету.
Доступ к данным также получил аппаратное ускорение. Технологии NVIDIA теперь встроены в хранилище Microsoft Fabric Data Warehouse. По внутренним тестам это позволило ускорить выполнение SQL-запросов до 6 раз по сравнению с базовыми решениями на центральных процессорах (CPU). Это критично для агентов, которые непрерывно анализируют большие массивы корпоративных данных.
На макроуровне Microsoft объявила о запуске нового ИИ-дата-центра Fairwater в Висконсине, построенного на системах Grace Blackwell. Этот центр уже сертифицирован для работы с платформой следующего поколения NVIDIA Vera Rubin. Ожидается, что новая архитектура увеличит пропускную способность логического вывода (inference) в 10 раз на каждый затраченный мегаватт энергии.
Этот стратегический шаг показывает стремление Microsoft и NVIDIA предложить разработчикам бесшовную экосистему. Идея заключается в том, чтобы инженер мог написать и протестировать код агента на локальном ноутбуке RTX Spark, а затем развернуть его в облаке Azure без изменения архитектуры приложения.
В ближайшие годы фокус индустрии сместится с обучения гигантских базовых моделей на оркестрацию множества специализированных агентов. Решение проблем безопасности через инструменты вроде OpenShell и снижение стоимости логического вывода открывают путь к массовому внедрению автономных систем в корпоративном секторе.