Генеральный директор NVIDIA Дженсен Хуанг и глава Dell Майкл Делл на конференции Dell Technologies World представили масштабное обновление платформы Dell AI Factory. Главный лейтмотив выступления — спрос на вычислительные мощности растет по параболе, а индустрия переходит от пилотных проектов к массовому развертыванию автономных ИИ-агентов.
Этот анонс маркирует важный сдвиг на рынке. Если последние несколько лет технологические гиганты фокусировались на обучении огромных языковых моделей (LLM) в облаках, то теперь акцент смещается на применение этих моделей в реальных бизнес-процессах и автоматизации рутины.
Контекст ситуации заключается в том, что корпоративный сектор требует безопасности и полного контроля над данными. Согласно внутреннему исследованию Dell, 67 процентов рабочих нагрузок искусственного интеллекта сейчас выполняются вне публичных облаков — на локальных серверах (on-premises), периферийных устройствах или в колокации. Компании хотят использовать передовые модели, но не готовы передавать конфиденциальную информацию во внешнюю среду.
Для решения этой задачи Dell и NVIDIA представили новые аппаратные комплексы. Ключевой новинкой стали серверы Dell PowerEdge XE9812, построенные на базе архитектуры NVIDIA Vera Rubin NVL72. Заявлено, что эта система обеспечивает десятикратное снижение стоимости вывода (inference) на один токен по сравнению с предыдущим поколением Blackwell. Это критически важно для агентских систем, которые генерируют тысячи запросов в фоновом режиме для выполнения одной сложной задачи.
Интересная деталь кроется в развитии центральных процессоров (CPU). NVIDIA представила процессоры Vera, которые, по словам Хуанга, обладают высочайшей однопоточной производительностью и в три раза большей пропускной способностью памяти. Зачем это нужно компании, известной своими графическими ускорителями (GPU)? Дело в том, что автономные агенты постоянно обращаются к корпоративным базам данных. Традиционные процессоры становятся узким местом. Использование процессоров Vera позволяет ускорить работу изолированных программных сред (sandboxes) на 50 процентов и увеличить скорость обработки аналитических SQL-запросов в три раза.
NVIDIA and ServiceNow Partner on New Autonomous AI Agents for Enterprises
Помимо аппаратной части, компании делают ставку на программную экосистему и безопасность. Платформа использует технологию конфиденциальных вычислений (Confidential Computing) от NVIDIA. Это позволяет разворачивать передовые модели внутри корпоративного периметра без риска компрометации интеллектуальной собственности. В рамках партнерства на серверах Dell теперь можно локально запускать решения от Google (Distributed Cloud с моделью Gemini 3.0), открытые модели семейства NVIDIA Nemotron, DeepSeek и Reflection, а также интегрировать системы от Palantir и ServiceNow.
Анализируя эти новости, можно сделать вывод, что индустрия искусственного интеллекта вступает в фазу инфраструктурной зрелости. Майкл Делл озвучил прогноз, согласно которому мировые расходы на ИИ-инфраструктуру могут достичь 3-4 триллионов долларов к 2030 году. Потребление токенов при этом вырастет на тысячи процентов. Это означает, что экономика искусственного интеллекта будет строиться не только на продаже подписок на чат-боты, но и на масштабных поставках специализированного оборудования для локальных дата-центров.
В перспективе мы увидим дальнейшее разделение рынка. Публичные облака останутся местом для обучения гигантских базовых моделей. Однако реальная автоматизация бизнеса, управляемая ИИ-агентами, будет происходить в защищенных локальных контурах, где архитектура строится вокруг сверхбыстрого доступа к данным и дешевого массового вывода.