Суть
Компании NVIDIA и Google Cloud объявили о значительном расширении своего многолетнего партнерства. Главная цель нового этапа сотрудничества — предоставление предприятиям инфраструктуры для создания так называемых «фабрик искусственного интеллекта». Эти вычислительные комплексы предназначены для перевода автономных ИИ-агентов и систем физического ИИ (робототехники и цифровых двойников) из исследовательских лабораторий в реальное производство.
Контекст
Индустрия искусственного интеллекта проходит этап трансформации. Фокус внимания смещается от базовых текстовых и графических генеративных моделей к более сложным системам. Агентный ИИ способен самостоятельно планировать действия и управлять многоступенчатыми рабочими процессами. Физический ИИ требует точного моделирования реального мира для обучения роботов и автономного транспорта.
Для обеих задач требуются колоссальные вычислительные мощности, глубокая интеграция программного и аппаратного обеспечения, а также инструменты для безопасной работы с конфиденциальными корпоративными данными.
Детали
В основе новых предложений лежат передовые аппаратные архитектуры NVIDIA. Google Cloud анонсировала вычислительные инстансы (виртуальные и физические серверы) серии A5X, работающие на базе стоечных систем NVIDIA Vera Rubin NVL72. Эта архитектура обеспечивает десятикратное снижение стоимости вывода (инференса) в пересчете на токен и аналогичный прирост пропускной способности на мегаватт энергии по сравнению с предыдущим поколением.
Масштабы новых кластеров беспрецедентны. Технологии сетевого взаимодействия позволяют объединить до 80 000 графических процессоров (GPU) Rubin в рамках одного центра обработки данных и до 960 000 GPU в распределенной мультисайтовой конфигурации.
Помимо архитектуры Rubin, расширяется портфель решений на базе NVIDIA Blackwell. Они включают в себя инстансы различной мощности, от серверов высокой плотности до дробного использования GPU для менее требовательных задач. Важным нововведением стала поддержка конфиденциальных вычислений (Confidential Computing) на базе Blackwell. Это позволяет запускать модели, включая семейство Google Gemini, в защищенных средах, где данные и промпты зашифрованы даже от операторов облачной инфраструктуры.
Для разработчиков агентных систем Google интегрирует открытые модели NVIDIA Nemotron и фреймворк NeMo в свою платформу Gemini Enterprise Agent Platform. В сфере физического ИИ на платформе Google Cloud теперь доступны библиотеки NVIDIA Omniverse и среда симуляции робототехники Isaac Sim.
Strength and Destiny Collide: ‘Samson: A Tyndalston Story’ Arrives in the Cloud
Анализ
Анонс демонстрирует изменение парадигмы в облачных вычислениях. Облачные провайдеры больше не продают просто «железо в аренду». Речь идет о предоставлении сквозных оптимизированных платформ, где чипы, сетевое оборудование, базовые модели и специализированные фреймворки (например, для обучения с подкреплением) работают как единый механизм.
Появление конфиденциальных виртуальных машин с графическими ускорителями — критически важный шаг для внедрения ИИ в строго регулируемых отраслях, таких как здравоохранение, финансы и кибербезопасность. Компании получают возможность использовать передовые модели без риска утечки чувствительных данных.
Перспектива
Доступность инструментов вроде Omniverse и Isaac Sim в публичном облаке существенно снизит порог входа для промышленных предприятий. Разработка сложных робототехнических систем и цифровых двойников заводов перестанет быть прерогативой исключительно крупных технологических корпораций.
В ближайшие годы мы, вероятно, увидим ускоренный переход от концептуальных прототипов автономных агентов к их массовому внедрению в корпоративное программное обеспечение и промышленные процессы. Инфраструктура для этого уже формируется.