Эволюция AI-устройств: почему локальные мощности уступают облачным агентам
Анализ новых инициатив Nvidia и Microsoft показывает сдвиг парадигмы: от мощных локальных ПК к легким устройствам, управляемым облачными агентами.
Анализ новых инициатив Nvidia и Microsoft показывает сдвиг парадигмы: от мощных локальных ПК к легким устройствам, управляемым облачными агентами.
2 мин

На недавних технологических конференциях компании Nvidia и Microsoft представили свои взгляды на будущее вычислительной техники в эпоху искусственного интеллекта. Эти анонсы демонстрируют два принципиально разных подхода: ставку на наращивание локальной вычислительной мощности и переход к облачным агентным системам. Понимание этой разницы помогает увидеть, куда движется вся индустрия.
Три года назад, на заре популярности больших языковых моделей (LLM), идея локального запуска нейросетей казалась передовой. Разработчики стремились уместить тяжелые модели на персональных компьютерах, чтобы обеспечить приватность и независимость от интернета. Однако индустрия быстро эволюционировала. Мы перешли от простых чат-ботов к эпохе автономных агентов, которые требуют иных архитектурных решений.
Компания Nvidia представила новый процессор для персональных компьютеров — RTX Spark (также известный как N1X). Характеристики выглядят внушительно: до 20 процессорных ядер (CPU) архитектуры Arm, графический процессор (GPU) поколения Blackwell с 6144 ядрами CUDA, 128 ГБ оперативной памяти и пропускная способность до 300 ГБ/с. Этот чип создается в партнерстве с ведущими производителями ПК.
Несмотря на впечатляющие цифры, архитектура RTX Spark вызывает вопросы. Чип отдает огромную площадь кристалла под графические ядра в ущерб центральному процессору. Для современных автономных агентов критически важна именно производительность CPU, тогда как генерацию ответов (инференс) сегодня эффективнее и дешевле делегировать в облако. В результате продукт Nvidia выглядит как идеальное решение для задач 2023 года, но может оказаться избыточным и несбалансированным для реалий ближайшего будущего.
Совершенно иной подход демонстрирует Microsoft со своим экспериментальным направлением Project Solara. Это разрабатываемая платформа для устройств, которые запускают не традиционные приложения, а AI-агентов. Примечательно, что система базируется на Android, а не на Windows.
Суть Project Solara заключается в отказе от концепции единого центрального устройства (каким сейчас является смартфон). Вместо этого предлагается экосистема, где облако выступает интеллектуальным центром, а множество различных устройств служат лишь интерфейсами для взаимодействия с агентом. Вы отдаете короткую команду через любое доступное устройство, а всю тяжелую работу агент выполняет в фоновом режиме на серверах.
Такая модель выглядит значительно более перспективной, особенно для корпоративного сектора, где все данные и вычислительные мощности уже находятся в облаке. В эпоху развитого искусственного интеллекта клиентские устройства могут и должны становиться тоньше и проще.
Пока Project Solara находится на стадии ранних прототипов, и рано судить о его коммерческом успехе. Тем не менее, само направление мысли Microsoft точно улавливает суть грядущих изменений: ценность смещается от аппаратного обеспечения в руках пользователя к интеллектуальным облачным сервисам, способным бесшовно работать на любом экране.
Фокус развития искусственного интеллекта смещается с мощных локальных компьютеров на облачные агентные системы, где физические устройства служат лишь легкими точками доступа.
Смартфон может перестать быть центральным хабом для пользователя, уступив место распределенной сети простых устройств, управляемых единым облачным агентом.