Архитектура унифицированной памяти на x86: разбор мини-ПК GMKtec EVO-X2 для локальных нейросетей
Как процессор AMD Ryzen AI Max+ 395 меняет правила игры для локального запуска больших языковых моделей, предлагая x86-альтернативу Apple Silicon.
Как процессор AMD Ryzen AI Max+ 395 меняет правила игры для локального запуска больших языковых моделей, предлагая x86-альтернативу Apple Silicon.
3 мин

На выставке CES 2026 компания AMD уделила особое внимание компактному устройству от китайского производителя GMKtec — EVO-X2. Этот мини-ПК интересен не столько брендом, сколько своей аппаратной базой. В его основе лежит процессор AMD Ryzen AI Max+ 395, который демонстрирует жизнеспособность архитектуры x86 с унифицированной памятью для задач локального искусственного интеллекта.
Долгое время запуск объемных больших языковых моделей (LLM) локально требовал либо сборки громоздких рабочих станций с несколькими видеокартами, либо перехода на экосистему Apple. Чипы Apple Silicon с их унифицированной памятью стали стандартом де-факто для исследователей, желающих запускать модели на 70 миллиардов параметров и выше. Появление процессоров с кодовым именем Strix Halo от AMD — это первый серьезный ответ архитектуры x86 на этот вызов.

Изображение из источника
Ключевая особенность EVO-X2 заключается в наличии до 128 ГБ оперативной памяти стандарта LPDDR5X-8000, которую центральный и графический процессоры делят между собой. При настройке под операционной системой Linux графический процессор может получить доступ к 110 ГБ этой памяти. Это позволяет загружать в оперативную память веса моделей, которые физически не поместились бы в видеопамять стандартных потребительских видеокарт.
Аппаратная часть включает 16 ядер архитектуры Zen 5 и встроенный графический процессор Radeon 8060S с 40 вычислительными блоками. Производитель заявляет о наличии нейронного процессора (NPU) мощностью 50 TOPS. Однако здесь кроется важный технический нюанс. На данный момент популярные инструменты для запуска языковых моделей, такие как Ollama или llama.cpp, не умеют использовать NPU. Вся вычислительная нагрузка при генерации текста ложится исключительно на встроенный графический процессор. NPU остается полезным лишь для специфических задач вроде масштабирования видео или работы фиксированных функций операционной системы.
Реальная производительность устройства заслуживает внимания, но требует правильной интерпретации. Заявленная скорость в 11 токенов в секунду для модели Qwen3-235B кажется невероятной для мини-ПК. Секрет кроется в архитектуре самой модели: это система на базе смеси экспертов (Mixture-of-Experts). Несмотря на общий объем в 235 миллиардов параметров, при каждом вычислении активируется лишь около 22 миллиардов. Таким образом, чип обрабатывает не всю модель целиком, а только ее активную часть. Для более традиционных моделей, таких как Qwen3-32B, скорость составляет около 9-10 токенов в секунду, что вполне комфортно для режима диалога.

Изображение из источника
Компактность устройства ожидаемо приводит к компромиссам в области охлаждения. При длительной нагрузке, характерной для работы с нейросетями, мини-ПК переходит в сбалансированный режим работы. Температура процессора может достигать 98 градусов, а уровень шума системы охлаждения становится заметным, достигая 46 децибел. В режиме максимальной производительности исследователи фиксировали случаи температурного троттлинга.
Появление подобных устройств формирует новый сегмент на рынке аппаратного обеспечения для разработчиков. При стоимости версии на 128 ГБ около 290 тысяч рублей, EVO-X2 оказывается значительно дешевле как официальных платформ разработки от самой AMD, так и топовых конфигураций Mac Studio.
В перспективе успех этой платформы будет зависеть не только от железа, но и от развития программного стека AMD ROCm. Если разработчикам удастся обеспечить стабильную поддержку и оптимизацию для открытых фреймворков, x86-архитектура с унифицированной памятью сможет занять прочные позиции в нише локального искусственного интеллекта, предоставив специалистам больше свободы в выборе операционных систем и инструментов.
Появление процессоров x86 с унифицированной памятью открывает новую нишу для локального запуска больших нейросетей, предлагая альтернативу Apple Silicon.
Маркетинговые цифры NPU не имеют практического значения для текущих задач генерации текста, так как популярные открытые фреймворки опираются исключительно на мощности GPU.