Что такое унифицированная память в мини-ПК GMKtec EVO-X2?

Унифицированная память в GMKtec EVO-X2 означает, что центральный и графический процессоры используют общий пул оперативной памяти LPDDR5X-8000. Это позволяет графическому процессору получить доступ к большим объемам памяти, до 110 ГБ, что критично для локального запуска крупных языковых моделей.

Какие преимущества дает AMD Ryzen AI Max+ 395 для локальных нейросетей?

Процессор AMD Ryzen AI Max+ 395 с архитектурой унифицированной памяти позволяет запускать объемные большие языковые модели локально, обходя необходимость в мощных рабочих станциях с дискретными видеокартами или экосистеме Apple Silicon. Он предоставляет до 128 ГБ общей памяти, доступной для обработки ИИ-задач.

Используется ли NPU в GMKtec EVO-X2 для работы с языковыми моделями?

На данный момент популярные инструменты для запуска языковых моделей, такие как Ollama или llama.cpp, не умеют задействовать нейронный процессор (NPU) в GMKtec EVO-X2. Вся вычислительная нагрузка при генерации текста ложится исключительно на встроенный графический процессор.

Какова реальная производительность GMKtec EVO-X2 при запуске LLM?

Для традиционных больших языковых моделей, таких как Qwen3-32B, GMKtec EVO-X2 обеспечивает скорость около 9-10 токенов в секунду, что достаточно комфортно для диалогового режима. Производительность для моделей типа Mixture-of-Experts (MoE) может быть выше, так как обрабатывается только активная часть модели.

Есть ли у GMKtec EVO-X2 недостатки при длительной работе с ИИ?

Да, при длительной и интенсивной нагрузке, характерной для работы с нейросетями, мини-ПК может достигать температуры процессора до 98 градусов и демонстрировать заметный уровень шума (до 46 децибел). В некоторых случаях фиксировался температурный троттлинг.

Архитектура унифицированной памяти на x86: разбор мини-ПК...

На выставке CES 2026 компания AMD уделила особое внимание компактному устройству от китайского производителя GMKtec — EVO-X2. Этот мини-ПК интересен не столько брендом, сколько своей аппаратной базой. В его основе лежит процессор AMD Ryzen AI Max+ 395, который демонстрирует жизнеспособность архитектуры x86 с унифицированной памятью для задач локального искусственного интеллекта.

Долгое время запуск объемных больших языковых моделей (LLM) локально требовал либо сборки громоздких рабочих станций с несколькими видеокартами, либо перехода на экосистему Apple. Чипы Apple Silicon с их унифицированной памятью стали стандартом де-факто для исследователей, желающих запускать модели на 70 миллиардов параметров и выше. Появление процессоров с кодовым именем Strix Halo от AMD — это первый серьезный ответ архитектуры x86 на этот вызов.

Изображение из источника

Ключевая особенность EVO-X2 заключается в наличии до 128 ГБ оперативной памяти стандарта LPDDR5X-8000, которую центральный и графический процессоры делят между собой. При настройке под операционной системой Linux графический процессор может получить доступ к 110 ГБ этой памяти. Это позволяет загружать в оперативную память веса моделей, которые физически не поместились бы в видеопамять стандартных потребительских видеокарт.

Аппаратная часть включает 16 ядер архитектуры Zen 5 и встроенный графический процессор Radeon 8060S с 40 вычислительными блоками. Производитель заявляет о наличии нейронного процессора (NPU) мощностью 50 TOPS. Однако здесь кроется важный технический нюанс. На данный момент популярные инструменты для запуска языковых моделей, такие как Ollama или llama.cpp, не умеют использовать NPU. Вся вычислительная нагрузка при генерации текста ложится исключительно на встроенный графический процессор. NPU остается полезным лишь для специфических задач вроде масштабирования видео или работы фиксированных функций операционной системы.

Реальная производительность устройства заслуживает внимания, но требует правильной интерпретации. Заявленная скорость в 11 токенов в секунду для модели Qwen3-235B кажется невероятной для мини-ПК. Секрет кроется в архитектуре самой модели: это система на базе смеси экспертов (Mixture-of-Experts). Несмотря на общий объем в 235 миллиардов параметров, при каждом вычислении активируется лишь около 22 миллиардов. Таким образом, чип обрабатывает не всю модель целиком, а только ее активную часть. Для более традиционных моделей, таких как Qwen3-32B, скорость составляет около 9-10 токенов в секунду, что вполне комфортно для режима диалога.

Изображение из источника

Компактность устройства ожидаемо приводит к компромиссам в области охлаждения. При длительной нагрузке, характерной для работы с нейросетями, мини-ПК переходит в сбалансированный режим работы. Температура процессора может достигать 98 градусов, а уровень шума системы охлаждения становится заметным, достигая 46 децибел. В режиме максимальной производительности исследователи фиксировали случаи температурного троттлинга.

Появление подобных устройств формирует новый сегмент на рынке аппаратного обеспечения для разработчиков. При стоимости версии на 128 ГБ около 290 тысяч рублей, EVO-X2 оказывается значительно дешевле как официальных платформ разработки от самой AMD, так и топовых конфигураций Mac Studio.

В перспективе успех этой платформы будет зависеть не только от железа, но и от развития программного стека AMD ROCm. Если разработчикам удастся обеспечить стабильную поддержку и оптимизацию для открытых фреймворков, x86-архитектура с унифицированной памятью сможет занять прочные позиции в нише локального искусственного интеллекта, предоставив специалистам больше свободы в выборе операционных систем и инструментов.

Архитектура унифицированной памяти на x86: разбор мини-ПК GMKtec EVO-X2 для локальных нейросетей

TL;DR

Главное

Ключевые факты

Инсайт

Читайте также

Конец золотой лихорадки корпоративного ИИ: почему на первый план выходит инфраструктура исполнения

Стартап Subquadratic заявляет о решении проблемы квадратичного масштабирования в языковых моделях

Разработка локального ИИ-агента: почему автономность уступает подходу с участием человека

Гайды по теме