Архитектура без энкодеров: Google выпустила мультимодальную модель Gemma 4 12B для локальной работы
Google DeepMind представила Gemma 4 12B — открытую ИИ-модель, которая обрабатывает текст, изображения и звук напрямую, без промежуточных энкодеров, и требует всего 16 ГБ памяти.