Gemini
Определение
Gemini — мультимодальное семейство AI-моделей от Google DeepMind, объединяющее понимание текста, изображений, аудио и видео.
Простое объяснение
Gemini — это Google''s ответ на ChatGPT. Умеет всё: читать, смотреть, слушать, и встроен во все продукты Google.
Подробнее
Связанные термины
Multimodal AI
Мультимодальный AI — системы, способные обрабатывать и генерировать данные разных типов: текст, изображения, аудио, видео — одновременно.
Prompt Engineering
Промпт-инжиниринг — искусство и наука составления эффективных запросов (промптов) к AI-моделям для получения качественных результатов.
Языковая модель
Языковая модель — AI-система, обученная понимать и генерировать текст на естественном языке, предсказывая вероятность следующего слова или токена.
ControlNet
ControlNet — метод точного управления генерацией изображений через дополнительные условия: позы, края, глубину, скетчи.
