Gemini
Определение
Gemini — мультимодальное семейство AI-моделей от Google DeepMind, объединяющее понимание текста, изображений, аудио и видео.
Простое объяснение
Gemini — это Google''s ответ на ChatGPT. Умеет всё: читать, смотреть, слушать, и встроен во все продукты Google.
Подробнее
Связанные термины
Speech-to-Text
Speech-to-Text (STT) — технология автоматического распознавания речи и преобразования её в текст.
DALL-E
DALL-E — модель генерации изображений от OpenAI, названная в честь художника Дали и робота WALL-E.
Outpainting
Outpainting — расширение границ изображения за пределы оригинала с генерацией нового контента, соответствующего стилю и содержанию.
Vision-Language Model
Vision-Language Model — мультимодальная модель, способная обрабатывать и понимать как изображения, так и текст, отвечая на вопросы о визуальном контенте.
