Multimodal
Определение
Multimodal — способность AI-системы обрабатывать и генерировать данные разных типов: текст, изображения, аудио, видео.
Простое объяснение
Multimodal — как AI с несколькими органами чувств. Может видеть, слышать, читать — и понимать связи между всем этим.
Подробнее
Связанные термины
Upscaling
Upscaling — увеличение разрешения изображения с помощью AI, добавляющего реалистичные детали, которых не было в оригинале.
Промпт
Текстовый запрос или инструкция, которую пользователь даёт AI-модели для получения нужного результата.
Generative AI
Генеративный AI — системы искусственного интеллекта, способные создавать новый контент: тексты, изображения, музыку, видео, код.
Foundation Model
Фундаментальная модель — большая AI-модель, предобученная на огромных объёмах данных, которая может быть адаптирована для множества различных задач.
