Diffusion Models
Определение
Диффузионные модели — класс генеративных моделей, которые учатся создавать данные путём постепенного удаления шума из случайного входа.
Простое объяснение
Представьте, что вы учитесь восстанавливать фотографии из помех. Сначала вы смотрите, как чистое фото постепенно зашумляется до белого шума. Потом учитесь делать обратное — из шума восстанавливать картинку шаг за шагом.
Подробнее
Связанные термины
Языковая модель
Языковая модель — AI-система, обученная понимать и генерировать текст на естественном языке, предсказывая вероятность следующего слова или токена.
Speech-to-Text
Speech-to-Text (STT) — технология автоматического распознавания речи и преобразования её в текст.
Vision-Language Model
Vision-Language Model — мультимодальная модель, способная обрабатывать и понимать как изображения, так и текст, отвечая на вопросы о визуальном контенте.
Sora
Sora — модель генерации видео от OpenAI, способная создавать реалистичные видеоролики до минуты по текстовому описанию.
