Computer Vision
Определение
Компьютерное зрение — область AI, которая обучает машины «видеть» и понимать визуальную информацию: изображения и видео.
Простое объяснение
Это когда компьютер учится смотреть на картинки и понимать, что на них изображено — как ты узнаёшь кошку или собаку.
Подробнее
Задачи компьютерного зрения:
- Классификация — определение объекта на изображении
- Детекция — поиск и локализация объектов
- Сегментация — выделение границ объектов
- OCR — распознавание текста
Применение: беспилотные авто, медицинская диагностика, контроль качества.
Связанные термины
Transformer
Трансформер — архитектура нейронной сети с механизмом внимания (attention), ставшая основой современных языковых моделей и генеративного AI.
Inference
Инференс — процесс получения предсказаний или результатов от обученной AI-модели на новых входных данных.
CLIP
CLIP (Contrastive Language-Image Pre-training) — модель OpenAI, связывающая изображения и текст в общем пространстве представлений.
FlashAttention
FlashAttention — алгоритм вычисления attention, оптимизированный для GPU, который значительно снижает использование памяти и ускоряет обучение и inference.
