Модель
Определение
Модель в ML — обученный алгоритм, который принимает входные данные и выдаёт предсказания или генерирует результат.
Простое объяснение
Модель — это обученная программа, которая умеет делать что-то конкретное: писать текст, распознавать картинки или переводить.
Подробнее
Типы AI-моделей:
- Языковые — GPT, Claude, LLaMA
- Визуальные — Stable Diffusion, DALL-E
- Мультимодальные — GPT-4o, Gemini
- Специализированные — CodeLLaMA, MedPaLM
Модель = архитектура + веса (параметры).
Связанные термины
Machine Learning
Машинное обучение — область AI, в которой алгоритмы обучаются на данных, выявляя закономерности и делая предсказания без явного программирования правил.
NLP
Обработка естественного языка (NLP) — область AI, занимающаяся взаимодействием компьютеров с человеческим языком: понимание, генерация, перевод.
Transformer
Трансформер — архитектура нейронной сети с механизмом внимания (attention), ставшая основой современных языковых моделей и генеративного AI.
Scaling Laws
Scaling Laws — эмпирические закономерности, связывающие производительность модели с её размером, объёмом данных и compute.
