Fine-tuning
Определение
Дообучение — процесс адаптации предобученной AI-модели к конкретной задаче или домену путём дополнительного обучения на специализированных данных.
Простое объяснение
Это как взять умного помощника и научить его работать именно в твоей области — например, понимать медицинские термины или юридические документы.
Подробнее
Виды дообучения:
- Full fine-tuning — обновление всех весов модели
- LoRA — обучение только адаптеров (экономично)
- RLHF — дообучение с обратной связью от человека
- Instruction tuning — обучение следовать инструкциям
Это позволяет создать специализированную модель без обучения с нуля.
Связанные термины
LoRA
Low-Rank Adaptation — метод эффективного дообучения больших языковых моделей, который замораживает исходные веса и добавляет небольшие обучаемые матрицы.
YOLO
YOLO (You Only Look Once) — семейство алгоритмов компьютерного зрения для обнаружения объектов в реальном времени на изображениях и видео.
Глубокое обучение
Подмножество машинного обучения, использующее многослойные нейронные сети для анализа данных.
Жизненный цикл модели
Жизненный цикл ML-модели — этапы от постановки задачи до вывода из эксплуатации: сбор данных, обучение, deployment, мониторинг, обновление.
