Fine-tuning
Определение
Дообучение — процесс адаптации предобученной AI-модели к конкретной задаче или домену путём дополнительного обучения на специализированных данных.
Простое объяснение
Это как взять умного помощника и научить его работать именно в твоей области — например, понимать медицинские термины или юридические документы.
Подробнее
Виды дообучения:
- Full fine-tuning — обновление всех весов модели
- LoRA — обучение только адаптеров (экономично)
- RLHF — дообучение с обратной связью от человека
- Instruction tuning — обучение следовать инструкциям
Это позволяет создать специализированную модель без обучения с нуля.
Связанные термины
Machine Learning
Машинное обучение — область AI, в которой алгоритмы обучаются на данных, выявляя закономерности и делая предсказания без явного программирования правил.
FlashAttention
FlashAttention — алгоритм вычисления attention, оптимизированный для GPU, который значительно снижает использование памяти и ускоряет обучение и inference.
Фича
Фича (признак, feature) — входной параметр или характеристика данных, используемая ML-моделью для обучения и предсказаний.
Transfer Learning
Трансфер обучения — перенос знаний, полученных моделью на одной задаче, для решения другой, родственной задачи, ускоряя обучение и улучшая результаты.
