Fine-tuning
Определение
Дообучение — процесс адаптации предобученной AI-модели к конкретной задаче или домену путём дополнительного обучения на специализированных данных.
Простое объяснение
Это как взять умного помощника и научить его работать именно в твоей области — например, понимать медицинские термины или юридические документы.
Подробнее
Виды дообучения:
- Full fine-tuning — обновление всех весов модели
- LoRA — обучение только адаптеров (экономично)
- RLHF — дообучение с обратной связью от человека
- Instruction tuning — обучение следовать инструкциям
Это позволяет создать специализированную модель без обучения с нуля.
Связанные термины
KV Cache
KV Cache — механизм кэширования ключей (Keys) и значений (Values) в трансформерах для ускорения авторегрессивной генерации.
FlashAttention
FlashAttention — алгоритм вычисления attention, оптимизированный для GPU, который значительно снижает использование памяти и ускоряет обучение и inference.
Adapter
Адаптер — небольшой обучаемый модуль, встраиваемый между слоями предобученной модели для её адаптации под новые задачи без изменения основных весов.
Модель
Модель в ML — обученный алгоритм, который принимает входные данные и выдаёт предсказания или генерирует результат.
