Fine-tuning
Определение
Дообучение — процесс адаптации предобученной AI-модели к конкретной задаче или домену путём дополнительного обучения на специализированных данных.
Простое объяснение
Это как взять умного помощника и научить его работать именно в твоей области — например, понимать медицинские термины или юридические документы.
Подробнее
Виды дообучения:
- Full fine-tuning — обновление всех весов модели
- LoRA — обучение только адаптеров (экономично)
- RLHF — дообучение с обратной связью от человека
- Instruction tuning — обучение следовать инструкциям
Это позволяет создать специализированную модель без обучения с нуля.
Связанные термины
Attention Mechanism
Механизм внимания — фундаментальный компонент современных нейросетей, позволяющий модели динамически фокусироваться на релевантных частях входных данных.
Zero-shot Learning
Zero-shot обучение — способность AI выполнять задачи, на которых модель не обучалась напрямую, используя общие знания и инструкции.
Speculative Decoding
Speculative Decoding — метод ускорения inference LLM, где маленькая модель генерирует черновые токены, а большая модель верифицирует их параллельно.
Self-Attention
Самовнимание — разновидность attention, где каждый элемент последовательности сравнивается со всеми остальными элементами той же последовательности.
