RAG
Определение
RAG (Retrieval-Augmented Generation) — архитектура, дополняющая LLM актуальной информацией из внешних источников через поиск перед генерацией ответа.
Простое объяснение
Это когда AI сначала ищет нужную информацию в базе данных, а потом использует её для ответа — как ученик, который может пользоваться учебником.
Подробнее
Компоненты RAG:
- Indexing — создание эмбеддингов документов
- Retrieval — поиск релевантных фрагментов
- Augmentation — добавление в контекст
- Generation — генерация ответа LLM
RAG решает проблему устаревших знаний и галлюцинаций.
Связанные термины
Запрос
Запрос (промпт) — текстовая инструкция или вопрос, отправляемый пользователем языковой модели для получения ответа.
Foundation Model
Фундаментальная модель — большая AI-модель, предобученная на огромных объёмах данных, которая может быть адаптирована для множества различных задач.
Speech-to-Text
Speech-to-Text (STT) — технология автоматического распознавания речи и преобразования её в текст.
Prompt Engineering
Промпт-инжиниринг — искусство и наука составления эффективных запросов (промптов) к AI-моделям для получения качественных результатов.
