Embedding
Определение
Эмбеддинг — представление данных (текста, изображений, аудио) в виде числовых векторов, где семантически близкие объекты располагаются рядом в векторном пространстве.
Простое объяснение
Это способ превратить слова в числа так, чтобы похожие по смыслу слова были рядом. Как если бы «кошка» и «котёнок» стояли близко на числовой линейке.
Подробнее
Эмбеддинги — основа современного AI:
- Word embeddings — Word2Vec, GloVe
- Sentence embeddings — для семантического поиска
- Image embeddings — CLIP, для поиска по изображениям
Применение: RAG-системы, рекомендации, кластеризация, поиск похожих документов.
Связанные термины
LoRA
Low-Rank Adaptation — метод эффективного дообучения больших языковых моделей, который замораживает исходные веса и добавляет небольшие обучаемые матрицы.
Глубокое обучение
Подмножество машинного обучения, использующее многослойные нейронные сети для анализа данных.
Фича
Фича (признак, feature) — входной параметр или характеристика данных, используемая ML-моделью для обучения и предсказаний.
Transformer
Трансформер — архитектура нейронной сети с механизмом внимания (attention), ставшая основой современных языковых моделей и генеративного AI.
