Семантический поиск
Определение
Семантический поиск — поиск информации по смыслу, а не по ключевым словам, с использованием эмбеддингов и векторных баз данных.
Простое объяснение
Это умный поиск, который понимает смысл вопроса. Если спросить «как починить компьютер», найдёт статьи про ремонт ПК, даже если там нет слова «починить».
Подробнее
Как работает семантический поиск:
- Текст преобразуется в эмбеддинг (вектор)
- Находятся похожие векторы в базе
- Возвращаются семантически близкие документы
Технологии: Pinecone, Weaviate, sentence-transformers.
Связанные термины
Contamination
Contamination (утечка данных) — проблема попадания тестовых данных в обучающую выборку, что приводит к завышенным результатам на бенчмарках.
Anomaly Detection
Anomaly Detection — автоматическое выявление необычных паттернов, выбросов или аномалий в данных.
Data Labeling
Data Labeling — процесс разметки данных людьми для создания обучающих выборок для supervised learning моделей.
Sentiment Analysis
Sentiment Analysis — автоматическое определение эмоциональной окраски текста: позитивной, негативной или нейтральной.
