Data Labeling
Определение
Data Labeling — процесс разметки данных людьми для создания обучающих выборок для supervised learning моделей.
Простое объяснение
Data Labeling — как обучение AI на примерах, размеченных людьми. Показываем "это кот, это собака" много раз, пока AI не научится различать сам.
Подробнее
Связанные термины
Question Answering
Question Answering (QA) — задача автоматического ответа на вопросы на естественном языке на основе текста или базы знаний.
Contamination
Contamination (утечка данных) — проблема попадания тестовых данных в обучающую выборку, что приводит к завышенным результатам на бенчмарках.
Synthetic Data
Синтетические данные — искусственно сгенерированные данные, имитирующие реальные, используемые для обучения AI при недостатке или конфиденциальности реальных данных.
Хранилище данных
Хранилище данных (Data Warehouse) — централизованная система для хранения и анализа больших объёмов структурированных данных для бизнес-аналитики и AI.
