Управление данными
Определение
Управление данными (Data Management) — процессы сбора, хранения, обработки и защиты данных, критичные для работы AI-систем.
Простое объяснение
Это правила и инструменты для работы с данными: как их собирать, хранить и защищать, чтобы AI мог хорошо учиться.
Подробнее
Компоненты data management для AI:
- Data Governance — политики и стандарты
- Data Quality — чистота данных
- Data Lineage — отслеживание происхождения
- Data Security — защита и приватность
Качество данных определяет качество AI.
Связанные термины
BLEU/ROUGE
BLEU и ROUGE — классические метрики для оценки качества генерации текста путём сравнения с эталонными ответами.
Sentiment Analysis
Sentiment Analysis — автоматическое определение эмоциональной окраски текста: позитивной, негативной или нейтральной.
Contamination
Contamination (утечка данных) — проблема попадания тестовых данных в обучающую выборку, что приводит к завышенным результатам на бенчмарках.
Leaderboard
Leaderboard — таблица рейтингов AI-моделей по результатам стандартизированных бенчмарков, позволяющая сравнивать их производительность.
