Bias
Определение
Предвзятость в AI — систематические ошибки или искажения в данных и алгоритмах, которые приводят к несправедливым или дискриминационным результатам.
Простое объяснение
Это когда AI учится на «неправильных» примерах и начинает делать несправедливые выводы — как если бы ты судил обо всех людях только по своим друзьям.
Подробнее
Bias может возникать на разных этапах:
- Data bias — нерепрезентативные обучающие данные
- Algorithmic bias — особенности архитектуры модели
- Human bias — предубеждения разработчиков
Примеры: AI для найма, предпочитающий мужчин; системы распознавания лиц с ошибками для определённых этнических групп.
Связанные термины
Grounding
Grounding — привязка генерации AI к фактическим данным, документам или внешним источникам для повышения точности и уменьшения галлюцинаций.
Constitutional AI
Constitutional AI — подход Anthropic к созданию безопасного AI, где модель обучается следовать набору принципов (конституции) через самокритику и ревизию.
Red Teaming
Red Teaming — практика систематического тестирования AI-систем на уязвимости путём симуляции атак злоумышленников.
Model Card
Model Card — стандартизированный документ, описывающий ML-модель: её назначение, производительность, ограничения и этические аспекты.
