Bias
Определение
Предвзятость в AI — систематические ошибки или искажения в данных и алгоритмах, которые приводят к несправедливым или дискриминационным результатам.
Простое объяснение
Это когда AI учится на «неправильных» примерах и начинает делать несправедливые выводы — как если бы ты судил обо всех людях только по своим друзьям.
Подробнее
Bias может возникать на разных этапах:
- Data bias — нерепрезентативные обучающие данные
- Algorithmic bias — особенности архитектуры модели
- Human bias — предубеждения разработчиков
Примеры: AI для найма, предпочитающий мужчин; системы распознавания лиц с ошибками для определённых этнических групп.
Связанные термины
Red Teaming
Red Teaming — практика систематического тестирования AI-систем на уязвимости путём симуляции атак злоумышленников.
Grounding
Grounding — привязка генерации AI к фактическим данным, документам или внешним источникам для повышения точности и уменьшения галлюцинаций.
Constitutional AI
Constitutional AI — подход Anthropic к созданию безопасного AI, где модель обучается следовать набору принципов (конституции) через самокритику и ревизию.
EU AI Act
EU AI Act — первое в мире комплексное регулирование AI, устанавливающее требования к системам искусственного интеллекта в Европейском Союзе.
