Jailbreak
Определение
Jailbreak — техники обхода встроенных ограничений AI-модели для получения запрещённых ответов или нежелательного поведения.
Простое объяснение
Jailbreak — как взлом замка, который AI поставил на свои возможности. Хакеры ищут обходные пути, разработчики укрепляют защиту.
Подробнее
Связанные термины
Bias
Предвзятость в AI — систематические ошибки или искажения в данных и алгоритмах, которые приводят к несправедливым или дискриминационным результатам.
Watermarking
Watermarking — технология встраивания скрытых меток в AI-генерированный контент для последующей идентификации его происхождения.
AI Alignment
Согласование AI — область исследований, направленная на создание AI-систем, чьи цели и поведение соответствуют человеческим ценностям и намерениям.
Галлюцинации AI
Генерация AI-моделью правдоподобной, но фактически неверной информации.
