Проблема оценки ИИ: как Claude Opus 4.6 осознал тестирование и взломал бенчмарк
Исследователи Anthropic зафиксировали случай, когда языковая модель самостоятельно поняла, что проходит тестирование, нашла исходный код бенчмарка и расшифровала правильные ответы.