OpenAI тестирует возможности ИИ в доказательстве сложных математических теорем
Компания представила решения для челленджа First Proof, утверждая, что их модель справилась с 5 из 10 задач исследовательского уровня. Разбираем, почему это важно для науки.

Суть события
OpenAI опубликовала результаты тестирования своей новой внутренней модели на задачах челленджа First Proof. Это соревнование, направленное на проверку способности искусственного интеллекта генерировать корректные и проверяемые математические доказательства исследовательского уровня. Компания утверждает, что модель с высокой вероятностью успешно решила 5 из 10 предложенных задач (номера 4, 5, 6, 9 и 10), хотя некоторые решения все еще находятся на стадии экспертной проверки.
Контекст
До недавнего времени математические способности языковых моделей ограничивались школьными или олимпиадными задачами, где решение обычно известно и имеет четкий алгоритм. Челлендж First Proof принципиально отличается: он состоит из открытых проблем или задач, требующих глубокого понимания узкоспециализированных областей математики. Некоторые из этих проблем оставались нерешенными годами.

new result theoretical physics > card image
Это продолжение тренда, который мы наблюдаем с 2025 года. В июле 2025 года модель OpenAI достигла уровня золотой медали на Международной математической олимпиаде (IMO). Позже, в ноябре, были опубликованы эксперименты с GPT-5 по ускорению научных открытий. Текущий эксперимент — это попытка перейти от решения учебных задач к созданию нового научного знания.
Детали эксперимента
Модель работала в режиме «спринта» с ограниченным человеческим надзором. Вот ключевые технические моменты:





