Для чего предназначена модель GPT-Rosalind от OpenAI?

GPT-Rosalind — это специализированная языковая модель, разработанная OpenAI для ускорения научных исследований в области биологии, трансляционной медицины и разработки лекарств. Она создана для решения сложных задач, требующих глубокого понимания химии, геномики и белковой инженерии.

Как GPT-Rosalind помогает в разработке лекарств?

Модель значительно сокращает время на проверку гипотез и повышает качество планирования экспериментов на ранних стадиях разработки препаратов. Она выступает как оркестратор, связывая разрозненные инструменты биоинформатики и предоставляя доступ к обширным научным базам данных через специализированный плагин.

Чем GPT-Rosalind отличается от обычных больших языковых моделей?

В отличие от универсальных LLM, GPT-Rosalind оптимизирована под конкретные научные задачи и обладает улучшенной способностью использовать внешние инструменты. Она может выстраивать длинные логические цепочки в строгих рамках научного метода, что критически важно для работы с огромными массивами биологических данных.

Кто может получить доступ к GPT-Rosalind?

Из-за потенциальных рисков, связанных с биобезопасностью, GPT-Rosalind запускается в рамках программы доверенного доступа. На начальном этапе доступ получат только квалифицированные корпоративные клиенты в США, чья деятельность связана с легитимными научными исследованиями.

Каковы результаты тестирования производительности GPT-Rosalind?

Тестирование показало, что GPT-Rosalind превосходит модель GPT-5.4 в 6 из 11 категорий бенчмарка LABBench2, особенно в задачах молекулярного клонирования. В задачах предсказания функций РНК модель превзошла показатели 95-го перцентиля профильных специалистов-людей.

OpenAI представила GPT-Rosalind: специализированная модел...

Сегодня компания OpenAI представила GPT-Rosalind — новую языковую модель, специально разработанную для исследований в области биологии, разработки лекарств и трансляционной медицины. Названная в честь Розалинд Франклин, чьи работы легли в основу понимания структуры ДНК, эта модель призвана решать сложные научные задачи, требующие глубокого понимания химии, белковой инженерии и геномики. Это важный шаг в развитии искусственного интеллекта: индустрия начинает переходить от создания универсальных систем к разработке глубоко специализированных инструментов.

В среднем путь от поиска биологической мишени до одобрения нового лекарства в США занимает от 10 до 15 лет. Прогресс в науках о жизни тормозится не только фундаментальной сложностью самой науки, но и фрагментированностью исследовательских процессов (workflows). Ученым приходится ежедневно работать с огромными массивами научной литературы, специализированными базами данных, результатами экспериментов и постоянно меняющимися гипотезами. Традиционные большие языковые модели (LLM) часто не справляются с такими задачами из-за неумения выстраивать длинные логические цепочки в строгих рамках научного метода.

Life science plugin demo static image

GPT-Rosalind решает эту проблему за счет оптимизации под конкретные научные задачи и улучшенной способности использовать внешние инструменты. В рамках релиза OpenAI также представила плагин Life Sciences для среды Codex. Он предоставляет модели доступ к более чем 50 публичным мультиомиксным базам данных, источникам литературы и биологическим инструментам. Это позволяет системе выполнять многошаговые задачи: от поиска информации о структуре белка до планирования экспериментов и анализа данных.

Результаты тестирования показывают значительный скачок в производительности. На бенчмарке LABBench2, который оценивает выполнение реальных исследовательских задач, GPT-Rosalind превосходит модель GPT-5.4 в 6 из 11 категорий. Наибольший прирост зафиксирован в задачах молекулярного клонирования, требующих сквозного проектирования реагентов. В совместном исследовании с биотехнологической компанией Dyno Therapeutics модель оценивали на задачах предсказания функций РНК. Результаты оказались впечатляющими: лучшие ответы модели превзошли показатели 95-го перцентиля профильных специалистов-людей.

model spec > art card

Появление GPT-Rosalind указывает на важный тренд: будущее искусственного интеллекта в науке лежит в плоскости интеграции логического вывода (reasoning) с существующей вычислительной инфраструктурой. Модель выступает не просто как база знаний, а как оркестратор, способный связывать разрозненные инструменты биоинформатики в единый процесс. Это может радикально снизить время на проверку гипотез и повысить качество планируемых экспериментов на ранних стадиях разработки препаратов.

Особого внимания заслуживает подход OpenAI к распространению модели. Из-за потенциальных рисков, связанных с биобезопасностью, GPT-Rosalind запускается в рамках программы доверенного доступа (trusted-access). На начальном этапе доступ получат только квалифицированные корпоративные клиенты в США, чья деятельность связана с легитимными научными исследованиями. Это демонстрирует растущее понимание индустрией необходимости строгого контроля над технологиями двойного назначения. В перспективе успешное применение таких систем может изменить экономику фармацевтической отрасли, существенно повысив процент успешных открытий.