Сегодня компания OpenAI представила GPT-Rosalind — новую языковую модель, специально разработанную для исследований в области биологии, разработки лекарств и трансляционной медицины. Названная в честь Розалинд Франклин, чьи работы легли в основу понимания структуры ДНК, эта модель призвана решать сложные научные задачи, требующие глубокого понимания химии, белковой инженерии и геномики. Это важный шаг в развитии искусственного интеллекта: индустрия начинает переходить от создания универсальных систем к разработке глубоко специализированных инструментов.
В среднем путь от поиска биологической мишени до одобрения нового лекарства в США занимает от 10 до 15 лет. Прогресс в науках о жизни тормозится не только фундаментальной сложностью самой науки, но и фрагментированностью исследовательских процессов (workflows). Ученым приходится ежедневно работать с огромными массивами научной литературы, специализированными базами данных, результатами экспериментов и постоянно меняющимися гипотезами. Традиционные большие языковые модели (LLM) часто не справляются с такими задачами из-за неумения выстраивать длинные логические цепочки в строгих рамках научного метода.
Life science plugin demo static image
GPT-Rosalind решает эту проблему за счет оптимизации под конкретные научные задачи и улучшенной способности использовать внешние инструменты. В рамках релиза OpenAI также представила плагин Life Sciences для среды Codex. Он предоставляет модели доступ к более чем 50 публичным мультиомиксным базам данных, источникам литературы и биологическим инструментам. Это позволяет системе выполнять многошаговые задачи: от поиска информации о структуре белка до планирования экспериментов и анализа данных.
Результаты тестирования показывают значительный скачок в производительности. На бенчмарке LABBench2, который оценивает выполнение реальных исследовательских задач, GPT-Rosalind превосходит модель GPT-5.4 в 6 из 11 категорий. Наибольший прирост зафиксирован в задачах молекулярного клонирования, требующих сквозного проектирования реагентов. В совместном исследовании с биотехнологической компанией Dyno Therapeutics модель оценивали на задачах предсказания функций РНК. Результаты оказались впечатляющими: лучшие ответы модели превзошли показатели 95-го перцентиля профильных специалистов-людей.
Появление GPT-Rosalind указывает на важный тренд: будущее искусственного интеллекта в науке лежит в плоскости интеграции логического вывода (reasoning) с существующей вычислительной инфраструктурой. Модель выступает не просто как база знаний, а как оркестратор, способный связывать разрозненные инструменты биоинформатики в единый процесс. Это может радикально снизить время на проверку гипотез и повысить качество планируемых экспериментов на ранних стадиях разработки препаратов.
Особого внимания заслуживает подход OpenAI к распространению модели. Из-за потенциальных рисков, связанных с биобезопасностью, GPT-Rosalind запускается в рамках программы доверенного доступа (trusted-access). На начальном этапе доступ получат только квалифицированные корпоративные клиенты в США, чья деятельность связана с легитимными научными исследованиями. Это демонстрирует растущее понимание индустрией необходимости строгого контроля над технологиями двойного назначения. В перспективе успешное применение таких систем может изменить экономику фармацевтической отрасли, существенно повысив процент успешных открытий.