Фонд Andreessen Horowitz (a16z) возглавил раунд финансирования Серии А на сумму 43 миллиона долларов для стартапа Deeptune. На первый взгляд, это очередная инвестиция в инфраструктуру искусственного интеллекта. Однако за этой сделкой стоит фундаментальный сдвиг в том, как будут обучаться модели следующего поколения.
Долгое время прогресс в области ИИ определялся масштабированием: разработчики использовали больше вычислительных мощностей, улучшали архитектуры и, главное, собирали огромные массивы статических данных. Но по мере того как модели переходят от простой генерации текста к взаимодействию с реальным миром — использованию программ, навигации по интерфейсам и написанию кода — статических текстов из интернета становится недостаточно.
Your Data Agents Need Context
Главным ограничением становятся среды, в которых модели могут учиться, практиковаться и оцениваться. Обучение с подкреплением (reinforcement learning, или RL) превращается в критически важный слой стека технологий ИИ. Индустрия переходит от использования данных, размеченных людьми, к сложным инженерным системам, которые генерируют высококачественные сигналы для обучения в автоматическом режиме.
Стартап Deeptune, основанный Тимом Лупо, решает именно эту задачу. Компания создает передовые среды обучения с подкреплением, ориентированные на использование компьютера и написание кода. Чтобы модели могли выполнять сложные задачи, им требуются структурированные, реалистичные и измеримые условия. Создание таких сред — сложная инженерная задача, требующая глубокого понимания как передовых исследований, так и практических нужд ведущих лабораторий.
Deeptune уже активно сотрудничает с топовыми разработчиками ИИ. Результаты их работы отражаются в улучшении показателей на таких бенчмарках, как OSWorld (оценка использования компьютера) и Terminal-Bench (работа с интерфейсом командной строки). В статье a16z отмечается стремительный прогресс передовых моделей: например, Opus 4.6 достигает результата 72.7% в OSWorld, превышая базовый уровень человека (72.4%), а GPT-5.4 показывает результат в 75%. Это указывает на то, что системы постепенно обретают способность выполнять задачи от начала до конца, полностью управляя компьютером.
С точки зрения индустрии, этот переход означает трансформацию проблемы данных. Если раньше сбор данных был преимущественно задачей ручной разметки, то теперь это сложная инженерная и вычислительная проблема. Инфраструктура для RL требует тесной интеграции с передовыми исследованиями, и команда Deeptune, состоящая из выходцев из ведущих лабораторий, сфокусирована именно на этом.
Если прошлое десятилетие прогресса искусственного интеллекта определялось качеством и объемом статических наборов данных, то следующее десятилетие будет зависеть от качества сред обучения. Инвестиция в Deeptune — это ставка на то, что именно динамические среды станут фундаментом для появления по-настоящему автономных и полезных ИИ-агентов.