Holo3 от H company: Новый стандарт автономных агентов для управления ПК
Анализ новой модели Holo3, установившей рекорд в бенчмарке OSWorld. Как синтетические среды и агентный подход меняют автоматизацию корпоративных рабочих процессов.
Анализ новой модели Holo3, установившей рекорд в бенчмарке OSWorld. Как синтетические среды и агентный подход меняют автоматизацию корпоративных рабочих процессов.
3 мин

Компания H company анонсировала Holo3 — новое поколение систем искусственного интеллекта, ориентированных на концепцию автономного предприятия. Флагманская модель Holo3-122B-A10B достигла результата в 78.85% на бенчмарке OSWorld-Verified, установив новый стандарт для агентов, способных управлять настольными компьютерами и графическими интерфейсами.
Взаимодействие искусственного интеллекта с графическими интерфейсами пользователя (GUI) остается одной из самых сложных задач в индустрии. Традиционные большие языковые модели (LLM) отлично справляются с текстом, но часто теряют контекст, когда необходимо найти нужный элемент на экране, сопоставить данные из разных окон или выполнить длительный многошаговый процесс в корпоративном программном обеспечении. Ранее для решения подобных задач требовались огромные вычислительные мощности и сложные программные надстройки.
Архитектура Holo3 построена на принципах эффективного распределения вычислений. Флагманская версия обладает общим объемом в 122 миллиарда параметров, но при каждом действии активирует лишь 10 миллиардов. Это делает модель значительно более экономичной в эксплуатации по сравнению с крупными проприетарными системами. Важным шагом для сообщества стал выпуск младшей версии — Holo3-35B-A3B. Модель выложена в открытый доступ на платформе Hugging Face под лицензией Apache2, что позволяет независимым разработчикам и компаниям свободно использовать ее в своих проектах.
Фундаментом успеха модели разработчики называют специализированный конвейер обучения, который они обозначают как "агентный маховик" (Agentic Learning Flywheel). Этот процесс включает использование как собранных людьми, так и сгенерированных инструкций для навигации. Данные программно аугментируются для подготовки модели к нестандартным ситуациям, после чего проходят строгую фильтрацию с применением обучения с подкреплением (Reinforcement Learning).
Наибольший исследовательский интерес представляет подход команды к генерации обучающих данных. Для тренировки агентов была разработана "Фабрика синтетических сред" (Synthetic Environment Factory). Это закрытая система, внутри которой специализированные алгоритмы с нуля создают веб-сайты и корпоративные интерфейсы по заданным спецификациям. Таким образом, Holo3 обучается в контролируемой тренировочной среде, где каждое действие агента можно автоматически проверить и оценить.
Для тестирования готовности модели к реальным бизнес-задачам компания разработала собственные корпоративные бенчмарки (H Corporate Benchmarks). Набор включает 486 многошаговых сценариев, охватывающих электронную коммерцию, совместную работу и использование специализированного софта. Самые сложные задачи требуют от агента работы сразу в нескольких приложениях: например, извлечения данных из PDF-документа, их сверки с внутренней базой данных и последующей автоматической рассылки писем. Это требует от системы устойчивого удержания контекста и намерений на протяжении десятков шагов.
Выпуск открытой версии Holo3 с лицензией Apache2 может существенно ускорить развитие систем автоматизации с открытым исходным кодом. Использование синтетических интерфейсов для обучения наглядно показывает, как можно преодолеть дефицит качественных данных о взаимодействии человека с компьютером. Следующим этапом развития разработчики видят переход к "адаптивной агентности" (Adaptive Agency) — состоянию, при котором модели смогут самостоятельно изучать и осваивать совершенно новые корпоративные программы в режиме реального времени, без предварительной подготовки.
H company доказала, что обучение в автоматически генерируемых синтетических средах позволяет компактным ИИ-агентам превосходить крупные модели в задачах управления компьютером.
Ключевым фактором развития агентов становится не наращивание объема модели, а создание виртуальных "тренировочных полигонов", где ИИ может безопасно и проверяемо взаимодействовать с тысячами вариантов интерфейсов.