Что такое Holo3 и чем он отличается от других ИИ-систем?

Holo3 — это новое поколение ИИ-систем от H company, разработанное для автономного управления настольными компьютерами и графическими интерфейсами. В отличие от традиционных LLM, он эффективно справляется с многошаговыми задачами в корпоративном ПО, не теряя контекста.

Почему Holo3 считается прорывом в управлении ПК с помощью ИИ?

Holo3 установил новый стандарт, достигнув 78.85% на бенчмарке OSWorld-Verified, что демонстрирует его способность беспрецедентно взаимодействовать с графическими интерфейсами. Этот прорыв обусловлен инновационной архитектурой и специализированным конвейером обучения.

Как Holo3 обучается выполнять задачи в корпоративных программах?

Обучение Holo3 основано на уникальном "агентном маховике" и "Фабрике синтетических сред". Последняя генерирует веб-сайты и корпоративные интерфейсы с нуля, позволяя модели тренироваться в контролируемой среде и осваивать сложные многошаговые сценарии.

Какова роль открытого исходного кода в развитии Holo3?

Выпуск младшей версии Holo3-35B-A3B в открытый доступ под лицензией Apache2 позволяет независимым разработчикам свободно использовать модель. Это значительно ускоряет развитие систем автоматизации с открытым исходным кодом и способствует инновациям в сообществе.

Какие задачи может решать Holo3 в реальном бизнесе?

Holo3 способен выполнять сложные многошаговые сценарии в электронной коммерции, совместной работе и специализированном ПО. Например, он может извлекать данные из PDF, сверять их с базами данных и автоматически рассылать письма, устойчиво удерживая контекст на протяжении десятков шагов.

Holo3 от H company: Новый стандарт автономных агентов для...

Компания H company анонсировала Holo3 — новое поколение систем искусственного интеллекта, ориентированных на концепцию автономного предприятия. Флагманская модель Holo3-122B-A10B достигла результата в 78.85% на бенчмарке OSWorld-Verified, установив новый стандарт для агентов, способных управлять настольными компьютерами и графическими интерфейсами.

Взаимодействие искусственного интеллекта с графическими интерфейсами пользователя (GUI) остается одной из самых сложных задач в индустрии. Традиционные большие языковые модели (LLM) отлично справляются с текстом, но часто теряют контекст, когда необходимо найти нужный элемент на экране, сопоставить данные из разных окон или выполнить длительный многошаговый процесс в корпоративном программном обеспечении. Ранее для решения подобных задач требовались огромные вычислительные мощности и сложные программные надстройки.

Архитектура Holo3 построена на принципах эффективного распределения вычислений. Флагманская версия обладает общим объемом в 122 миллиарда параметров, но при каждом действии активирует лишь 10 миллиардов. Это делает модель значительно более экономичной в эксплуатации по сравнению с крупными проприетарными системами. Важным шагом для сообщества стал выпуск младшей версии — Holo3-35B-A3B. Модель выложена в открытый доступ на платформе Hugging Face под лицензией Apache2, что позволяет независимым разработчикам и компаниям свободно использовать ее в своих проектах.

Фундаментом успеха модели разработчики называют специализированный конвейер обучения, который они обозначают как "агентный маховик" (Agentic Learning Flywheel). Этот процесс включает использование как собранных людьми, так и сгенерированных инструкций для навигации. Данные программно аугментируются для подготовки модели к нестандартным ситуациям, после чего проходят строгую фильтрацию с применением обучения с подкреплением (Reinforcement Learning).

Наибольший исследовательский интерес представляет подход команды к генерации обучающих данных. Для тренировки агентов была разработана "Фабрика синтетических сред" (Synthetic Environment Factory). Это закрытая система, внутри которой специализированные алгоритмы с нуля создают веб-сайты и корпоративные интерфейсы по заданным спецификациям. Таким образом, Holo3 обучается в контролируемой тренировочной среде, где каждое действие агента можно автоматически проверить и оценить.

Для тестирования готовности модели к реальным бизнес-задачам компания разработала собственные корпоративные бенчмарки (H Corporate Benchmarks). Набор включает 486 многошаговых сценариев, охватывающих электронную коммерцию, совместную работу и использование специализированного софта. Самые сложные задачи требуют от агента работы сразу в нескольких приложениях: например, извлечения данных из PDF-документа, их сверки с внутренней базой данных и последующей автоматической рассылки писем. Это требует от системы устойчивого удержания контекста и намерений на протяжении десятков шагов.

Выпуск открытой версии Holo3 с лицензией Apache2 может существенно ускорить развитие систем автоматизации с открытым исходным кодом. Использование синтетических интерфейсов для обучения наглядно показывает, как можно преодолеть дефицит качественных данных о взаимодействии человека с компьютером. Следующим этапом развития разработчики видят переход к "адаптивной агентности" (Adaptive Agency) — состоянию, при котором модели смогут самостоятельно изучать и осваивать совершенно новые корпоративные программы в режиме реального времени, без предварительной подготовки.

Holo3 от H company: Новый стандарт автономных агентов для управления ПК

TL;DR

Главное

Ключевые факты

Инсайт

Читайте также

IBM представляет ScarfBench: тестирование ИИ-агентов в задачах миграции корпоративного кода

OpenAI представляет GeneBench-Pro: новый стандарт оценки ИИ в вычислительной биологии

Интеграция Claude Science и NVIDIA BioNeMo: как ИИ-агенты ускоряют научные исследования

Гайды по теме