Эволюция Hermes - от 7B до агента
Цели урока
После прохождения этого урока вы сможете:
- 1Проследить развитие серии Hermes от первой до текущей версии
- 2Понять ключевые технические прорывы каждой версии
- 3Разобраться в форматах разметки ChatML и XML
- 4Оценить текущие возможности Hermes 4.3
Пять поколений за три года
Серия Hermes прошла путь от простого дообучения LLaMA 7B на данных GPT-4 до полноценного агента с гибридным рассуждением, вызовом инструментов и контекстным окном в 512 тысяч токенов. Каждое поколение добавляло принципиально новые возможности.

Hermes 1 (2023) - начало
Первая версия Hermes была создана путем дообучения LLaMA 7B и 13B на синтетических данных, сгенерированных GPT-4. Главное нововведение - формат ChatML для структурированных диалогов. Модель быстро набрала популярность в сообществе благодаря качеству ответов, значительно превосходившему базовую LLaMA.
Hermes 2 Pro (май 2024) - вызов функций
Переломный момент для серии. Hermes 2 Pro первой среди открытых моделей получила надежный вызов функций (function calling) с точностью 90% на стандартных тестах. Это превратило модель из текстового генератора в основу для AI-агентов.
Hermes 3 (август 2024) - переход на XML
Третье поколение построено на базе Llama 3.1 и обучено на 390 миллионах токенов. Главное архитектурное изменение - переход с ChatML на XML-теги для структурированных рассуждений. XML оказался удобнее для вложенных структур и агентных сценариев.
Hermes 4 (август 2025) - гибридное рассуждение
Четвертое поколение добавило гибридное рассуждение - модель может сама выбирать, когда применять пошаговый анализ, а когда отвечать сразу. Результат - 96% на бенчмарке MATH-500, что сопоставимо с закрытыми моделями топ-уровня.
Hermes 4.3 (декабрь 2025) - текущая версия
Последняя версия построена на базе Seed 36B с контекстным окном 512 тысяч токенов. Обучена через децентрализованную сеть Psyche, что снизило затраты на GPU. Модель поддерживает до 50 инструментов одновременно и работает как полноценный агент.
| Версия | Год | Базовая модель | Ключевое нововведение | Бенчмарк |
|---|---|---|---|---|
| Hermes 1 | 2023 | LLaMA 7B/13B | ChatML, данные GPT-4 | Базовый уровень |
| Hermes 2 Pro | Май 2024 | LLaMA 2 | Вызов функций, 90% точность | 90% function calling |
| Hermes 3 | Август 2024 | Llama 3.1 | XML-теги, 390M токенов | Топ-3 открытых моделей |
| Hermes 4 | Август 2025 | Собственная база | Гибридное рассуждение | 96% MATH-500 |
| Hermes 4.3 | Декабрь 2025 | Seed 36B | 512K контекст, Psyche | Лидер открытых моделей |
ChatML vs XML - форматы разметки
Hermes менял формат структурированного общения между версиями. ChatML использовался в первых версиях, а начиная с Hermes 3 стандартом стал XML.
// ChatML (Hermes 1-2) - плоская структура
<|im_start|>system
Вы - полезный ассистент.
<|im_end|>
<|im_start|>user
Какая погода в Москве?
<|im_end|>
<|im_start|>assistant
<tool_call>
{"name": "get_weather", "arguments": {"city": "Moscow"}}
</tool_call>
<|im_end|>// XML (Hermes 3+) - вложенная структура
<system>
Вы - полезный ассистент с доступом к инструментам.
</system>
<user>
Какая погода в Москве?
</user>
<assistant>
<SCRATCHPAD>
Пользователь хочет узнать погоду. Вызываю инструмент.
</SCRATCHPAD>
<tool_call>
<name>get_weather</name>
<arguments>{"city": "Moscow"}</arguments>
</tool_call>
</assistant>XML-формат лучше подходит для агентных сценариев, потому что поддерживает вложенные блоки: рассуждения внутри ответа, множественные вызовы инструментов и структурированные планы.
За три года Hermes прошел путь от простого дообучения чужой модели до полноценной агентной системы. Каждое поколение добавляло критически важную возможность: ChatML, вызов функций, XML-рассуждения, гибридное мышление, огромный контекст. Hermes 4.3 - это не просто модель, а платформа для создания автономных агентов.
Вопросы для размышления
- •Какой размер модели подойдет для ваших задач - 7B для скорости или 36B для качества?
- •Как контекстное окно в 512K токенов может изменить ваши рабочие процессы?
