Эволюция Hermes - от 7B до агента - Hermes Agent курс

Видео-введение к уроку

Пять поколений за три года

Серия Hermes прошла путь от простого дообучения LLaMA 7B на данных GPT-4 до полноценного агента с гибридным рассуждением, вызовом инструментов и контекстным окном в 512 тысяч токенов. Каждое поколение добавляло принципиально новые возможности.

Эволюция серии Hermes - от 7B до агента — Хронология развития Hermes: ключевые версии и прорывы(нажмите для увеличения)

Hermes 1 (2023) - начало

Первая версия Hermes была создана путем дообучения LLaMA 7B и 13B на синтетических данных, сгенерированных GPT-4. Главное нововведение - формат ChatML для структурированных диалогов. Модель быстро набрала популярность в сообществе благодаря качеству ответов, значительно превосходившему базовую LLaMA.

Hermes 2 Pro (май 2024) - вызов функций

Переломный момент для серии. Hermes 2 Pro первой среди открытых моделей получила надежный вызов функций (function calling) с точностью 90% на стандартных тестах. Это превратило модель из текстового генератора в основу для AI-агентов.

Hermes 3 (август 2024) - переход на XML

Третье поколение построено на базе Llama 3.1 и обучено на 390 миллионах токенов. Главное архитектурное изменение - переход с ChatML на XML-теги для структурированных рассуждений. XML оказался удобнее для вложенных структур и агентных сценариев.

Hermes 4 (август 2025) - гибридное рассуждение

Четвертое поколение добавило гибридное рассуждение - модель может сама выбирать, когда применять пошаговый анализ, а когда отвечать сразу. Результат - 96% на бенчмарке MATH-500, что сопоставимо с закрытыми моделями топ-уровня.

Hermes 4.3 (декабрь 2025) - текущая версия

Последняя версия построена на базе Seed 36B с контекстным окном 512 тысяч токенов. Обучена через децентрализованную сеть Psyche, что снизило затраты на GPU. Модель поддерживает до 50 инструментов одновременно и работает как полноценный агент.

Версия	Год	Базовая модель	Ключевое нововведение	Бенчмарк
Hermes 1	2023	LLaMA 7B/13B	ChatML, данные GPT-4	Базовый уровень
Hermes 2 Pro	Май 2024	LLaMA 2	Вызов функций, 90% точность	90% function calling
Hermes 3	Август 2024	Llama 3.1	XML-теги, 390M токенов	Топ-3 открытых моделей
Hermes 4	Август 2025	Собственная база	Гибридное рассуждение	96% MATH-500
Hermes 4.3	Декабрь 2025	Seed 36B	512K контекст, Psyche	Лидер открытых моделей

ChatML vs XML - форматы разметки

Hermes менял формат структурированного общения между версиями. ChatML использовался в первых версиях, а начиная с Hermes 3 стандартом стал XML.

xml

// ChatML (Hermes 1-2) - плоская структура
<|im_start|>system
Вы - полезный ассистент.
<|im_end|>
<|im_start|>user
Какая погода в Москве?
<|im_end|>
<|im_start|>assistant
<tool_call>
{"name": "get_weather", "arguments": {"city": "Moscow"}}
</tool_call>
<|im_end|>

xml

// XML (Hermes 3+) - вложенная структура
<system>
Вы - полезный ассистент с доступом к инструментам.
</system>
<user>
Какая погода в Москве?
</user>
<assistant>
<SCRATCHPAD>
Пользователь хочет узнать погоду. Вызываю инструмент.
</SCRATCHPAD>
<tool_call>
  <name>get_weather</name>
  <arguments>{"city": "Moscow"}</arguments>
</tool_call>
</assistant>

XML-формат лучше подходит для агентных сценариев, потому что поддерживает вложенные блоки: рассуждения внутри ответа, множественные вызовы инструментов и структурированные планы.

Главный вывод

За три года Hermes прошел путь от простого дообучения чужой модели до полноценной агентной системы. Каждое поколение добавляло критически важную возможность: ChatML, вызов функций, XML-рассуждения, гибридное мышление, огромный контекст. Hermes 4.3 - это не просто модель, а платформа для создания автономных агентов.

Тест для самопроверки

Какая версия Hermes первой получила надежный вызов функций (function calling)?

Видео-введение к уроку

Пять поколений за три года

Hermes 1 (2023) - начало

Hermes 2 Pro (май 2024) - вызов функций

Hermes 3 (август 2024) - переход на XML

Hermes 4 (август 2025) - гибридное рассуждение

Hermes 4.3 (декабрь 2025) - текущая версия

Версия	Год	Базовая модель	Ключевое нововведение	Бенчмарк
Hermes 1	2023	LLaMA 7B/13B	ChatML, данные GPT-4	Базовый уровень
Hermes 2 Pro	Май 2024	LLaMA 2	Вызов функций, 90% точность	90% function calling
Hermes 3	Август 2024	Llama 3.1	XML-теги, 390M токенов	Топ-3 открытых моделей
Hermes 4	Август 2025	Собственная база	Гибридное рассуждение	96% MATH-500
Hermes 4.3	Декабрь 2025	Seed 36B	512K контекст, Psyche	Лидер открытых моделей

ChatML vs XML - форматы разметки

xml

// ChatML (Hermes 1-2) - плоская структура
<|im_start|>system
Вы - полезный ассистент.
<|im_end|>
<|im_start|>user
Какая погода в Москве?
<|im_end|>
<|im_start|>assistant
<tool_call>
{"name": "get_weather", "arguments": {"city": "Moscow"}}
</tool_call>
<|im_end|>

xml

// XML (Hermes 3+) - вложенная структура
<system>
Вы - полезный ассистент с доступом к инструментам.
</system>
<user>
Какая погода в Москве?
</user>
<assistant>
<SCRATCHPAD>
Пользователь хочет узнать погоду. Вызываю инструмент.
</SCRATCHPAD>
<tool_call>
  <name>get_weather</name>
  <arguments>{"city": "Moscow"}</arguments>
</tool_call>
</assistant>

Главный вывод

Тест для самопроверки

Какая версия Hermes первой получила надежный вызов функций (function calling)?

Эволюция Hermes - от 7B до агента

Цели урока

Пять поколений за три года

Hermes 1 (2023) - начало

Hermes 2 Pro (май 2024) - вызов функций

Hermes 3 (август 2024) - переход на XML

Hermes 4 (август 2025) - гибридное рассуждение

Hermes 4.3 (декабрь 2025) - текущая версия

ChatML vs XML - форматы разметки

Вопросы для размышления

Эволюция Hermes - от 7B до агента

Цели урока

Пять поколений за три года

Hermes 1 (2023) - начало

Hermes 2 Pro (май 2024) - вызов функций

Hermes 3 (август 2024) - переход на XML

Hermes 4 (август 2025) - гибридное рассуждение

Hermes 4.3 (декабрь 2025) - текущая версия

ChatML vs XML - форматы разметки

Вопросы для размышления