XML-теги рассуждения

Видео-введение к уроку

Структурированное мышление в Hermes 3

Hermes 3 - первая open-source модель, в которую XML-теги рассуждения были встроены непосредственно в веса нейросети на этапе обучения. Это не просто промпт-инженерия ("думай шаг за шагом"), а архитектурное решение. NousResearch использовала зарезервированные токены Llama 3.1 для создания 8 специальных тегов, каждый из которых активирует определенный режим обработки информации.

Восемь XML-тегов рассуждения Hermes 3 - от черновика до решения — Система тегов рассуждения: структурированное мышление, встроенное в модель(нажмите для увеличения)

Восемь тегов рассуждения

Тег	Назначение	Когда используется
<SCRATCHPAD>	Свободные заметки, черновик	Сбор фактов, первичный анализ, заметки для себя
<REASONING>	Логический анализ	Цепочка рассуждений, проверка гипотез, выводы
<INNER_MONOLOGUE>	Внутренний диалог	Размышления о задаче, сомнения, выбор между вариантами
<PLAN>	Пошаговый план	Декомпозиция задачи, последовательность действий
<EXECUTION>	Действия	Вызов инструментов, выполнение шагов плана
<REFLECTION>	Самооценка	Проверка результата, поиск ошибок, оценка качества
<THINKING>	Глубокое размышление	Сложные задачи, требующие нескольких подходов
<SOLUTION>	Финальное решение	Итоговый ответ, готовый к выдаче пользователю

Полный пример с тегами

Рассмотрим, как Hermes 3 решает задачу с использованием всех тегов рассуждения. Обратите внимание: теги не видны пользователю, они используются внутри модели для структурирования мыслительного процесса.

xml

<!-- Задача: "Проанализируй трафик сайта и предложи 3 улучшения" -->

<SCRATCHPAD>
Дано:
- Сайт reymer.ai
- Нужен анализ трафика
- Нужно 3 конкретных улучшения

Доступные инструменты:
- analytics_api (Google Analytics / Yandex Metrika)
- search_console_api
- page_speed_api
</SCRATCHPAD>

<PLAN>
1. Получить данные по трафику за последний месяц
2. Сравнить с предыдущим периодом
3. Определить страницы с наибольшим падением
4. Проверить скорость загрузки проблемных страниц
5. Проанализировать поисковые запросы
6. Сформулировать 3 улучшения на основе данных
</PLAN>

<EXECUTION>
[Вызов analytics_api: получение трафика за 30 дней]
Результат: 45,000 визитов (-8% к прошлому месяцу)

[Вызов search_console_api: топ проблемных страниц]
Результат: /tools - падение позиций по 12 запросам

[Вызов page_speed_api: проверка /tools]
Результат: LCP 3.2s (плохо), CLS 0.05 (хорошо)
</EXECUTION>

<REASONING>
Трафик упал на 8%. Основная причина - падение позиций
страницы /tools по ключевым запросам. Скорость загрузки
этой страницы 3.2 секунды - выше порога Google (2.5s).
Это влияет на Core Web Vitals и, как следствие, на позиции.

Дополнительно: 12 запросов потеряли позиции, значит
проблема не в одном ключевом слове, а в общем качестве
страницы.
</REASONING>

<REFLECTION>
Проверяю: достаточно ли данных для 3 рекомендаций?
1. Скорость - да, есть конкретная метрика LCP
2. Контент - да, падение по 12 запросам
3. Нужна третья рекомендация - проверю мобильную версию

[Дополнительный вызов: mobile_check]
Мобильный трафик: 62% от общего, но bounce rate 15%
выше, чем desktop.
</REFLECTION>

<SOLUTION>
3 улучшения для сайта:

1. Оптимизация LCP страницы /tools (3.2s -> цель 2.0s)
   - Ленивая загрузка изображений ниже fold
   - Предзагрузка критического CSS

2. Обновление контента /tools (12 просевших запросов)
   - Добавить свежие данные о ценах
   - Расширить раздел сравнения инструментов

3. Улучшение мобильной версии (bounce rate +15%)
   - Упростить навигацию для мобильных
   - Увеличить размер кнопок до 48px
</SOLUTION>

Внешний CoT и встроенные теги

Chain-of-Thought (внешний промпт)

Промпт "Think step by step" добавляется извне. Работает на любой модели. Нестабильный результат - модель может проигнорировать. Расходует токены пользователя на рассуждения. Не встроен в обучение.

XML-теги Hermes 3 (встроены в веса)

Теги встроены в веса модели на этапе обучения. Модель обучена их использовать автоматически. Стабильная структура рассуждений. Каждый тег активирует определенный режим мышления. Рассуждения скрыты от пользователя.

Техническая деталь

NousResearch использовала зарезервированные, но неиспользуемые токены Llama 3.1 для создания XML-тегов. Это значит, что теги не конфликтуют с обычным текстом и распознаются моделью однозначно. Модель не притворяется, что думает - она действительно обучена структурированному рассуждению.

Когда теги наиболее полезны

Многошаговые задачи - планирование, декомпозиция, последовательное выполнение
Аналитические задачи - сбор данных, анализ, выводы, рекомендации
Задачи с неопределенностью - когда нужно рассмотреть несколько вариантов
Задачи с самопроверкой - когда результат нужно верифицировать перед выдачей
Творческие задачи - черновики, итерации, рефлексия над качеством

Главный вывод

XML-теги рассуждения - это не косметическое улучшение, а архитектурное решение. Hermes 3 не притворяется, что думает по вашему промпту - модель действительно обучена структурированному мышлению. Это дает более надежные результаты на сложных задачах по сравнению с обычным Chain-of-Thought.

Тест для самопроверки

Для чего используется тег SCRATCHPAD в Hermes 3?

Видео-введение к уроку

Структурированное мышление в Hermes 3

Восемь тегов рассуждения

Тег	Назначение	Когда используется
<SCRATCHPAD>	Свободные заметки, черновик	Сбор фактов, первичный анализ, заметки для себя
<REASONING>	Логический анализ	Цепочка рассуждений, проверка гипотез, выводы
<INNER_MONOLOGUE>	Внутренний диалог	Размышления о задаче, сомнения, выбор между вариантами
<PLAN>	Пошаговый план	Декомпозиция задачи, последовательность действий
<EXECUTION>	Действия	Вызов инструментов, выполнение шагов плана
<REFLECTION>	Самооценка	Проверка результата, поиск ошибок, оценка качества
<THINKING>	Глубокое размышление	Сложные задачи, требующие нескольких подходов
<SOLUTION>	Финальное решение	Итоговый ответ, готовый к выдаче пользователю

Полный пример с тегами

xml

<!-- Задача: "Проанализируй трафик сайта и предложи 3 улучшения" -->

<SCRATCHPAD>
Дано:
- Сайт reymer.ai
- Нужен анализ трафика
- Нужно 3 конкретных улучшения

Доступные инструменты:
- analytics_api (Google Analytics / Yandex Metrika)
- search_console_api
- page_speed_api
</SCRATCHPAD>

<PLAN>
1. Получить данные по трафику за последний месяц
2. Сравнить с предыдущим периодом
3. Определить страницы с наибольшим падением
4. Проверить скорость загрузки проблемных страниц
5. Проанализировать поисковые запросы
6. Сформулировать 3 улучшения на основе данных
</PLAN>

<EXECUTION>
[Вызов analytics_api: получение трафика за 30 дней]
Результат: 45,000 визитов (-8% к прошлому месяцу)

[Вызов search_console_api: топ проблемных страниц]
Результат: /tools - падение позиций по 12 запросам

[Вызов page_speed_api: проверка /tools]
Результат: LCP 3.2s (плохо), CLS 0.05 (хорошо)
</EXECUTION>

<REASONING>
Трафик упал на 8%. Основная причина - падение позиций
страницы /tools по ключевым запросам. Скорость загрузки
этой страницы 3.2 секунды - выше порога Google (2.5s).
Это влияет на Core Web Vitals и, как следствие, на позиции.

Дополнительно: 12 запросов потеряли позиции, значит
проблема не в одном ключевом слове, а в общем качестве
страницы.
</REASONING>

<REFLECTION>
Проверяю: достаточно ли данных для 3 рекомендаций?
1. Скорость - да, есть конкретная метрика LCP
2. Контент - да, падение по 12 запросам
3. Нужна третья рекомендация - проверю мобильную версию

[Дополнительный вызов: mobile_check]
Мобильный трафик: 62% от общего, но bounce rate 15%
выше, чем desktop.
</REFLECTION>

<SOLUTION>
3 улучшения для сайта:

1. Оптимизация LCP страницы /tools (3.2s -> цель 2.0s)
   - Ленивая загрузка изображений ниже fold
   - Предзагрузка критического CSS

2. Обновление контента /tools (12 просевших запросов)
   - Добавить свежие данные о ценах
   - Расширить раздел сравнения инструментов

3. Улучшение мобильной версии (bounce rate +15%)
   - Упростить навигацию для мобильных
   - Увеличить размер кнопок до 48px
</SOLUTION>

Внешний CoT и встроенные теги

Chain-of-Thought (внешний промпт)

XML-теги Hermes 3 (встроены в веса)

Техническая деталь

Когда теги наиболее полезны

Многошаговые задачи - планирование, декомпозиция, последовательное выполнение
Аналитические задачи - сбор данных, анализ, выводы, рекомендации
Задачи с неопределенностью - когда нужно рассмотреть несколько вариантов
Задачи с самопроверкой - когда результат нужно верифицировать перед выдачей
Творческие задачи - черновики, итерации, рефлексия над качеством

Главный вывод

Тест для самопроверки

Для чего используется тег SCRATCHPAD в Hermes 3?

Цели урока

Структурированное мышление в Hermes 3

Восемь тегов рассуждения

Полный пример с тегами

Внешний CoT и встроенные теги

Когда теги наиболее полезны

Вопросы для размышления

XML-теги рассуждения

Цели урока

Структурированное мышление в Hermes 3

Восемь тегов рассуждения

Полный пример с тегами

Внешний CoT и встроенные теги

Когда теги наиболее полезны

Вопросы для размышления