XML-теги рассуждения
Цели урока
После прохождения этого урока вы сможете:
- 1Изучить 8 XML-тегов рассуждения, встроенных в веса Hermes 3
- 2Понять разницу между внешним Chain-of-Thought и встроенными тегами
- 3Научиться использовать теги для структурированного мышления агента
Структурированное мышление в Hermes 3
Hermes 3 - первая open-source модель, в которую XML-теги рассуждения были встроены непосредственно в веса нейросети на этапе обучения. Это не просто промпт-инженерия ("думай шаг за шагом"), а архитектурное решение. NousResearch использовала зарезервированные токены Llama 3.1 для создания 8 специальных тегов, каждый из которых активирует определенный режим обработки информации.

Восемь тегов рассуждения
| Тег | Назначение | Когда используется |
|---|---|---|
| <SCRATCHPAD> | Свободные заметки, черновик | Сбор фактов, первичный анализ, заметки для себя |
| <REASONING> | Логический анализ | Цепочка рассуждений, проверка гипотез, выводы |
| <INNER_MONOLOGUE> | Внутренний диалог | Размышления о задаче, сомнения, выбор между вариантами |
| <PLAN> | Пошаговый план | Декомпозиция задачи, последовательность действий |
| <EXECUTION> | Действия | Вызов инструментов, выполнение шагов плана |
| <REFLECTION> | Самооценка | Проверка результата, поиск ошибок, оценка качества |
| <THINKING> | Глубокое размышление | Сложные задачи, требующие нескольких подходов |
| <SOLUTION> | Финальное решение | Итоговый ответ, готовый к выдаче пользователю |
Полный пример с тегами
Рассмотрим, как Hermes 3 решает задачу с использованием всех тегов рассуждения. Обратите внимание: теги не видны пользователю, они используются внутри модели для структурирования мыслительного процесса.
<!-- Задача: "Проанализируй трафик сайта и предложи 3 улучшения" -->
<SCRATCHPAD>
Дано:
- Сайт reymer.ai
- Нужен анализ трафика
- Нужно 3 конкретных улучшения
Доступные инструменты:
- analytics_api (Google Analytics / Yandex Metrika)
- search_console_api
- page_speed_api
</SCRATCHPAD>
<PLAN>
1. Получить данные по трафику за последний месяц
2. Сравнить с предыдущим периодом
3. Определить страницы с наибольшим падением
4. Проверить скорость загрузки проблемных страниц
5. Проанализировать поисковые запросы
6. Сформулировать 3 улучшения на основе данных
</PLAN>
<EXECUTION>
[Вызов analytics_api: получение трафика за 30 дней]
Результат: 45,000 визитов (-8% к прошлому месяцу)
[Вызов search_console_api: топ проблемных страниц]
Результат: /tools - падение позиций по 12 запросам
[Вызов page_speed_api: проверка /tools]
Результат: LCP 3.2s (плохо), CLS 0.05 (хорошо)
</EXECUTION>
<REASONING>
Трафик упал на 8%. Основная причина - падение позиций
страницы /tools по ключевым запросам. Скорость загрузки
этой страницы 3.2 секунды - выше порога Google (2.5s).
Это влияет на Core Web Vitals и, как следствие, на позиции.
Дополнительно: 12 запросов потеряли позиции, значит
проблема не в одном ключевом слове, а в общем качестве
страницы.
</REASONING>
<REFLECTION>
Проверяю: достаточно ли данных для 3 рекомендаций?
1. Скорость - да, есть конкретная метрика LCP
2. Контент - да, падение по 12 запросам
3. Нужна третья рекомендация - проверю мобильную версию
[Дополнительный вызов: mobile_check]
Мобильный трафик: 62% от общего, но bounce rate 15%
выше, чем desktop.
</REFLECTION>
<SOLUTION>
3 улучшения для сайта:
1. Оптимизация LCP страницы /tools (3.2s -> цель 2.0s)
- Ленивая загрузка изображений ниже fold
- Предзагрузка критического CSS
2. Обновление контента /tools (12 просевших запросов)
- Добавить свежие данные о ценах
- Расширить раздел сравнения инструментов
3. Улучшение мобильной версии (bounce rate +15%)
- Упростить навигацию для мобильных
- Увеличить размер кнопок до 48px
</SOLUTION>Внешний CoT и встроенные теги
NousResearch использовала зарезервированные, но неиспользуемые токены Llama 3.1 для создания XML-тегов. Это значит, что теги не конфликтуют с обычным текстом и распознаются моделью однозначно. Модель не притворяется, что думает - она действительно обучена структурированному рассуждению.
Когда теги наиболее полезны
- Многошаговые задачи - планирование, декомпозиция, последовательное выполнение
- Аналитические задачи - сбор данных, анализ, выводы, рекомендации
- Задачи с неопределенностью - когда нужно рассмотреть несколько вариантов
- Задачи с самопроверкой - когда результат нужно верифицировать перед выдачей
- Творческие задачи - черновики, итерации, рефлексия над качеством
XML-теги рассуждения - это не косметическое улучшение, а архитектурное решение. Hermes 3 не притворяется, что думает по вашему промпту - модель действительно обучена структурированному мышлению. Это дает более надежные результаты на сложных задачах по сравнению с обычным Chain-of-Thought.
Вопросы для размышления
- •Какие теги показались вам наиболее полезными для ваших задач?
- •В каких ситуациях структурированное рассуждение дало бы лучший результат, чем простой ответ?
