Установка Hermes Agent

Видео-введение к уроку

Три способа установки

Hermes Agent можно установить тремя способами: через Docker (рекомендуется), из исходников или через Desktop App. Docker - самый простой и надежный вариант: все зависимости уже собраны в контейнер.

Системные требования

Компонент	Минимум (API-режим)	Рекомендуемый (локальная модель)	Оптимальный (Hermes 4.3 36B)
ОС	Linux, macOS, Windows (WSL2)	Linux, macOS	Linux
ОЗУ	4 ГБ	16 ГБ	64 ГБ
GPU	Не требуется	8 ГБ VRAM (RTX 3070)	24+ ГБ VRAM (RTX 4090, A100)
Диск	2 ГБ	20 ГБ	80 ГБ
Docker	v20+	v24+ с NVIDIA Container Toolkit	v24+ с NVIDIA Container Toolkit
Python	3.10+	3.10+	3.10+

Способ 1: Docker (рекомендуется)

Docker - самый простой способ начать. Все зависимости, модели и конфигурации уже собраны в контейнер. Четыре команды - и агент работает.

Клонируйте репозиторий: git clone https://github.com/NousResearch/hermes-agent.git

Перейдите в директорию: cd hermes-agent

Создайте файл конфигурации: cp .env.example .env

Добавьте API-ключ в .env (или настройте локальную модель)

Запустите контейнер: docker compose up -d

bash

# Клонируем репозиторий
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent

# Создаем конфигурацию
cp .env.example .env

# Редактируем .env - добавляем API-ключ
# (или оставляем пустым для локальной модели)
nano .env

bash

# Файл .env - базовая конфигурация

# Выбор модели (одно из):
HERMES_MODEL=hermes-4.3          # Локальная модель (нужен GPU 24GB+)
# OPENAI_API_KEY=sk-...           # Или используйте OpenAI API
# ANTHROPIC_API_KEY=sk-ant-...    # Или Anthropic API

# Основные настройки
HERMES_MEMORY_DIR=./data/memory
HERMES_LOG_LEVEL=info
HERMES_MAX_STEPS=50

# Telegram (опционально)
# TELEGRAM_BOT_TOKEN=123456:ABC-DEF...
# TELEGRAM_ALLOWED_USERS=user_id_1,user_id_2

bash

# Запускаем контейнер
docker compose up -d

# Проверяем статус
docker compose ps

# Смотрим логи
docker compose logs -f hermes-agent

# Первый запрос к агенту
docker compose exec hermes-agent hermes chat "Привет! Расскажи о себе"

Способ 2: Из исходников

Установка из исходников дает больше контроля, но требует ручной настройки зависимостей. Подходит для разработчиков, которые планируют модифицировать код агента.

bash

# Клонируем и устанавливаем зависимости
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
python -m venv .venv
source .venv/bin/activate
pip install -e ".[all]"

# Настраиваем конфигурацию
cp .env.example .env
nano .env

# Запускаем
hermes serve  # Сервер с API
# или
hermes chat   # Интерактивный чат

Способ 3: Desktop App

Desktop App - графическое приложение для macOS, Windows и Linux. Самый простой способ для нетехнических пользователей: скачиваете установщик, запускаете, вводите API-ключ и начинаете работать.

Локальный запуск через Ollama и vLLM

Hermes Agent не привязан к одной модели. Его можно запустить на любом OpenAI-совместимом API - включая локальные серверы Ollama, vLLM, llama.cpp или LM Studio. Это позволяет использовать квантизованные версии для слабого железа.

Модель	Размер (GGUF)	VRAM	Подходящий GPU	Качество
Hermes 4.3 36B (FP16)	72 ГБ	80 ГБ	A100 80GB, 2x RTX 4090	Максимальное
Hermes 4.3 36B (Q8)	36 ГБ	40 ГБ	A100 40GB, RTX A6000	Отличное
Hermes 4.3 36B (Q4_K_M)	20 ГБ	24 ГБ	RTX 4090, RTX 3090	Хорошее
Hermes 3.5 8B (Q8)	8 ГБ	10 ГБ	RTX 3070, RTX 4060	Приемлемое
Hermes 3.5 8B (Q4_K_M)	4.5 ГБ	6 ГБ	RTX 3060, Apple M1	Базовое

bash

# Вариант 1: Ollama (самый простой для локального запуска)
ollama pull hermes3.5:8b-q4_K_M     # Скачать модель 4.5 ГБ
ollama serve                          # Запустить сервер

# В .env Hermes Agent:
HERMES_MODEL=hermes-3.5
OPENAI_API_BASE=http://localhost:11434/v1
OPENAI_API_KEY=ollama                 # Любое значение

# Вариант 2: vLLM (для продакшна, быстрее Ollama)
pip install vllm
vllm serve NousResearch/Hermes-3-Llama-3.1-8B \
  --quantization awq --max-model-len 8192

# В .env:
OPENAI_API_BASE=http://localhost:8000/v1
OPENAI_API_KEY=vllm

Мульти-модельные профили

Hermes Agent поддерживает профили моделей - можно переключаться между провайдерами или использовать разные модели для разных задач. Например, быструю 8B модель для рутинных задач и мощную 36B для сложного анализа.

yaml

# config/models.yaml - профили моделей
profiles:
  local-fast:
    provider: ollama
    model: hermes3.5:8b-q4_K_M
    endpoint: http://localhost:11434/v1
    use_for: [chat, simple_tasks]

  local-powerful:
    provider: vllm
    model: NousResearch/Hermes-4.3-36B-AWQ
    endpoint: http://localhost:8000/v1
    use_for: [analysis, code_review, planning]

  cloud-codex:
    provider: openai-compatible
    model: codex-mini-latest
    endpoint: https://api.openai.com/v1
    api_key: ${OPENAI_API_KEY}
    use_for: [coding]

  cloud-glm:
    provider: openai-compatible
    model: glm-4-plus
    endpoint: https://open.bigmodel.cn/api/paas/v4
    api_key: ${GLM_API_KEY}
    use_for: [chinese_content]

default: local-fast
routing: auto    # Агент сам выбирает профиль по задаче

Любой OpenAI-совместимый API работает как бэкенд для Hermes Agent: OpenAI, Anthropic (через прокси), Together AI, Groq, Fireworks, DeepSeek, GLM, локальные Ollama/vLLM/LM Studio. Достаточно указать endpoint и API-ключ.

Для запуска Hermes 4.3 (36B параметров) локально требуется GPU с 24+ ГБ видеопамяти. Но квантизованная версия 8B модели работает даже на RTX 3060 или Apple M1 с 16 ГБ RAM. Начните с малого и масштабируйте по мере необходимости.

Главный вывод

Docker - рекомендуемый способ установки. Для модели: начните с API-режима (NousResearch API, OpenAI, Anthropic) или Ollama с 8B моделью. Hermes Agent работает с любым OpenAI-совместимым API - от локального Ollama до облачного Codex или GLM. Мульти-модельные профили позволяют автоматически выбирать модель под задачу.

Тест для самопроверки

Какой способ установки Hermes Agent рекомендуется для начинающих?

Видео-введение к уроку

Три способа установки

Системные требования

Компонент	Минимум (API-режим)	Рекомендуемый (локальная модель)	Оптимальный (Hermes 4.3 36B)
ОС	Linux, macOS, Windows (WSL2)	Linux, macOS	Linux
ОЗУ	4 ГБ	16 ГБ	64 ГБ
GPU	Не требуется	8 ГБ VRAM (RTX 3070)	24+ ГБ VRAM (RTX 4090, A100)
Диск	2 ГБ	20 ГБ	80 ГБ
Docker	v20+	v24+ с NVIDIA Container Toolkit	v24+ с NVIDIA Container Toolkit
Python	3.10+	3.10+	3.10+

Способ 1: Docker (рекомендуется)

Клонируйте репозиторий: git clone https://github.com/NousResearch/hermes-agent.git

Перейдите в директорию: cd hermes-agent

Создайте файл конфигурации: cp .env.example .env

Добавьте API-ключ в .env (или настройте локальную модель)

Запустите контейнер: docker compose up -d

bash

# Клонируем репозиторий
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent

# Создаем конфигурацию
cp .env.example .env

# Редактируем .env - добавляем API-ключ
# (или оставляем пустым для локальной модели)
nano .env

bash

# Файл .env - базовая конфигурация

# Выбор модели (одно из):
HERMES_MODEL=hermes-4.3          # Локальная модель (нужен GPU 24GB+)
# OPENAI_API_KEY=sk-...           # Или используйте OpenAI API
# ANTHROPIC_API_KEY=sk-ant-...    # Или Anthropic API

# Основные настройки
HERMES_MEMORY_DIR=./data/memory
HERMES_LOG_LEVEL=info
HERMES_MAX_STEPS=50

# Telegram (опционально)
# TELEGRAM_BOT_TOKEN=123456:ABC-DEF...
# TELEGRAM_ALLOWED_USERS=user_id_1,user_id_2

bash

# Запускаем контейнер
docker compose up -d

# Проверяем статус
docker compose ps

# Смотрим логи
docker compose logs -f hermes-agent

# Первый запрос к агенту
docker compose exec hermes-agent hermes chat "Привет! Расскажи о себе"

Способ 2: Из исходников

bash

# Клонируем и устанавливаем зависимости
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
python -m venv .venv
source .venv/bin/activate
pip install -e ".[all]"

# Настраиваем конфигурацию
cp .env.example .env
nano .env

# Запускаем
hermes serve  # Сервер с API
# или
hermes chat   # Интерактивный чат

Способ 3: Desktop App

Локальный запуск через Ollama и vLLM

Модель	Размер (GGUF)	VRAM	Подходящий GPU	Качество
Hermes 4.3 36B (FP16)	72 ГБ	80 ГБ	A100 80GB, 2x RTX 4090	Максимальное
Hermes 4.3 36B (Q8)	36 ГБ	40 ГБ	A100 40GB, RTX A6000	Отличное
Hermes 4.3 36B (Q4_K_M)	20 ГБ	24 ГБ	RTX 4090, RTX 3090	Хорошее
Hermes 3.5 8B (Q8)	8 ГБ	10 ГБ	RTX 3070, RTX 4060	Приемлемое
Hermes 3.5 8B (Q4_K_M)	4.5 ГБ	6 ГБ	RTX 3060, Apple M1	Базовое

bash

# Вариант 1: Ollama (самый простой для локального запуска)
ollama pull hermes3.5:8b-q4_K_M     # Скачать модель 4.5 ГБ
ollama serve                          # Запустить сервер

# В .env Hermes Agent:
HERMES_MODEL=hermes-3.5
OPENAI_API_BASE=http://localhost:11434/v1
OPENAI_API_KEY=ollama                 # Любое значение

# Вариант 2: vLLM (для продакшна, быстрее Ollama)
pip install vllm
vllm serve NousResearch/Hermes-3-Llama-3.1-8B \
  --quantization awq --max-model-len 8192

# В .env:
OPENAI_API_BASE=http://localhost:8000/v1
OPENAI_API_KEY=vllm

Мульти-модельные профили

yaml

# config/models.yaml - профили моделей
profiles:
  local-fast:
    provider: ollama
    model: hermes3.5:8b-q4_K_M
    endpoint: http://localhost:11434/v1
    use_for: [chat, simple_tasks]

  local-powerful:
    provider: vllm
    model: NousResearch/Hermes-4.3-36B-AWQ
    endpoint: http://localhost:8000/v1
    use_for: [analysis, code_review, planning]

  cloud-codex:
    provider: openai-compatible
    model: codex-mini-latest
    endpoint: https://api.openai.com/v1
    api_key: ${OPENAI_API_KEY}
    use_for: [coding]

  cloud-glm:
    provider: openai-compatible
    model: glm-4-plus
    endpoint: https://open.bigmodel.cn/api/paas/v4
    api_key: ${GLM_API_KEY}
    use_for: [chinese_content]

default: local-fast
routing: auto    # Агент сам выбирает профиль по задаче

Главный вывод

Тест для самопроверки

Какой способ установки Hermes Agent рекомендуется для начинающих?

Цели урока

Три способа установки

Системные требования

Способ 1: Docker (рекомендуется)

Способ 2: Из исходников

Способ 3: Desktop App

Локальный запуск через Ollama и vLLM

Мульти-модельные профили

Вопросы для размышления

Установка Hermes Agent

Цели урока

Три способа установки

Системные требования

Способ 1: Docker (рекомендуется)

Способ 2: Из исходников

Способ 3: Desktop App

Локальный запуск через Ollama и vLLM

Мульти-модельные профили

Вопросы для размышления