Суть
Инженеры AWS представили руководство по созданию Chaplin (Customer Health and Planned Lifecycle Intelligence Nexus). Это решение с открытым исходным кодом, которое переводит анализ событий здоровья облачной инфраструктуры в формат самообслуживания. Используя ИИ-агентов на базе Amazon Bedrock и протокол контекста модели (Model Context Protocol, MCP), команды эксплуатации могут задавать вопросы о состоянии систем на естественном языке и получать точные ответы без задержек.
Контекст
Крупные компании управляют десятками и сотнями аккаунтов в облаке. Каждое утро операционные команды сталкиваются с потоком разрозненных уведомлений: устаревание версий баз данных, вывод из эксплуатации серверов, критические обновления безопасности.
Традиционно анализ этих данных требует ручной сортировки или ожидания ответа от технических менеджеров (TAM). Стандартные панели мониторинга с жестко заданной структурой не всегда могут ответить на специфические запросы в моменте. Это приводит к тому, что высококвалифицированные инженеры тратят время на реактивное тушение пожаров, а не на плановую архитектурную работу.
Детали
Chaplin решает фундаментальную проблему корпоративного искусственного интеллекта: эффективное объединение структурированных и неструктурированных данных.
Chaplin architecture showing three-layer system with multi-account data collection, AI-powered MCP server with Amazon Bedrock agents, and MCP client integration
Обычные системы генерации с дополненной выборкой (RAG) плохо справляются с точными вычислениями. Векторный поиск находит семантически похожие документы, но не гарантирует математической точности. Если попросить классическую RAG-систему посчитать количество уязвимых серверов, она может выдать случайное число. Chaplin обходит эту проблему через многоагентную архитектуру:
- Агент перевода естественного языка в структурированный запрос. Он понимает схему базы данных и превращает вопрос пользователя в точный фильтр. В результате подсчет событий происходит детерминированно, на уровне базы данных, а не языковой модели.
- Агент контекстного анализа. Обрабатывает неструктурированные текстовые описания проблем и сопоставляет их с бизнес-метаданными компании (например, тегами производственной среды).
- Механизм классификации на основе правил. Фильтрует и категоризирует рутинные события без обращения к большим языковым моделям (LLM), что существенно снижает затраты на логический вывод (инференс).
Технически система состоит из трех уровней: сбор данных через AWS EventBridge в централизованное хранилище (Amazon DynamoDB), промежуточный слой интеллекта (MCP-сервер) и клиентский уровень (любой ИИ-ассистент с поддержкой MCP).
Анализ
Использование стандарта MCP — ключевой фактор успеха этой архитектуры. Протокол позволяет подключать аналитику AWS напрямую к рабочим инструментам разработчиков. Команды могут получать информацию из AWS Health прямо в своем ИИ-ассистенте, комбинируя ее с данными из других систем, таких как сервисы управления задачами (Jira) или репозитории кода.
Разделение детерминированных задач (прямой запрос к базе) и вероятностных (анализ текста моделью) показывает зрелый подход к проектированию корпоративных ИИ-систем. Это архитектурный шаблон, который можно применять не только для облачной инфраструктуры, но и для финансовой или медицинской аналитики, где цена ошибки (галлюцинации) слишком высока.
Перспектива