Суть
Исследовательское подразделение Microsoft представило Data Formulator 0.7 — открытую систему для анализа корпоративных данных на базе искусственного интеллекта. Платформа объединяет в едином рабочем пространстве инструменты подключения к базам данных, ИИ-агентов для исследования информации и средства детальной настройки визуализаций. Главная цель релиза — позволить аналитикам и профильным специалистам работать с разрозненными источниками данных без необходимости писать сложный SQL-код или скрипты на Python.
Контекст
Сегодня корпоративные команды все чаще полагаются на ИИ для аналитики, однако реальные рабочие процессы остаются сильно фрагментированными. Прежде чем приступить к анализу, специалистам необходимо настроить подключения, подготовить метаданные, разобраться с правами доступа и объединить информацию из разных хранилищ.
Традиционные чат-боты на базе больших языковых моделей (LLM) плохо справляются с такими задачами. Изолированные диалоговые окна не имеют постоянного доступа к корпоративным базам, не сохраняют историю сложных аналитических процессов и не позволяют гибко редактировать полученные графики. Аналитикам же постоянно требуется вычислять новые метрики, сравнивать различные способы группировки данных и проверять промежуточные результаты.
Figure 1. Data Connectors provide persistent connections between enterprise data sources and Data Formulator, allowing analysts and AI agents to load, query, and visualize shared data.
Детали
Data Formulator 0.7 предлагает три ключевых нововведения для решения этих проблем:
Во-первых, система Data Connectors. Она обеспечивает централизованное и повторно используемое подключение к базам данных, хранилищам, BI-системам, объектным хранилищам и локальным файлам. Это избавляет пользователей от необходимости каждый раз вручную загружать файлы и снижает нагрузку на платформенные команды.
Во-вторых, контекстно-зависимые ИИ-агенты. В отличие от простых текстовых генераторов, агенты в Data Formulator имеют доступ ко всему рабочему пространству: подключенным источникам, загруженным таблицам, предыдущим графикам и общей цели пользователя. Агент способен самостоятельно написать и выполнить код в изолированной среде, сгенерировать спецификации для диаграмм и объяснить свои шаги. Если запрос пользователя неоднозначен, ИИ задаст уточняющие вопросы перед началом работы.
В-третьих, интерактивное рабочее пространство. Оно состоит из «Нити данных» (Data Thread) — структурированного чата, сохраняющего каждый шаг, промежуточный вывод и график, — и интерактивного холста. Пользователи могут возвращаться к ранним этапам, создавать параллельные ветки анализа и напрямую редактировать визуализации, меняя цвета, подписи и макеты как вручную, так и с помощью текстовых команд.
Figure 2. (Left) Data Thread allows users to interact with AI agents by asking questions, requesting data visualizations, and exploring follow-up analyses. Threads preserve the history of long analysis sessions, making it possible to revisit, reuse, and build on earlier work. (Right) The interactive canvas allows users to refine visualizations directly by adjusting settings, redesigning charts, and inspecting the underlying data and code side by side.
Анализ
Этот релиз демонстрирует важный сдвиг в развитии корпоративного программного обеспечения. Индустрия переходит от концепции «ИИ как собеседник» к концепции «ИИ как полноправный участник рабочего процесса». Предоставляя моделям инструменты для выполнения реального кода и постоянный доступ к данным, Microsoft стирает границу между сложным инжинирингом данных и бизнес-аналитикой.
Открытый исходный код (open-source) проекта также играет важную роль. Это позволяет корпоративным командам не просто использовать готовый продукт, но и адаптировать архитектуру под свои специфические требования к безопасности и инфраструктуре.
Перспектива
Вероятно, в ближайшем будущем мы увидим стандартизацию подобных мультимодальных интерфейсов в аналитике. Системы, где естественный язык, программный код и визуальный редактор существуют в едином контексте, станут нормой для работы с корпоративной информацией. Время покажет, насколько легко крупные компании смогут интегрировать подобные решения в свои унаследованные системы, но направление движения индустрии в сторону автономных аналитических ИИ-агентов уже очевидно.