SyGra Studio: Визуальный подход к генерации синтетических данных от ServiceNow
ServiceNow представила SyGra Studio — визуальную среду, которая превращает создание синтетических данных из написания кода в наглядный процесс конструирования потоков.

Суть события
Подразделение ServiceNow-AI выпустило обновление для своей платформы SyGra (версия 2.0.0), представив новый инструмент — SyGra Studio. Это интерактивная среда, предназначенная для генерации синтетических данных. Главное изменение заключается в смене парадигмы работы: вместо ручного редактирования конфигурационных файлов (YAML) и запуска скриптов через терминал, инженеры теперь могут проектировать потоки данных визуально на «холсте» (canvas).
Этот релиз важен, так как он снижает технический порог входа для создания качественных датасетов. Генерация синтетических данных становится прозрачным инженерным процессом с возможностью предварительного просмотра и отладки в реальном времени.
Контекст
Синтетические данные играют ключевую роль в современном обучении больших языковых моделей (LLM). Они необходимы, когда реальных данных недостаточно, они слишком дороги для разметки или содержат конфиденциальную информацию. Традиционно создание конвейеров (pipelines) для генерации такой синтетики требовало написания сложного кода для связки различных моделей, промптов и источников данных.
SyGra Studio решает эту проблему, предлагая подход Low-code. Это напоминает эволюцию инструментов для обработки данных (ETL), которые со временем перешли от написания скриптов к визуальным интерфейсам. Инструмент работает поверх существующей платформы SyGra, поэтому все действия в визуальном редакторе автоматически конвертируются в совместимые конфигурации графов и скрипты исполнения.
Детальный разбор возможностей
Studio предлагает полный цикл работы с данными в одном окне. Рассмотрим ключевые этапы работы, которые предлагает инструмент:
1. Настройка источников данных Процесс начинается с выбора коннектора. Это может быть репозиторий на Hugging Face, локальная файловая система или данные из ServiceNow. Инженер загружает параметры, и система сразу позволяет просмотреть примеры строк. Названия колонок автоматически превращаются в переменные состояния (например, , ), которые можно использовать дальше по цепочке.



