Synthetic Data
Определение
Синтетические данные — искусственно сгенерированные данные, имитирующие реальные, используемые для обучения AI при недостатке или конфиденциальности реальных данных.
Простое объяснение
Это когда AI создаёт «придуманные» данные, которые выглядят как настоящие, для обучения других AI.
Подробнее
Применение синтетических данных:
- Приватность — замена персональных данных
- Редкие случаи — генерация edge cases
- Балансировка — выравнивание классов
- Разметка — автоматическая аннотация
Генераторы: NVIDIA Omniverse, Mostly AI, Gretel.
Связанные термины
База знаний
База знаний — структурированное хранилище информации, используемое AI-системами для поиска фактов и контекста при генерации ответов.
Named Entity Recognition
Named Entity Recognition (NER) — извлечение из текста именованных сущностей: людей, организаций, мест, дат, сумм и других.
Object Detection
Object Detection — задача компьютерного зрения: найти объекты на изображении и определить их классы и положение.
Recommendation System
Recommendation System — алгоритм, предсказывающий предпочтения пользователя и предлагающий релевантный контент или продукты.
