Как OpenAI решает проблему маркировки ИИ-контента: C2PA, SynthID и новый инструмент проверки
OpenAI представила комплексный подход к определению происхождения ИИ-контента, объединив стандарты метаданных и невидимые водяные знаки от Google.
OpenAI представила комплексный подход к определению происхождения ИИ-контента, объединив стандарты метаданных и невидимые водяные знаки от Google.
3 мин

Проблема идентификации контента, созданного искусственным интеллектом, становится все более острой. По мере того как нейросети интегрируются в повседневные рабочие процессы, пользователям, платформам и журналистам необходимы надежные инструменты для понимания происхождения медиафайлов. OpenAI анонсировала переход к многоуровневой системе маркировки контента, которая призвана сделать этот процесс более прозрачным и устойчивым к манипуляциям.
Суть обновления заключается в комбинации трех элементов: интеграции открытого стандарта метаданных C2PA, использовании технологии невидимых водяных знаков SynthID от Google и запуске публичного инструмента для проверки изображений. Это важный шаг от разрозненных попыток маркировки к созданию единой экосистемы доверия.
Исторически сложилось так, что маркировка ИИ-контента опиралась преимущественно на метаданные. OpenAI участвует в разработке стандартов происхождения с 2024 года, добавляя так называемые учетные данные контента (Content Credentials) к изображениям из DALL-E 3, а затем в ImageGen и Sora. Теперь компания получила статус продукта, полностью соответствующего требованиям C2PA (Coalition for Content Provenance and Authenticity).

Diagram comparing two image provenance signals: C2PA adds signed metadata that can be validated to confirm a trusted OpenAI issuer, while SynthID embeds a pixel-level signal that can be detected to indicate whether an image was encoded by OpenAI.
Стандарт C2PA использует криптографические подписи, чтобы информация о происхождении файла (кто его создал, как он редактировался) надежно путешествовала вместе с самим контентом. Это позволяет платформам корректно считывать и передавать эти данные дальше. Однако у метаданных есть существенный недостаток: они уязвимы. Их легко удалить намеренно, они часто теряются при загрузке на некоторые социальные платформы, при изменении формата файла, обрезке или просто при создании скриншота.
Чтобы решить проблему хрупкости метаданных, OpenAI внедряет второй уровень защиты — технологию SynthID, разработанную Google DeepMind. Начиная с изображений, сгенерированных через ChatGPT, Codex или API компании, в файлы будет встраиваться невидимый водяной знак.
SynthID работает на уровне пикселей, изменяя их таким образом, что это остается незаметным для человеческого глаза, но легко считывается специальными алгоритмами. Главное преимущество этого метода — долговечность. В отличие от метаданных, водяной знак SynthID с высокой вероятностью сохраняется даже после того, как изображение было сжато, изменено в размере или заскриншочено. Таким образом, две технологии дополняют друг друга: C2PA несет подробный контекст, а SynthID сохраняет базовый сигнал о происхождении, если метаданные были утеряны.

OpenAI webpage showing a verification result for an uploaded image, confirming it was generated with OpenAI tools based on detected SynthID and Content Credentials signals.
Третьим элементом стратегии стал запуск предварительной версии публичного инструмента для проверки контента. Пользователи могут загрузить изображение, а система проанализирует его на наличие сигналов C2PA и SynthID. На данный момент инструмент способен определять только контент, созданный инструментами OpenAI.
Важно отметить, что компания придерживается осторожного подхода. Ни один метод обнаружения не является абсолютно надежным. Если инструмент не находит метаданных или водяных знаков, он не делает окончательного вывода о том, что изображение создано человеком, поскольку сигналы происхождения могли быть намеренно или случайно удалены.
В перспективе OpenAI планирует расширить возможности своего инструмента проверки, поддержав межотраслевые инициативы. Цель состоит в том, чтобы пользователи могли проверять контент, созданный на любых платформах, а не только в экосистеме одной компании. Использование технологии прямого конкурента (Google) для обеспечения безопасности показывает, что индустрия начинает осознавать: проблема доверия к информации требует совместных усилий и открытых стандартов, а не закрытых корпоративных решений.
OpenAI переходит к многоуровневой защите контента, комбинируя метаданные с устойчивыми водяными знаками, чтобы упростить и сделать более надежной идентификацию ИИ-генераций.
Использование технологии конкурента (Google SynthID) компанией OpenAI указывает на то, что проблема доверия к цифровому контенту становится важнее традиционного корпоративного соперничества.