Google выпускает технологию для нанесения водяных знаков на текст, сгенерированный искусственным интеллектом

Google делает общедоступной технологию SynthID Text, которая позволяет разработчикам маркировать водяными знаками и обнаруживать текст, написанный с помощью генеративных моделей искусственного интеллекта.

Google

SynthID Text можно загрузить с платформы искусственного интеллекта Hugging Face и обновленного инструментария Responsible GenAI Toolkit от Google.

Мы открываем исходный код нашего инструмента для создания водяных знаков SynthID Text. Он будет доступен разработчикам и компаниям бесплатно и поможет им идентифицировать контент, созданный с помощью ИИ,

— написала компания в сообщении на X.

Так как же именно работает SynthID Text?

При наличии подсказки типа «Какой ваш любимый фрукт?» модели генерации текста предсказывают, какой «токен» вероятнее всего последует за другим — по одному токену за раз. Токены, которые могут быть одним символом или словом, являются строительными блоками, которые генеративная модель использует для обработки информации. Модель присваивает каждому возможному токену оценку, которая представляет собой процентную вероятность того, что он будет включен в выходной текст. SynthID Text вставляет дополнительную информацию в это распределение токенов, «модулируя вероятность генерации токенов», говорит Google.

Окончательный шаблон оценок для обоих вариантов слов модели в сочетании со скорректированными оценками вероятности считается водяным знаком. Этот шаблон оценок сравнивается с ожидаемым шаблоном оценок для текста с водяными знаками и без них, помогая SynthID определить, был ли текст сгенерирован инструментом ИИ или он мог быть получен из других источников.

Google утверждает, что технология SynthID Text, интегрированная в модели Gemini с этой весны, не снижает качество, точность или скорость генерации текста и работает даже с текстом, который был обрезан, перефразирован или изменен.

Однако компания также признает, что ее подход к использованию водяных знаков имеет ограничения.

Например, SynthID Text не так хорошо работает с коротким текстом, текстом, который был переписан или переведен с другого языка, или с ответами на фактические вопросы.

В ответах на фактические подсказки меньше возможностей скорректировать распределение токенов, не влияя на фактическую точность. Сюда входят такие подсказки, как «Какая столица Франции?», или запросы, где ожидается мало или вообще не ожидается никаких изменений, например «прочтите стихотворение Уильяма Вордсворта»,

— поясняет компания.