Google випускає технологію нанесення водяних знаків на текст, згенерований штучним інтелектом

Google робить загальнодоступною технологію SynthID Text, яка дозволяє розробникам маркувати водяними знаками та виявляти текст, написаний за допомогою генеративних моделей штучного інтелекту.

Google

SynthID Text можна завантажити з платформи штучного інтелекту Hugging Face та оновленого інструментарію Responsible GenAI Toolkit від Google.

Ми відкриваємо вихідний код нашого інструменту для створення водяних знаків SynthID Text. Він буде доступний розробникам та компаніям безкоштовно і допоможе їм ідентифікувати контент, створений за допомогою ШІ,

— написала компанія в повідомленні на X.

То як саме працює SynthID Text?

За наявності підказки типу «Який ваш улюблений фрукт?» моделі генерації тексту пророкують, який «токен» найімовірніше піде за іншим — по одному токену за раз. Токени, які можуть бути одним символом або словом, є будівельними блоками, які використовує генеративна модель для обробки інформації. Модель надає кожному можливому токену оцінку, яка є процентною ймовірністю того, що він буде включений у вихідний текст. SynthID Text вставляє додаткову інформацію до цього розподілу токенів, «модулюючи ймовірність генерації токенів», говорить Google.

Остаточний шаблон оцінок для обох варіантів слів моделі в поєднанні зі скоригованими оцінками ймовірності вважається водяним знаком. Цей шаблон оцінок порівнюється з очікуваним шаблоном оцінок для тексту з водяними знаками і без них, допомагаючи SynthID визначити, чи був текст згенерований інструментом ШІ або він міг бути отриманий з інших джерел,

— написала компанія в повідомленні в блозі.

Google стверджує, що технологія SynthID Text, що інтегрована в моделі Gemini цієї весни, не знижує якість, точність або швидкість генерації тексту і працює навіть з текстом, який був обрізаний, перефразований або змінений.

Проте компанія визнає, що її підхід до використання водяних знаків має обмеження.

Наприклад, SynthID Text не так добре працює з коротким текстом, текстом, який був переписаний або перекладений іншою мовою, або з відповідями на фактичні запитання.

У відповідях на фактичні підказки менше можливостей скоригувати розподіл токенів, не впливаючи на фактичну точність. Сюди входять такі підказки, як “Яка столиця Франції?”, або запити, де очікується мало або взагалі не очікується жодних змін, наприклад “прочитайте вірш Вільяма Вордсворта”,

— пояснює компанія.