SynthID может маркировать водяными знаками контент, созданный ИИ, в различных модальностях, таких как текст, изображения, аудио и видео.
Реклама <стр>Google DeepMind в среду открыла исходный код новой технологии водяных знаков для текста, сгенерированного ИИ. Названный SynthID, инструмент водяных знаков искусственного интеллекта (ИИ) может использоваться в различных модальностях, включая текст, изображения, видео и аудио. Однако в настоящее время он предлагает инструмент водяных знаков для текста только предприятиям и разработчикам. Компания стремится к более широкому внедрению инструмента, чтобы контент, сгенерированный ИИ, можно было легко обнаружить. Частные лица и предприятия могут получить доступ к инструменту через обновленный Responsible Generative AI Toolkit технологического гиганта из Маунтин-Вью.
Технология водяных знаков AI для текста с открытым исходным кодом Google DeepMind
В сообщении на X (ранее известном как Twitter) официальный хэндл Google DeepMind объявил о том, что делает возможность маркировки текста SynthID бесплатным доступом для разработчиков и предприятий. Помимо Responsible GenAI Toolkit, его также можно загрузить из списка Hugging Face от Google.
Сгенерированный ИИ текст уже начал заполнять Интернет. Лаборатория ИИ Amazon Web Services опубликовала в начале этого года исследование, в котором утверждалось, что до 57,1 процента всех предложений в Интернете, переведенных на два или более языков, могут быть сгенерированы с использованием инструментов ИИ.
Хотя чат-боты ИИ, заполняющие Интернет бессмысленным текстом, сгенерированным ИИ, могут показаться безобидным спамом, у этого есть и темная сторона. В руках злоумышленников инструменты ИИ могут использоваться для массового создания дезинформации или вводящего в заблуждение контента. Поскольку значительная часть социального дискурса происходит в Интернете, такие действия могут повлиять на реальные события, такие как выборы, и использоваться для создания пропаганды против публичных лиц.
Из всех модальностей оценка текста, сгенерированного ИИ, оказалась самой сложной задачей на сегодняшний день. Во многом это связано с тем, что нанесение водяных знаков на слова невозможно, и даже если бы это было возможно, злоумышленники всегда могли бы перефразировать контент, используя второй цикл вывода.
Однако SynthID от Google DeepMind использует новый способ нанесения водяных знаков на текст, сгенерированный ИИ. Инструмент использует машинное обучение для прогнозирования слов, которые могут появиться после определенного слова в предложении. Например, рассмотрим предложение «Джон чувствовал себя очень уставшим после работы в течение всего дня». Здесь только ограниченное количество слов может появиться после слова «extremely».
Основываясь на анализе стилей генерации контента различных моделей ИИ, SynthID может предсказать слово, которое появится после «extremely», и заменить его другим синонимом, который есть в его базе данных. Инструмент водяных знаков будет встраивать такие слова во весь фрагмент контента. Позже, когда инструмент проверяет контент, сгенерированный ИИ, он ищет количество таких слов, чтобы определить его подлинность.
- Мероприятие Realme «Темная лошадка ИИ» состоится в этот день
Примечательно, что для изображений и видео SynthID добавляет водяной знак непосредственно в пиксели кадров, чтобы они оставались невидимыми, но все равно могли быть обнаружены в инструменте. Для аудио звуковые волны сначала преобразуются в спектрограф, а водяной знак добавляется к этим визуальным данным. Эти возможности в настоящее время недоступны никому за пределами Google.