Ютубер F4mi нашла интересный способ борьбы с ИИ-инструментами, которые используются для кражи чужого контента. Она использует субтитры в формате .ass, наполняя субтитры к своим видео мусором, который невидим для людей, но сбивает с толку ИИ.
В последнее время на YouTube стало появляться все больше каналов, производство контента для которых полностью автоматизировано с помощью ИИ-инструментов. На таких каналах ИИ создает всё: от сценариев и закадрового голоса до изображений и музыки.
Из-за этого в сети стало появляться все больше жалоб от ютуберов (1, 2, 3), которые говорят, что такие безликие каналы воруют встроенные в ролики транскрипты, пропускают их через ИИ-суммаризаторы и быстро генерируют собственные подделки. Именно с этим явлением и борется F4mi.
F4mi рассказывает, что стремится отравить все ИИ-суммаризаторы, которые пытались украсть ее контент. Ключевым моментом ее метода стало использование формата субтитров .ass, созданного несколько десятилетий назад. В отличие от более простых форматов, .ass поддерживает такие функции, как разные шрифты, цвета, позиционирование, жирный шрифт, курсив, подчеркивание и многое другое.
Это позволяет F4mi скрывать в транскриптах к своим роликам мусор, который сбивает с толку ИИ, но незаметен для людей. Так, в дополнение к каждому фрагменту реального текста F4mi вставляет в файл субтитров «два фрагмента текста за пределами границ, используя функцию позиционирования в формате .ass». Причем размер и прозрачность текста установлены на ноль, то есть он невидим для людей.
В «невидимые» субтитры F4mi вставляет текст из произведений, являющихся общественным достоянием (при этом некоторые слова она заменяет синонимами, чтобы избежать обнаружения), или собственные тексты, сгенерированные с помощью LLM, наполненные выдуманными фактами.
Когда такие транскрипты обрабатывает ИИ-суммаризатор, скрытый текст перекрывает реальный контент, создавая на выходе полную бессмыслицу, которую не получается использовать в целях быстрой кражи контента.
F4mi отмечает, что продвинутые модели, такие как ChatGPT-o1, иногда могут отсеивать мусор и вопреки всему генерировать весьма точное изложение ее видео. Однако можно разделить файл .ass на отдельные буквы с временными метками, порядок которых можно перепутать в самом файле (при этом они будут правильно отображаться в итоговом видео). Такой подход создает настоящие головоломки, с которыми не справляются даже продвинутые ИИ.
Хотя YouTube не поддерживает формат .ass как таковой, существуют инструменты, позволяющие авторам конвертировать субтитры .ass в предпочтительный для YouTube формат .ytt. К сожалению, такие субтитры некорректно отображаются в мобильной версии, где субтитры в формате в итоге выглядят как черные поля, перекрывающие само видео.
По словам F4mi, она смогла обойти и эту проблему, написав Python-скрипт, который прячет мусорные субтитры в черный текст на черном фоне и заполняет экран всякий раз, когда изображение становится черным. Но в описании к видео F4mi отмечает, что «телефоны некоторых людей зависают из-за того, что субтитры стали слишком тяжелыми».
Также ютубер признает, что этот метод далеко не безупречен. Например, такие инструменты, как Whisper от OpenAI, которые действительно слушают звуковую дорожку, по-прежнему могут генерировать пригодные для использования транскрипты, так как при работе не полагаются на субтитры. Кроме того, практически любой экранный диктор на базе ИИ, скорее всего, тоже сможет извлечь из видео субтитры, видимые человеком.
Напомним, что F4mi далеко не единственная, кто пытается противостоять ИИ-ботам и краулерам, защищая свой контент. Совсем недавно мы рассказывали о других энтузиастах, которые создают ловушки для ИИ-краулеров, а также инструменты для «отравления» ИИ.