В последние месяцы такие компании, как OpenAI и Stability AI столкнулись с судебными исками от авторов, художников или газет, которые считают, что их авторские права были нарушены.
«За последний год через судебную систему прошли два десятка исков, связанных с ИИ о нарушении авторских прав. До суда присяжных пока никто из истцов не дошел», — резюмируют они.
Согласно анализу Хансена и Сюй, на сегодняшний день большинство исков, касающихся Закона об авторском праве в цифровую эпоху (DMCA), были отклонены, в том числе следующие:
- Джейкоб Трамбле против OpenAI
- Сара Андерсен против Stability AI
- Сара Сильверман против OpenAI
Истцы до сих пор не смогли доказать, что результаты ИИ автоматически нарушают авторские права, поскольку они «не могут предоставить конкретные доказательства того, что результат существенно похож на исходную работу».
В иске, поданном художницами Сарой Андерсен, Келли МакКернан и Карлой Ортис против создателей генератора изображений Stable Diffusion (Stability AI, DeviantArt и Midjourney), например, не удалось доказать, что ИИ-изображения и исходные картины имеют «существенное сходство».
В случае Сары Сильверман, известного американского комика, против OpenAI, не удалось в достаточной степени доказать, что тексты, которые выдает ChatGPT, достаточно похожи на работы Сильверман.
Но не только в США, но и в Европе эксперты-юристы сейчас усиленно решают вопрос о том, нарушают ли модели ИИ авторские права и если да, то каким образом. Новое исследование под названием «Авторское право и обучение генеративному искусственному интеллекту – технологические и правовые основы» авторов Тима Дорниса (Ганноверский университет) и Себастьяна Стобера (Магдебургский университет), с другой стороны, приходит к выводу, что европейские законы об авторском праве будут применяться к обучению ИИ. Это будет не просто интеллектуальный анализ текста и данных, для которого есть исключения.
«Как показывает более пристальный взгляд на технологию генеративных моделей ИИ, обучение таких моделей не является интеллектуальным анализом текста и данных. Это нарушение авторских прав — в соответствии с немецким и европейским законодательством об авторском праве», — говорит Дорнис.
«Части обучающих данных из текущих генеративных моделей будут полностью или частично запоминаться и, следовательно, регенерироваться с помощью соответствующих подсказок конечными пользователями и, таким образом, дублироваться», — говорит Стобер.
В кратком изложении результатов исследования говорится, что не существует соответствующего исключения или ограничения авторских прав, которые могли бы оправдать массовые нарушения, которые происходят при обучении генеративного ИИ. Сюда входит копирование защищенных произведений во время сбора данных, полное или частичное воспроизведение в рамках модели ИИ, а также воспроизведение произведений из обучающих данных, инициированное конечными пользователями систем ИИ, таких как ChatGPT.