Google использует видео YouTube для обучения ИИ-моделей без ведома создателей контента

Речь идет, например, о модели ИИ Gemini и видео- и аудиогенерате Veo 3.
20 июня 2025, пятница 18:25
kosmos_news для раздела Блоги

Google использует контент своей крупнейшей в мире видеоплатформы YouTube для обучения своего искусственного интеллекта, не информируя об этом напрямую пользователей и не предоставляя им возможности возразить.


Google подтвердила американскому вещателю CNBC, что использует видеоролики YouTube для обучения своих моделей ИИ, включая Gemini и видео- и аудиогенератор Veo 3. Компания подчеркивает, что использует только незначительное количество видеороликов. Учитывая, что на платформе размещено более 20 миллиардов видеороликов, даже при использовании всего лишь одного процента получается огромная база данных. По оценкам экспертов, объем такого учебного материала составляет около 2,3 миллиарда минут — примерно в 40 раз больше, чем используют многие конкурирующие проекты в области ИИ.

Большинство создателей контента на YouTube не знают, что их контент можно использовать для обучения искусственного интеллекта. 

«Вполне вероятно, что они используют данные многих творческих людей, которые вложили много времени и энергии в свои видеоролики», — говорит Люк Арригони, генеральный директор компании Loti, занимающейся защитой персональных данных.

Еще одним пунктом критики является отсутствие возможности отказа от политики платформы. Хотя пользователи YouTube могут запретить предоставление своего контента сторонним поставщикам, таким как Amazon или Apple, это правило не распространяется на собственные исследования Google в области искусственного интеллекта. 

 Некоторые эксперты предупреждают о надвигающемся кризисе авторских прав. Дэн Нили, генеральный директор Vermillio, уже сообщает об увеличении количества фейкового контента, в котором реальных создателей имитируют модели искусственного интеллекта — без их согласия или контроля.

Google сотрудничает с известным агентством Creative Artists Agency, чтобы предоставить известным авторам инструменты для идентификации и управления контентом, созданным с помощью ИИ. Однако эти предложения доступны лишь небольшой части пользователей — в основном известным блогерам.