Мета-письма раскрывают массовое скачивание пиратских книг для обучения ИИ

Image by Nokia621, from Wiki Commons

Мета-письма раскрывают массовое скачивание пиратских книг для обучения ИИ

Время для прочтения: 3 мин.

Недавно раскрытые электронные письма выходят на поверхность как то, что авторы книг называют «самыми убедительными доказательствами» против Meta в текущем судебном иске о нарушении авторских прав, как впервые сообщил Ars Technica.

Спешите? Вот основные факты!

  • Meta загрузила 81,7 терабайта пиратских книг из теневых библиотек, таких как LibGen и Z-Library.
  • Внутренние письма показывают, что сотрудники Meta выразили юридические опасения по поводу торрент-раздачи и распространения авторских материалов.
  • Предположительно, Meta скрывала использование торрентов, избегая серверов Facebook и минимизируя активность распространения.

Как сообщает Ars Technica, авторы утверждают, что Meta незаконно обучила свои AI-модели на пиратских копиях книг, а электронные письма раскрывают внутреннюю обеспокоенность относительно законности торрент-раздачи и скачивания авторских материалов.

В прошлом месяце, Meta призналась в торрент-раздаче спорного датасета, известного как LibGen, который содержит десятки миллионов пиратских книг.

Однако, подробности остались неясными до тех пор, пока не были обнародованы нередактированные электронные письма.

Согласно судебному заявлению авторов, Meta загрузила «не менее 81.7 терабайт данных через несколько теневых библиотек на сайте Архив Анны, включая не менее 35.7 терабайт данных из Z-Library и LibGen». Кроме того, «Meta ранее загрузила 80.6 терабайт данных из LibGen».

«Масштабы незаконной торрентной схемы Meta поражают воображение», — говорится в заявлении авторов, отмечая, что даже «гораздо меньшие акты пиратства данных — всего 0.008 процента от объема авторских произведений, которые Meta пиратила — приводили к тому, что судьи направляли дело на уголовное расследование в офис прокуроров США».

Ars Technica отмечает, что электронные письма также раскрывают внутреннее беспокойство среди сотрудников Meta. В апреле 2023 года инженер-исследователь Николай Башлыков написал: «Загрузка через торрент с корпоративного ноутбука как-то не по себе», добавив смайлик.

Он выразил обеспокоенность использованием IP-адресов Meta «для загрузки через торрент пиратского контента». К сентябрю 2023 года Башлыков перестал шутить, обратился к юридической команде Meta и предупредил, что «использование торрентов означает ‘сидирование’ файлов — то есть, распространение контента за пределами, это может быть юридически не в порядке».

Несмотря на эти предупреждения, авторы утверждают, что Meta продолжала использовать торренты и распространять пиратский контент, даже пытаясь скрыть свои действия.

Ars Technica сообщает, что внутренние сообщения показывают, что Meta избегала использования серверов Facebook для загрузки набора данных, чтобы «избежать» «риска» того, что кто-то «приведет след до отправителя/загрузчика,» как описал исследователь Франк Чжан.

Майкл Кларк, исполнительный директор Meta, также признал в депозиции, что настройки были изменены «для того, чтобы произошло минимальное возможное количество раздач».

Авторы теперь утверждают, что сотрудники Meta, участвовавшие в принятии решения о торрент-раздаче, должны быть повторно допрошены, поскольку, как предполагается, новые улики «противоречат предыдущему свидетельству, данному при депозиции».

Например, генеральный директор Марк Цукерберг утверждал, что не был замешан в использовании LibGen для обучения искусственного интеллекта, однако нецензурированные сообщения указывают на то, что «решение об использовании LibGen было принято» после «предварительного обращения к MZ».

Ars Technica сообщает, что Meta настаивает на том, что обучение ее ИИ на LibGen является «добросовестным использованием» и отрицает любое незаконное распространение произведений авторов. Однако обнаружение торрентов усложнило защиту компании, позволив авторам расширить свои претензии о прямом нарушении авторских прав.

По мере развития дела, Meta сталкивается с усиливающимся вниманием к своему подходу к обработке авторских материалов, а авторы твердо намерены привлечь технологического гиганта к ответственности за то, что они описывают как «массовую незаконную схему торрентов».

Понравилась статья? Поставьте оценку!
Ужасно Удовлетворительно Хорошо Очень хорошо! Превосходно!

Мы рады, что вам понравилась наша статья!

Дорогой читатель, не могли бы вы оставить отзыв о нас на сайте Trustpilot? Это не займет у вас много времени, но очень важно для нас. Спасибо, наш замечательный читатель!

Оценить нас на Trustpilot
0 Проголосовало 0 пользователей
Заголовок
Комментарий
Спасибо за ваш отзыв
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Оставьте комментарий

Loader
Loader Показать больше...