Новости

NVIDIA обвинили в использовании сотен терабайт пиратских книг для тренировки своего ИИ


NVIDIA оказалась в центре скандала в рамках коллективного иска, поданного несколькими авторами. Они обвиняют производителя видеокарт и ИИ-решений в нарушении авторских прав при обучении своих больших языковых моделей (LLM). Новые судебные документы, обнародованные в расширенной жалобе, раскрывают переписку сотрудников NVIDIA с теневой библиотекой Anna's Archive.

Согласно материалам дела, рассматриваемого в окружном суде Северного округа Калифорнии, представители команды по стратегии данных NVIDIA напрямую обращались к Anna's Archive с запросом о получении высокоскоростного доступа к их коллекции. Речь шла примерно о 500 терабайтах данных, включающих миллионы книг и других произведений.

В переписке, на которую ссылаются истцы (и которую ранее публиковал ресурс TorrentFreak), представители Anna's Archive прямо предупреждали сотрудника Nvidia, что коллекция содержит «миллионы пиратских книг». Несмотря на это, по утверждению жалобы, руководство компании дало «зеленый свет» на продолжение процесса уже через неделю после обращения.

Более того, Anna's Archive предлагала доступ к нескольким миллионам книг, которые обычно выдаются только через систему контролируемого цифрового кредитования Internet Archive. Авторы иска утверждают, что скачивание этих данных означало создание NVIDIA дополнительных пиратских копий их защищенных произведений.

Помимо Anna's Archive, истцы обвиняют NVIDIA в использовании других пиратских источников: базы данных Books3, LibGen, Sci-Hub и Z-Library.

Пока в документах нет прямых доказательств того, что данные действительно были загружены и использованы в обучении моделей, а также не упоминается факт оплаты доступа. Сама NVIDIA на момент публикации новых материалов официально не прокомментировала эту часть иска.

Ранее компания уже признавала использование датасета Books3 (включающего множество произведений под авторским правом), но защищала свои действия. В официальном ответе NVIDIA заявляла, что ИИ-модели не «читают» тексты подобно человеку, а лишь «измеряют статистические корреляции в совокупности огромного объема данных». Компания настаивает, что процесс обучения подпадает под доктрину добросовестного использования (fair use), и что запрет на доступ к фактам и идеям через авторское право невозможен.

Пользуетесь Telegram? Подпишитесь на нас - там лента новостей в удобном формате:
https://t.me/telegaggru

Комментарии (9)
Авторизуйтесь, чтобы оставить комментарий
lamidex
Балабол
76
24.01.2026 14:41
звучит круто
Korvo Atano Master Kill
Топ 1000 адекватов
75
24.01.2026 04:59
Все средства хороши
Kaval21
Свой в доску
39
24.01.2026 03:40
Без внедрения ИИ уже никак это как сотовые, в начале 2000-х удобно не совсем дорого и почти доступно. Единствиное, остаеться согласиться с прогресом.
Тоже самое раньше говорили и про преславутое 3D там хуанг продавал мониторы и видео карты с поддержкой этой "технологии" где как идиот нужно смотреть через красно синие очки, или вспомнить NFT великий развод лохов на бабло, вот и с этим так же наиграються и бросят или найдут новую хайповую игрушку.
С 3d не стал бы сравнивать вещь была нужная,разные платы для видях были типа 3Dfx или как Японцы закпрыгнули в уходящий поезд с Nintendo 3DS. Вот NFT та еще болячка индустрии.
dubstephh95
8
23.01.2026 19:53
не удивительно, в гонке то надо как-то учавствовать
Максим Чехов
16
23.01.2026 17:42
А ведь когда то они просто двигали прогресс и продавали видюхи, а потом хуанг поплыл от жадности...
Нереварин
Собачка-неудачка
75
23.01.2026 17:07
У куртки денег нет на легальные книги.
Jarvis
Фейк Кодзимы
76
23.01.2026 16:38
Вот же пристали к бедной компании.😄

Мы можем присылать вам уведомления о важных новостях и статьях. По рукам?