摘要: 一群作者对技术巨头Nvidia提出了拟议的集体诉讼,据称其未经允许在培训AI模型中使用了受版权保护的作品。
英伟达面临AI侵权诉讼
科技巨头英伟达正面临一起诉讼,一群作者称其在未经允许的情况下使用了他们的受版权作品来训练其人工智能平台NeMo。
作者Brian Keene、Abdi Nazemian和Stewart O’Nan表示,他们的作品被包括在一个包含196,640本书的数据集中,用于训练NeMo模拟普通书面语言,后来因“报告的版权侵权”而被移除。
这起集体诉讼于周五晚在旧金山联邦法院提起,声称英伟达“承认”它训练NeMo时使用了该数据集,侵犯了他们的版权。这起诉讼类似于其他关于AI版权侵权的诉讼。
诉讼要求对过去三年内帮助训练NeMo大型语言模型(LLMs)的美国人进行未指明的赔偿。LLMs用于驱动NeMo等AI工具,英伟达表示这是一种快速和经济的采用生成式AI的方式。
诉讼中包括的作品有Keene的2008年小说《幽灵之行》、Nazemian的2019年小说《像一场爱的故事》和O’Nan的2007年中篇小说《在龙虾餐馆的最后一夜》。
诉讼称这些书籍被包括在一个名为“The Pile”的数据中,其中包含一系列名为“Books3”的书籍,英伟达承认曾训练其NeMo Megatron AI模型使用“The Pile”和“Books3”。
NeMo Megatron模型托管在一个名为Hugging Face的网站上,其中包含AI模型训练数据集的描述,说明该模型是在“The Pile”上训练的。直到2023年10月,The Pile的Books3数据集被从Hugging Face上移除,并附有一条消息说明“由于报告的版权侵权,该数据集已废弃且不再可访问”。
英伟达拒绝就未决诉讼发表评论。
这起诉讼将英伟达拖入一系列针对科技公司在训练AI模型中使用受版权内容的诉讼中,包括几起由作家提起的诉讼,以及纽约时报对CHAT GPT制造商OpenAI和微软提起的诉讼。
英伟达作为领先的AI芯片制造商,其股价自2022年底以来飙升近600%,使公司市值达到将近2.2万亿美元。