图书出版商因AI的“逐字抄袭”而起诉Meta

2026年05月06日 由 alex 发表 3580 0

STK043_META_CVIRGINIA_D


Meta正面临由五大图书出版社和一位作者提起的集体诉讼,指控该公司在训练其Llama AI模型时“犯下了历史上最大规模的版权材料侵权行为之一”。在诉讼中,麦克米伦、麦格劳·希尔、爱思唯尔、哈切特、肯盖奇和作家斯科特·图罗指控Meta“多次未经许可复制”他们的书籍和期刊文章。


诉讼指控Meta明知故犯地从“知名的盗版网站”(如LibGen、Anna's Archive、Sci-Hub、Sci-Mag等)中盗取版权作品,然后将其输入其AI模型。它还声称Meta用Common Crawl数据集中的信息训练了Llama,该数据集据称“充满了未经授权的版权复制品”。因此,Llama “输出版权材料的逐字或近乎逐字替代”:


例如,当有人提示引用Cengage畅销教材《微积分:早期超越论》(第九版)中的两句简短句子时,Llama开始逐字复刻该部分的续写。


已有多位作者以版权侵权起诉Meta,这暴露了公司内部关于如何应对“媒体报道暗示我们使用了已知盗版数据集”的讨论。去年,一位联邦法官在其中一宗诉讼中裁定支持Meta,但他指出,他的裁决“并不支持Meta使用受版权保护的材料来训练其语言模型是合法的”这一观点。


一群作者还起诉了Anthropic版权侵权。尽管一位联邦法官裁定未经许可在合法购买的书籍上训练AI模型属于合理使用,但他允许作者们就Anthropic涉嫌盗版的“数百万”作品提起集体诉讼。Anthropic去年同意支付15亿美元给编剧,以和解集体诉讼。


Turow和出版商集团正在起诉Meta索赔,并请求法院下令该公司阻止其涉嫌非法的活动。他们还请求法院要求公司提供一份用于训练其Llama AI模型的书籍、期刊文章及其他版权作品清单。


Meta发言人Dave Arnold在给The Verge的电子邮件声明中表示:“人工智能正在推动个人和企业的变革性创新、生产力和创造力,法院也正确地认定,在受版权保护的材料上训练人工智能可以构成合理使用。”“我们将积极抗争这场诉讼。”

文章来源:https://www.theverge.com/tech/924230/meta-publishers-lawsuit-ai-copyright
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消