图书出版商因AI的“逐字抄袭”而起诉Meta

2026年05月06日由 alex 发表 4362 0

STK043_META_CVIRGINIA_D

Meta正面临由五大图书出版社和一位作者提起的集体诉讼，指控该公司在训练其Llama AI模型时“犯下了历史上最大规模的版权材料侵权行为之一”。在诉讼中，麦克米伦、麦格劳·希尔、爱思唯尔、哈切特、肯盖奇和作家斯科特·图罗指控Meta“多次未经许可复制”他们的书籍和期刊文章。

诉讼指控Meta明知故犯地从“知名的盗版网站”（如LibGen、Anna's Archive、Sci-Hub、Sci-Mag等）中盗取版权作品，然后将其输入其AI模型。它还声称Meta用Common Crawl数据集中的信息训练了Llama，该数据集据称“充满了未经授权的版权复制品”。因此，Llama “输出版权材料的逐字或近乎逐字替代”：

例如，当有人提示引用Cengage畅销教材《微积分：早期超越论》（第九版）中的两句简短句子时，Llama开始逐字复刻该部分的续写。

已有多位作者以版权侵权起诉Meta，这暴露了公司内部关于如何应对“媒体报道暗示我们使用了已知盗版数据集”的讨论。去年，一位联邦法官在其中一宗诉讼中裁定支持Meta，但他指出，他的裁决“并不支持Meta使用受版权保护的材料来训练其语言模型是合法的”这一观点。

一群作者还起诉了Anthropic版权侵权。尽管一位联邦法官裁定未经许可在合法购买的书籍上训练AI模型属于合理使用，但他允许作者们就Anthropic涉嫌盗版的“数百万”作品提起集体诉讼。Anthropic去年同意支付15亿美元给编剧，以和解集体诉讼。

Turow和出版商集团正在起诉Meta索赔，并请求法院下令该公司阻止其涉嫌非法的活动。他们还请求法院要求公司提供一份用于训练其Llama AI模型的书籍、期刊文章及其他版权作品清单。

Meta发言人Dave Arnold在给The Verge的电子邮件声明中表示：“人工智能正在推动个人和企业的变革性创新、生产力和创造力，法院也正确地认定，在受版权保护的材料上训练人工智能可以构成合理使用。”“我们将积极抗争这场诉讼。”

文章来源：https://www.theverge.com/tech/924230/meta-publishers-lawsuit-ai-copyright

标签：

Meta AI

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Ai2发布MolmoAct 2，提升机器人在现实世界中的智能

下一篇苹果可以在iOS 27中让你选择最喜欢的AI模型

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术