Adobe因涉嫌滥用作者作品进行AI培训而面临集体诉讼

2025年12月18日由 alex 发表 4233 0

GettyImages-2162453288

和几乎所有其他科技公司一样，Adobe在过去几年里大力投入人工智能。自2023年以来，这家软件公司推出了多项不同的人工智能服务，包括Firefly——其基于AI的媒体生成套件。然而，现在公司对这项技术的全力拥抱可能引发了麻烦，因为一项新诉讼声称其使用盗版书籍来训练其人工智能模型。

一项由俄勒冈州作家伊丽莎白·莱昂提起的集体诉讼提起，声称Adobe使用了包括她自己在内的多本盗版书籍来培训Adobe的SlimLM项目。

Adobe 将 SlimLM 描述为一个小型语言模型系列，可以“针对移动设备上的文档辅助任务进行优化”。声明称 SlimLM 是在 SlimPajama-627B 上预训练的，这是 Cerebras 于 2023 年 6 月发布的“去重、多语料库、开源数据集”。莱昂撰写过多本非虚构写作指南，她说她的一些作品被纳入了Adobe使用的预训练数据集中。

莱昂的诉讼最初由路透社报道，称她的文字被包含在一个经过处理的控数据集子集中，该数据集是Adobe项目的基础：“SlimPajama数据集是通过复制和作RedPajama数据集（包括复制Books3）创建的，”诉讼称。“因此，由于它是RedPajama数据集的衍生复制品，SlimPajama包含了Books3数据集，包括原告和集体成员的版权作品。”

“Books3”——一个包含19.1万册用于训练生成式人工智能系统的书籍的庞大收藏——一直是科技社区持续引发法律麻烦的源头。RedPajama 也曾在多起诉讼案件中被引用。今年九月，一起针对苹果的诉讼指控该公司使用了受版权保护的材料来训练其苹果智能模型。诉讼提及该数据集，并指责该科技公司“未经同意、未获得署名或报酬”复制受保护作品。去年十月，针对Salesforce的类似诉讼也声称该公司将RedPajama用于培训目的。

不幸的是，这类诉讼如今已变得相当普遍。人工智能算法训练于庞大的数据集上，有些数据集据称包含盗版材料。今年九月，Anthropic同意向多名作者支付15亿美元赔偿，这些作者曾起诉其，指控其使用盗版作品来训练其聊天机器人Claude。此案被视为围绕AI训练数据中版权材料持续法律

文章来源：https://techcrunch.com/2025/12/17/adobe-hit-with-proposed-class-action-accused-of-misusing-authors-work-in-ai-training/

标签：

adobe

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇谷歌 “氛围编码” 工具 Opal 现已登陆 Gemini 平台

下一篇亚马逊任命资深AWS高管彼得·德桑蒂斯领导新AI组织

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术