AI公司Anthropic在一场关于人工智能公司如何使用受版权保护材料训练其模型的版权争议中赢得了一项关键的法律胜利,但斗争远未结束。
美国地方法院法官威廉·阿尔苏普发现,Anthropic使用受版权保护的书籍来训练其AI聊天机器人Claude符合美国版权法下的“合理使用”标准,在周一晚间的裁决中。
“就像任何想成为作家的读者一样,Anthropic的LLM训练作品不是为了超越和复制或取代它们,而是为了转变方向,创造出不同的东西,”美国地方法院法官威廉·阿尔苏普在裁决中说道。
但法官也指责这家由亚马逊和谷歌支持的公司建立和维护一个庞大的“中央图书馆”盗版书籍,称其运营的这一部分明显违反了版权法。
“没有版权法的例外”
此案由作者安德里亚·巴尔茨、查尔斯·格雷伯和柯克·华莱士·约翰逊于去年八月提起,指控Anthropic通过从Library Genesis和Pirate Library Mirror等臭名昭著的网站下载数百万本盗版书籍来构建Claude。
该诉讼寻求赔偿和永久禁令,指控Anthropic“通过窃取数十万本受版权保护的书籍”来训练Claude及其AI模型家族,建立了一个价值数十亿美元的业务。
阿尔苏普表示,AI训练可以是“极具变革性”的,指出Claude的输出不会复制或重复作者的作品,而是生成与原作“正交”的新文本。
法庭记录显示,Anthropic下载了至少七百万本盗版书籍,包括每位作者作品的副本,以组建其图书馆。
内部邮件显示,Anthropic的联合创始人试图避免许可书籍的“法律/实践/商业障碍”,而员工则描述目标是创建一个“世界上所有书籍”的数字收藏,并“永久”保存。
“然而,版权法中没有为AI公司提供的例外,”阿尔苏普说,指出即使只有一部分用于训练,维持一个永久的盗版作品图书馆“如果被允许,将摧毁学术出版市场”。
法官威廉·阿尔苏普的裁决是美国联邦法院首次实质性地分析和应用合理使用原则,特别是针对使用受版权保护材料训练生成性AI模型的情况。
法院区分了直接用于AI训练的副本,这些被视为合理使用,以及保留的盗版副本,这些将面临进一步的法律程序,包括潜在的赔偿。
AI版权案件
虽然已经提起了几起诉讼——包括针对OpenAI、Meta等的高调案件——但这些案件仍处于早期阶段,驳回动议待决或正在进行证据开示。
OpenAI和Meta都面临来自作者团体的诉讼,指控其未经同意利用受版权保护的作品来训练大型语言模型,如ChatGPT和LLaMA。
《纽约时报》在2023年起诉了OpenAI和微软,指控他们未经许可使用数百万篇时报文章来开发AI工具。Reddit最近也起诉了Anthropic,
指控其在声称已停止的情况下,对Reddit平台进行了超过10万次的数据抓取以训练Claude。