根据一份文件,Reddit正在起诉Anthropic,指控其在没有适当许可协议的情况下使用该网站的数据来训练AI模型。诉状周三在北加州法院提交的诉状中,Reddit声称Anthropic未经授权将该网站的数据用于商业目的,这种行为是非法的,并指控这家AI初创公司违反了Reddit的用户协议。
Reddit的诉讼使其成为首个因训练数据实践而对AI模型提供商提起法律挑战的大型科技公司,加入了因类似原因起诉科技公司的出版商行列。
《纽约时报》已起诉OpenAI和微软,指控其在未经支付或许可的情况下使用其新闻文章进行训练。同时,Sarah Silverman和其他书籍作者已起诉Meta未经批准在他们的书籍上训练AI模型。音乐出版商和艺术家也对AI音频、视频和图像生成初创公司提出了类似的指控,称其滥用他们的内容。
“我们不会容忍像Anthropic这样的逐利实体在没有任何回报给Reddit用户或尊重他们隐私的情况下,商业性地利用Reddit内容赚取数十亿美元,”Reddit首席法律官Ben Lee在给TechCrunch的声明中说。
值得注意的是,Reddit已与其他AI模型提供商达成协议,包括OpenAI和谷歌,允许这些公司在Reddit的数据上训练AI模型,并在其各自的AI聊天机器人的回答中显示该网站的帖子。然而,在文件中,Reddit表示它对OpenAI和谷歌施加了某些条款,以保护其用户的利益和隐私。
OpenAI的首席执行官Sam Altman拥有Reddit的8.7%股份,使他成为第三大股东,并曾是该公司董事会成员。
在文件中,Reddit声称其曾接触Anthropic并明确表示该AI初创公司没有授权抓取或使用Reddit的内容。然而,Reddit指控Anthropic“拒绝合作”。
Reddit在其诉状中声称,Anthropic的抓取机器人无视社交网络的robots.txt文件,这是一种向自动化系统发出不抓取网站信号的标准。作为进一步证据,Reddit声称Anthropic的AI聊天机器人Claude经常引用Reddit社区和Reddit上的话题。
Reddit要求Anthropic支付赔偿金,以及因抓取Reddit内容而获得的收益的补偿。Reddit还请求禁止Anthropic继续使用Reddit的内容的禁令。