
Anthropic是一家人工智能公司,指责三家中国AI公司通过其Claude AI模型创建了超过24,000个虚假账户,以改进他们自己的模型。
这些实验室——DeepSeek、Moonshot AI和MiniMax——据称通过这些账户使用一种称为“蒸馏”的技术生成了超过1600万次交互。Anthropic表示,这些实验室“瞄准了Claude最具差异化的能力:代理推理、工具使用和编码。”
这些指控正值关于如何严格执行先进AI芯片出口管制的辩论之际,这项政策旨在遏制中国的AI发展。
蒸馏是一种常见的训练方法,AI实验室用它来创建更小、更便宜的模型版本,但竞争对手可以用它来基本上复制其他实验室的成果。OpenAI本月早些时候向众议院议员发送了一份备忘录,指责DeepSeek使用蒸馏来模仿其产品。
DeepSeek首次引起轰动是在一年前,当时它发布了开源的R1推理模型,该模型在性能上几乎与美国前沿实验室相当,但成本仅为其一小部分。预计DeepSeek很快将发布其最新模型DeepSeek V4,据称据报道在编码方面可以超越Anthropic的Claude和OpenAI的ChatGPT。
每次攻击的规模在范围上有所不同。Anthropic追踪到来自DeepSeek的超过150,000次交互,似乎旨在改进基础逻辑和对齐,特别是围绕政策敏感查询的审查安全替代方案。
Moonshot AI有超过340万次交互,目标是代理推理和工具使用、编码和数据分析、计算机使用代理开发以及计算机视觉。上个月,该公司发布了一个新的开源模型Kimi K2.5和一个编码代理。
MiniMax的1300万次交互目标是代理编码和工具使用及编排。Anthropic表示,它能够观察到MiniMax的行动,因为它在Claude最新模型发布时将近一半的流量重定向以从中汲取能力。
Anthropic表示将继续投资于使蒸馏攻击更难执行和更易识别的防御措施,但呼吁“AI行业、云服务提供商和政策制定者之间的协调响应。”
蒸馏攻击发生在美国芯片出口到中国仍在激烈辩论之际。上个月,特朗普政府正式允许像Nvidia这样的美国公司向中国出口先进的AI芯片(如H200)。批评者认为,这种放松出口管制在全球AI主导地位竞争的关键时刻增加了中国的AI计算能力。
Anthropic表示,DeepSeek、MiniMax和Moonshot进行的提取规模“需要访问先进的芯片。”
“因此,蒸馏攻击强化了出口管制的理由:限制芯片访问不仅限制了直接模型训练,也限制了非法蒸馏的规模,”根据Anthropic的博客。
Dmitri Alperovitch,Silverado政策加速器智库主席兼CrowdStrike联合创始人,告诉TechCrunch他对这些攻击并不感到惊讶。
“很明显,中国AI模型快速进步的部分原因是通过蒸馏窃取美国前沿模型。现在我们知道这是事实,”Alperovitch说。“这应该给我们更有力的理由拒绝向这些[公司],出售任何AI芯片,这只会进一步使他们受益。”
Anthropic还表示,蒸馏不仅威胁到削弱美国的AI主导地位,还可能带来国家安全风险。
“Anthropic和其他美国公司构建的系统可以防止国家和非国家行为者使用AI来,例如,开发生物武器或进行恶意网络活动,”Anthropic的博客文章中写道。“通过非法蒸馏构建的模型不太可能保留这些保护措施,这意味着危险的能力可能会在许多保护措施被完全剥离的情况下传播。”
Anthropic指出,专制政府部署前沿AI用于“进攻性网络行动、虚假信息活动和大规模监控”等事情,如果这些模型是开源的,这种风险会倍增。
