Anthropic公司指控三家中国人工智能企业通过创建超过2.4万个虚假账户来窃取其Claude AI模型的技术,以改进自己的模型性能。
被指控的企业包括深度求索(DeepSeek)、月之暗面(Moonshot AI)和MiniMax。据称,这些实验室通过虚假账户与Claude进行了超过1600万次对话交互,使用了一种名为"蒸馏"的技术手段。Anthropic表示,这些实验室"专门针对Claude最具差异化的核心能力:智能体推理、工具使用和编程能力"。
这一指控正值美国政府就是否严格执行先进AI芯片出口管制政策展开辩论之际,该政策旨在遏制中国人工智能发展。
蒸馏技术是AI实验室用于训练自己模型的常见方法,可以创建更小、更便宜的模型版本,但竞争对手也可以利用这种技术来复制其他实验室的成果。本月早些时候,OpenAI向众议院议员发送备忘录,指控深度求索使用蒸馏技术模仿其产品。
深度求索一年前首次引起关注,当时发布了开源的R1推理模型,以极低的成本实现了接近美国前沿实验室的性能表现。据报道,深度求索即将发布其最新模型DeepSeek V4,该模型在编程能力方面据称能够超越Anthropic的Claude和OpenAI的ChatGPT。
每次攻击的规模和范围各不相同。Anthropic追踪到来自深度求索的超过15万次交互,这些交互似乎旨在改进基础逻辑和一致性,特别是围绕政策敏感查询的审查安全替代方案。
月之暗面进行了超过340万次交互,主要针对智能体推理和工具使用、编程和数据分析、计算机使用智能体开发以及计算机视觉。上个月,该公司发布了新的开源模型Kimi K2.5和一个编程智能体。
MiniMax的1300万次交互针对智能体编程、工具使用和编排功能。Anthropic表示,当最新Claude模型发布时,他们能够观察到MiniMax将近一半的流量重新定向以窃取该模型的能力。
Anthropic表示将继续投资防御措施,使蒸馏攻击更难执行且更容易识别,但呼吁"AI行业、云服务提供商和政策制定者协调响应"。
这些蒸馏攻击发生在美国对华芯片出口仍然激烈辩论的时期。上个月,特朗普政府正式允许英伟达等美国公司向中国出口先进AI芯片(如H200)。批评人士认为,这种出口管制的放松在全球AI主导地位竞争的关键时期增强了中国的AI计算能力。
Anthropic指出,深度求索、MiniMax和月之暗面进行的大规模提取"需要获得先进芯片"。
Anthropic在其博客中写道:"因此,蒸馏攻击强化了出口管制的合理性:限制芯片获取既限制了直接模型训练,也限制了非法蒸馏的规模。"
智库Silverado Policy Accelerator主席、CrowdStrike联合创始人德米特里·阿尔佩罗维奇告诉TechCrunch,他对看到这些攻击并不感到惊讶。
阿尔佩罗维奇说:"很久以来,中国AI模型快速进步的部分原因显然是通过蒸馏技术窃取美国前沿模型。现在我们确实知道了这个事实。这应该给我们更充分的理由拒绝向这些公司销售任何AI芯片,否则只会让他们获得更多优势。"
Anthropic还表示,蒸馏技术不仅威胁削弱美国AI主导地位,还可能带来国家安全风险。
Anthropic在博客文章中写道:"Anthropic和其他美国公司构建的系统可以防止国家和非国家行为者使用AI来开发生物武器或进行恶意网络活动。通过非法蒸馏构建的模型不太可能保留这些安全保障,这意味着危险能力可能会在完全剥离许多保护措施的情况下扩散。"
Anthropic指出,专制政府将前沿AI部署用于"攻击性网络行动、虚假信息活动和大规模监控"等活动,如果这些模型开源化,这种风险会成倍增加。
TechCrunch已联系深度求索、MiniMax和月之暗面征求意见。
Q&A
Q1:什么是AI模型蒸馏技术?为什么会被用来窃取技术?
A:蒸馏技术是AI实验室用于训练自己模型的常见方法,可以创建更小、更便宜的模型版本。但竞争对手也可以利用这种技术来复制其他实验室的成果,通过大量与目标模型的对话交互来学习和模仿其能力,相当于"抄作业"。
Q2:中国AI企业是如何窃取Claude技术的?规模有多大?
A:三家中国AI企业通过创建超过2.4万个虚假账户,与Claude进行了超过1600万次对话交互。其中深度求索进行了15万次交互,月之暗面340万次,MiniMax达到1300万次,主要针对智能体推理、工具使用和编程等核心能力。
Q3:这种技术窃取会带来哪些安全风险?
A:除了威胁美国AI主导地位外,还可能带来国家安全风险。通过非法蒸馏构建的模型不太可能保留原有的安全保障措施,可能被用于开发生物武器、恶意网络活动、虚假信息活动和大规模监控等危险用途。