Anthropic 揭露中國 AI 公司工業級蒸餾攻擊:DeepSeek、MiniMax、Moonshot 24,000 假帳號竊取 Claude L1
信心度: 高
重點: Anthropic 發現 DeepSeek、MiniMax 和 Moonshot AI 三家中國 AI 公司對其 Claude 模型發動工業級蒸餾攻擊。攻擊者建立約 24,000 個虛假帳號,累計產生超過 1,600 萬次對話交換,系統性地提取 Claude 的推理和程式碼生成能力,用於訓練和改進自家模型。
影響: MiniMax 攻擊規模最大(1,300 萬次交換),專注於代理式程式碼和工具編排;Moonshot AI 產生 340 萬次交換,針對代理推理、編碼和電腦視覺;DeepSeek 則聚焦 15 萬次高品質推理和獎勵模型交換。Anthropic 在 MiniMax 發布其訓練模型前偵測到攻擊,且觀察到當 Anthropic 發布新模型時,MiniMax 在 24 小時內就將近半流量轉向新模型。此事件強化了半導體出口管制的政策論據。
詳細分析
取捨考量
優點:
- 揭示 AI 模型竊取的真實規模
- 促進行業安全合作
- 提供蒸餾攻擊偵測方法論
- 強化出口管制政策依據
缺點:
- 被蒸餾的模型缺乏安全護欄
- 可能加劇中美 AI 對抗
- 偵測到的可能只是冰山一角
快速體驗(5-15 分鐘)
- 閱讀 Anthropic 官方報告了解偵測方法
- 檢視自家 AI API 的異常使用模式
- 評估 ToS 執行和帳號驗證機制
建議
AI 模型提供商應強化 API 使用監控和行為指紋識別系統,防範蒸餾攻擊。企業用戶應關注模型安全供應鏈風險。
來源: Anthropic 官方 (官方) | Bloomberg (新聞) | TechCrunch (新聞)