Anthropic 發布 Claude Sonnet 4.6:1M Token 上下文與 72.5% OSWorld 表現 L1
信心度: 高
重點: Anthropic 發布 Claude Sonnet 4.6,距離 Opus 4.6 發布僅 12 天。這是最強大的 Sonnet 模型,在編碼、電腦使用、長上下文推理、代理規劃、知識工作和設計方面全面升級。核心更新是 Adaptive Thinking 引擎,允許模型在生成回應前「暫停」思考。
影響: Sonnet 4.6 在 OSWorld 基準測試達到 72.5%(16 個月前僅 14.9%)。1M token 上下文視窗(測試版)是先前最大視窗的兩倍。定價維持 $3/百萬輸入、$15/百萬輸出。現為免費和 Pro 方案預設模型。Snowflake 以 $2 億擴展合作,AWS Bedrock 和 Google Cloud Vertex AI 同步上線。
詳細分析
取捨考量
優點:
- 電腦使用能力近 5 倍提升
- 1M 上下文視窗支援超長任務
- 價格維持不變
缺點:
- 1M 視窗仍在測試
- 可能加劇軟體股拋售
快速體驗(5-15 分鐘)
- 登入 Claude 自動獲得 Sonnet 4.6
- API 用戶使用 claude-3-5-sonnet-20260217
- 測試 1M token 視窗需啟用 beta
建議
所有 Claude 用戶應立即測試新功能,特別是需要處理長文件或複雜代理任務的開發者。
來源: Anthropic 官方 (官方) | CNBC (新聞)