OpenAI 發布 GPT-5.4:原生電腦操控能力與百萬 Token 上下文 L1
信心度 : 高
重點 : OpenAI 於 3 月 5 日正式發布 GPT-5.4,這是其最新旗艦模型。GPT-5.4 是首個整合原生電腦操控(Computer Use)能力的通用模型,支援高達 1M token 的上下文視窗(實驗性功能需手動啟用,標準為 272K),並將 GPT-5.3-codex 的前沿程式碼能力整合進主線模型。API 定價為 $2.50/1M 輸入 tokens、$20.00/1M 輸出 tokens,緩存輸入為 $0.625/1M。同時推出 GPT-5.4 Thinking(推理版)與 GPT-5.4 Pro(高效能版)。
影響 : 所有使用 OpenAI API 的開發者都受到影響。GPT-5.4 將成為 API 預設旗艦模型。電腦操控能力讓 AI Agent 可在軟體環境中執行複雜工作流程。效率提升顯著——解決同等問題所需 token 量明顯減少。在 OpenAI 內部投資銀行基準測試中,GPT-5.4 Thinking 的準確率從 GPT-5 的 43.7% 躍升至 87.3%。
詳細分析
取捨考量
優點 :
原生電腦操控能力,無需額外工具即可讓 Agent 操作應用程式 1M token 上下文視窗,適合長文件分析與長時程任務執行 $2.50/1M 輸入 token 定價在旗艦模型中具有競爭力 整合最先進的程式碼能力 Thinking 模式支援中途調整思考方向 缺點 :
1M token 上下文為實驗性功能,需手動配置,超過 272K 的部分費率加倍 GPT-5.4 Thinking 版本推理成本較高 從 GPT-5.2 升級可能需要測試現有 prompt 是否需要調整
快速體驗(5-15 分鐘)
在 OpenAI API 中將模型切換為 gpt-5.4 測試 Computer Use 能力:使用 computer_20250124 工具類型 啟用 1M 上下文:設定 model_context_window 與 model_auto_compact_token_limit 參數 體驗 ChatGPT 中的 GPT-5.4 Thinking 中途計畫調整功能
建議
立即在非生產環境中測試 GPT-5.4,特別評估 Computer Use 能力對現有 Agent 工作流程的影響。若您的應用需要長文件處理或多步驟任務執行,這是重大升級機會。注意監控 token 使用量,避免意外觸發超 272K 的高費率區間。
來源 : OpenAI 官方公告 (官方) | TechCrunch (新聞) | OpenAI API 文件 (文檔)
OpenAI 收購 AI 安全平台 Promptfoo,整合至 Frontier 平台 L1
信心度 : 高
重點 : OpenAI 於 3 月 9 日宣布收購 AI 安全測試平台 Promptfoo。Promptfoo 成立於 2024 年,已服務超過 35 萬名開發者,130K 月活躍用戶,Fortune 500 企業中超過 25% 使用其服務。收購完成後,Promptfoo 的技術將整合至 OpenAI Frontier(AI 代理人構建平台),為企業提供自動化安全測試與紅隊演練(Red Teaming)能力,能偵測提示注入(Prompt Injection)、越獄、資料洩漏、工具濫用等威脅。重要的是,Promptfoo 工具將持續保持開源。
影響 : 使用 OpenAI Frontier 平台的企業開發者將直接受益,安全測試能力將成為平台原生功能。對於所有開發 AI Agent 的開發者而言,這標誌著 AI 安全測試正在走向標準化。開源社群的 Promptfoo 工具不受影響,承諾繼續維護。
詳細分析
取捨考量
優點 :
AI 安全測試成為 Frontier 平台原生能力,無需額外集成 Promptfoo 保持開源,社群可繼續使用 對抗提示注入、越獄等 Agent 安全威脅的能力大幅提升 缺點 :
收購條款未公開 整合時間表尚不明確,近期可能無法立即使用新功能 非 Frontier 平台用戶暫時無法享受整合後的好處
快速體驗(5-15 分鐘)
立即使用開源版 Promptfoo 進行 AI 安全測試:npm install -g promptfoo 嘗試 Promptfoo 的 Red Team 功能:promptfoo redteam init 關注 OpenAI Frontier 平台更新,以了解整合進度
建議
現在開始熟悉 Promptfoo 的開源工具,及早建立 AI 安全測試流程。隨著 AI Agent 應用越來越普遍,安全測試將成為必要步驟。這次收購也表明 OpenAI 將把安全測試提升為一等公民功能。
來源 : OpenAI 官方公告 (官方) | TechCrunch (新聞) | Promptfoo 官方部落格 (官方)
OpenAI Codex Security 開放研究預覽:AI 代理人自動發現程式碼漏洞 L1
信心度 : 高
重點 : OpenAI 於 3 月 6 日推出 Codex Security 研究預覽版,這是一個能對整個程式碼庫進行深度上下文分析的 AI 安全代理人,可識別其他工具遺漏的複雜漏洞。目前免費試用 1 個月,提供給 ChatGPT Pro、Enterprise、Business 和 Edu 用戶。測試數據顯示:掃描了 120 萬個 commits,識別 792 個嚴重漏洞和 10,561 個高危漏洞,其中 14 個已被記錄在 CVE 資料庫。假陽性率已下降超過 50%,誤報高危漏洞減少超過 90%。
影響 : 使用 ChatGPT Pro/Enterprise/Business/Edu 的開發者和安全團隊可立即使用。AI 安全代理人能大幅加速程式碼審查效率,特別適合開源項目和企業代碼庫的安全審計。這是繼 Anthropic 幫助 Mozilla 發現 Firefox 漏洞後,又一個 AI 輔助安全的重要里程碑。
詳細分析
取捨考量
優點 :
目前免費試用 1 個月(Pro/Enterprise/Business/Edu) 能發現傳統工具遺漏的複雜漏洞,包含專案特定威脅建模 假陽性率低,不會產生大量雜訊 直接生成修補建議,減少人工介入 缺點 :
僅限 Pro、Enterprise、Business、Edu 訂閱用戶,免費用戶無法使用 目前為研究預覽版,可能存在限制 需要對 OpenAI 的程式碼分析有一定信任度(將程式碼送至 OpenAI 分析)
快速體驗(5-15 分鐘)
前往 ChatGPT → Codex → Codex Security(需 Pro/Enterprise 帳號) 連接 GitHub 倉庫並設定掃描範圍 查看生成的威脅模型並根據需要調整 執行掃描並審閱高信心度的漏洞報告
建議
如果您是 ChatGPT Pro 或 Enterprise 用戶,立即在試用期內測試 Codex Security。建議先在非關鍵的開源項目上試用,了解其威脅建模與漏洞分類的準確性,再考慮引入商業代碼庫的安全審計流程。
來源 : OpenAI 官方公告 (官方) | The Hacker News (新聞)