EN

2026-03-10 AI 摘要

共 5 則更新

🔴 L1 - 平台級更新

OpenAI 發布 GPT-5.4:原生電腦操控能力與百萬 Token 上下文 L1

信心度:

重點: OpenAI 於 3 月 5 日正式發布 GPT-5.4,這是其最新旗艦模型。GPT-5.4 是首個整合原生電腦操控(Computer Use)能力的通用模型,支援高達 1M token 的上下文視窗(實驗性功能需手動啟用,標準為 272K),並將 GPT-5.3-codex 的前沿程式碼能力整合進主線模型。API 定價為 $2.50/1M 輸入 tokens、$20.00/1M 輸出 tokens,緩存輸入為 $0.625/1M。同時推出 GPT-5.4 Thinking(推理版)與 GPT-5.4 Pro(高效能版)。

影響: 所有使用 OpenAI API 的開發者都受到影響。GPT-5.4 將成為 API 預設旗艦模型。電腦操控能力讓 AI Agent 可在軟體環境中執行複雜工作流程。效率提升顯著——解決同等問題所需 token 量明顯減少。在 OpenAI 內部投資銀行基準測試中,GPT-5.4 Thinking 的準確率從 GPT-5 的 43.7% 躍升至 87.3%。

詳細分析

取捨考量

優點:

  • 原生電腦操控能力,無需額外工具即可讓 Agent 操作應用程式
  • 1M token 上下文視窗,適合長文件分析與長時程任務執行
  • $2.50/1M 輸入 token 定價在旗艦模型中具有競爭力
  • 整合最先進的程式碼能力
  • Thinking 模式支援中途調整思考方向

缺點:

  • 1M token 上下文為實驗性功能,需手動配置,超過 272K 的部分費率加倍
  • GPT-5.4 Thinking 版本推理成本較高
  • 從 GPT-5.2 升級可能需要測試現有 prompt 是否需要調整

快速體驗(5-15 分鐘)

  1. 在 OpenAI API 中將模型切換為 gpt-5.4
  2. 測試 Computer Use 能力:使用 computer_20250124 工具類型
  3. 啟用 1M 上下文:設定 model_context_window 與 model_auto_compact_token_limit 參數
  4. 體驗 ChatGPT 中的 GPT-5.4 Thinking 中途計畫調整功能

建議

立即在非生產環境中測試 GPT-5.4,特別評估 Computer Use 能力對現有 Agent 工作流程的影響。若您的應用需要長文件處理或多步驟任務執行,這是重大升級機會。注意監控 token 使用量,避免意外觸發超 272K 的高費率區間。

來源: OpenAI 官方公告 (官方) | TechCrunch (新聞) | OpenAI API 文件 (文檔)

OpenAI 收購 AI 安全平台 Promptfoo,整合至 Frontier 平台 L1

信心度:

重點: OpenAI 於 3 月 9 日宣布收購 AI 安全測試平台 Promptfoo。Promptfoo 成立於 2024 年,已服務超過 35 萬名開發者,130K 月活躍用戶,Fortune 500 企業中超過 25% 使用其服務。收購完成後,Promptfoo 的技術將整合至 OpenAI Frontier(AI 代理人構建平台),為企業提供自動化安全測試與紅隊演練(Red Teaming)能力,能偵測提示注入(Prompt Injection)、越獄、資料洩漏、工具濫用等威脅。重要的是,Promptfoo 工具將持續保持開源。

影響: 使用 OpenAI Frontier 平台的企業開發者將直接受益,安全測試能力將成為平台原生功能。對於所有開發 AI Agent 的開發者而言,這標誌著 AI 安全測試正在走向標準化。開源社群的 Promptfoo 工具不受影響,承諾繼續維護。

詳細分析

取捨考量

優點:

  • AI 安全測試成為 Frontier 平台原生能力,無需額外集成
  • Promptfoo 保持開源,社群可繼續使用
  • 對抗提示注入、越獄等 Agent 安全威脅的能力大幅提升

缺點:

  • 收購條款未公開
  • 整合時間表尚不明確,近期可能無法立即使用新功能
  • 非 Frontier 平台用戶暫時無法享受整合後的好處

快速體驗(5-15 分鐘)

  1. 立即使用開源版 Promptfoo 進行 AI 安全測試:npm install -g promptfoo
  2. 嘗試 Promptfoo 的 Red Team 功能:promptfoo redteam init
  3. 關注 OpenAI Frontier 平台更新,以了解整合進度

建議

現在開始熟悉 Promptfoo 的開源工具,及早建立 AI 安全測試流程。隨著 AI Agent 應用越來越普遍,安全測試將成為必要步驟。這次收購也表明 OpenAI 將把安全測試提升為一等公民功能。

來源: OpenAI 官方公告 (官方) | TechCrunch (新聞) | Promptfoo 官方部落格 (官方)

OpenAI Codex Security 開放研究預覽:AI 代理人自動發現程式碼漏洞 L1

信心度:

重點: OpenAI 於 3 月 6 日推出 Codex Security 研究預覽版,這是一個能對整個程式碼庫進行深度上下文分析的 AI 安全代理人,可識別其他工具遺漏的複雜漏洞。目前免費試用 1 個月,提供給 ChatGPT Pro、Enterprise、Business 和 Edu 用戶。測試數據顯示:掃描了 120 萬個 commits,識別 792 個嚴重漏洞和 10,561 個高危漏洞,其中 14 個已被記錄在 CVE 資料庫。假陽性率已下降超過 50%,誤報高危漏洞減少超過 90%。

影響: 使用 ChatGPT Pro/Enterprise/Business/Edu 的開發者和安全團隊可立即使用。AI 安全代理人能大幅加速程式碼審查效率,特別適合開源項目和企業代碼庫的安全審計。這是繼 Anthropic 幫助 Mozilla 發現 Firefox 漏洞後,又一個 AI 輔助安全的重要里程碑。

詳細分析

取捨考量

優點:

  • 目前免費試用 1 個月(Pro/Enterprise/Business/Edu)
  • 能發現傳統工具遺漏的複雜漏洞,包含專案特定威脅建模
  • 假陽性率低,不會產生大量雜訊
  • 直接生成修補建議,減少人工介入

缺點:

  • 僅限 Pro、Enterprise、Business、Edu 訂閱用戶,免費用戶無法使用
  • 目前為研究預覽版,可能存在限制
  • 需要對 OpenAI 的程式碼分析有一定信任度(將程式碼送至 OpenAI 分析)

快速體驗(5-15 分鐘)

  1. 前往 ChatGPT → Codex → Codex Security(需 Pro/Enterprise 帳號)
  2. 連接 GitHub 倉庫並設定掃描範圍
  3. 查看生成的威脅模型並根據需要調整
  4. 執行掃描並審閱高信心度的漏洞報告

建議

如果您是 ChatGPT Pro 或 Enterprise 用戶,立即在試用期內測試 Codex Security。建議先在非關鍵的開源項目上試用,了解其威脅建模與漏洞分類的準確性,再考慮引入商業代碼庫的安全審計流程。

來源: OpenAI 官方公告 (官方) | The Hacker News (新聞)

🟠 L2 - 重要更新

ChatGPT for Excel 正式推出,整合金融數據服務 L2

信心度:

重點: OpenAI 發布 ChatGPT for Excel 插件,帶入 GPT-5.4 能力,可用自然語言建立、更新和分析試算表,並整合 FactSet、Dow Jones Factiva、LSEG、S&P Global 等金融數據服務。目前開放給美國、加拿大、澳洲的 Plus、Team、Enterprise 和 Edu 用戶。Google Sheets 版本也在規劃中。

影響: 金融、商業分析師等 Excel 重度用戶可大幅加速工作流程。投資銀行內部基準測試顯示,準確率從 GPT-5 的 43.7% 提升至 GPT-5.4 Thinking 的 87.3%。

詳細分析

取捨考量

優點:

  • 自然語言操作 Excel,不需學習複雜公式
  • 直接整合金融數據源(FactSet、LSEG 等)

缺點:

  • 目前僅限三個國家,企業台灣用戶暫無法使用
  • 需要 Plus 以上訂閱

快速體驗(5-15 分鐘)

  1. 前往 Microsoft AppSource 搜索 ChatGPT for Excel
  2. 安裝插件並使用 OpenAI 帳號登入
  3. 嘗試:「分析 A 欄到 D 欄的銷售趨勢並生成預測」

建議

若您的工作涉及大量財務模型或數據分析,這值得在 Plus 訂閱下試用。注意目前地區限制,台灣用戶可能需要等待後續展開。

來源: OpenAI 官方公告 (官方) | VentureBeat (新聞)

Hugging Face LeRobot v0.5.0:機器人 AI 最大版本更新,支援人形機器人 L2

信心度:

重點: Hugging Face 發布 LeRobot v0.5.0,是迄今最大的版本更新(200+ PR、50+ 新貢獻者)。新增 Unitree G1 人形機器人支援(首個人形機器人)、6 種新策略包括 Pi0-FAST 和 Real-Time Chunking、10x 更快的圖像訓練速度、3x 更快的編碼速度,以及 EnvHub 讓用戶直接從 Hugging Face Hub 載入模擬環境。需要 Python 3.12+ 和 Transformers v5。

影響: 機器人研究者和開發者可獲得更多硬體支援和更快的訓練流程。NVIDIA IsaacLab-Arena 整合讓 GPU 加速模擬成為可能。需要注意 Python 3.12+ 升級要求。

詳細分析

取捨考量

優點:

  • 支援更多機器人硬體(Unitree G1 人形、Earth Rover 移動機器人)
  • 10x 更快的訓練速度
  • 插件系統讓社群可擴展自定義策略

缺點:

  • 需要升級到 Python 3.12+ 和 Transformers v5,現有環境需遷移
  • 部分新硬體整合仍在實驗階段

快速體驗(5-15 分鐘)

  1. 升級環境:pip install lerobot>=0.5.0(需 Python 3.12+)
  2. 嘗試新策略:lerobot-train --policy.type=pi0_fast
  3. 使用 EnvHub:lerobot-train --env.type=hub --env.hub_path="username/my-custom-env"

建議

機器人 AI 研究者應更新至 v0.5.0,特別是需要人形機器人支援或更快訓練速度的項目。注意提前規劃 Python 和 Transformers 的升級遷移工作。

來源: Hugging Face 官方部落格 (官方)