2026-03-10 AI 摘要

共 5 則更新

🔴 L1 - 平台級更新

OpenAI 發布 GPT-5.4：原生電腦操控能力與百萬 Token 上下文 L1

信心度: 高

重點: OpenAI 於 3 月 5 日正式發布 GPT-5.4，這是其最新旗艦模型。GPT-5.4 是首個整合原生電腦操控（Computer Use）能力的通用模型，支援高達 1M token 的上下文視窗（實驗性功能需手動啟用，標準為 272K），並將 GPT-5.3-codex 的前沿程式碼能力整合進主線模型。API 定價為 $2.50/1M 輸入 tokens、$20.00/1M 輸出 tokens，緩存輸入為 $0.625/1M。同時推出 GPT-5.4 Thinking（推理版）與 GPT-5.4 Pro（高效能版）。

影響: 所有使用 OpenAI API 的開發者都受到影響。GPT-5.4 將成為 API 預設旗艦模型。電腦操控能力讓 AI Agent 可在軟體環境中執行複雜工作流程。效率提升顯著——解決同等問題所需 token 量明顯減少。在 OpenAI 內部投資銀行基準測試中，GPT-5.4 Thinking 的準確率從 GPT-5 的 43.7% 躍升至 87.3%。

詳細分析

取捨考量

優點:

原生電腦操控能力，無需額外工具即可讓 Agent 操作應用程式
1M token 上下文視窗，適合長文件分析與長時程任務執行
$2.50/1M 輸入 token 定價在旗艦模型中具有競爭力
整合最先進的程式碼能力
Thinking 模式支援中途調整思考方向

缺點:

1M token 上下文為實驗性功能，需手動配置，超過 272K 的部分費率加倍
GPT-5.4 Thinking 版本推理成本較高
從 GPT-5.2 升級可能需要測試現有 prompt 是否需要調整

快速體驗（5-15 分鐘）

在 OpenAI API 中將模型切換為 gpt-5.4
測試 Computer Use 能力：使用 computer_20250124 工具類型
啟用 1M 上下文：設定 model_context_window 與 model_auto_compact_token_limit 參數
體驗 ChatGPT 中的 GPT-5.4 Thinking 中途計畫調整功能

建議

立即在非生產環境中測試 GPT-5.4，特別評估 Computer Use 能力對現有 Agent 工作流程的影響。若您的應用需要長文件處理或多步驟任務執行，這是重大升級機會。注意監控 token 使用量，避免意外觸發超 272K 的高費率區間。

來源: OpenAI 官方公告 (官方) | TechCrunch (新聞) | OpenAI API 文件 (文檔)

OpenAI 收購 AI 安全平台 Promptfoo，整合至 Frontier 平台 L1

信心度: 高

重點: OpenAI 於 3 月 9 日宣布收購 AI 安全測試平台 Promptfoo。Promptfoo 成立於 2024 年，已服務超過 35 萬名開發者，130K 月活躍用戶，Fortune 500 企業中超過 25% 使用其服務。收購完成後，Promptfoo 的技術將整合至 OpenAI Frontier（AI 代理人構建平台），為企業提供自動化安全測試與紅隊演練（Red Teaming）能力，能偵測提示注入（Prompt Injection）、越獄、資料洩漏、工具濫用等威脅。重要的是，Promptfoo 工具將持續保持開源。

影響: 使用 OpenAI Frontier 平台的企業開發者將直接受益，安全測試能力將成為平台原生功能。對於所有開發 AI Agent 的開發者而言，這標誌著 AI 安全測試正在走向標準化。開源社群的 Promptfoo 工具不受影響，承諾繼續維護。

詳細分析

取捨考量

優點:

AI 安全測試成為 Frontier 平台原生能力，無需額外集成
Promptfoo 保持開源，社群可繼續使用
對抗提示注入、越獄等 Agent 安全威脅的能力大幅提升

缺點:

收購條款未公開
整合時間表尚不明確，近期可能無法立即使用新功能
非 Frontier 平台用戶暫時無法享受整合後的好處

快速體驗（5-15 分鐘）

立即使用開源版 Promptfoo 進行 AI 安全測試：npm install -g promptfoo
嘗試 Promptfoo 的 Red Team 功能：promptfoo redteam init
關注 OpenAI Frontier 平台更新，以了解整合進度

建議

現在開始熟悉 Promptfoo 的開源工具，及早建立 AI 安全測試流程。隨著 AI Agent 應用越來越普遍，安全測試將成為必要步驟。這次收購也表明 OpenAI 將把安全測試提升為一等公民功能。

來源: OpenAI 官方公告 (官方) | TechCrunch (新聞) | Promptfoo 官方部落格 (官方)

OpenAI Codex Security 開放研究預覽：AI 代理人自動發現程式碼漏洞 L1

信心度: 高

重點: OpenAI 於 3 月 6 日推出 Codex Security 研究預覽版，這是一個能對整個程式碼庫進行深度上下文分析的 AI 安全代理人，可識別其他工具遺漏的複雜漏洞。目前免費試用 1 個月，提供給 ChatGPT Pro、Enterprise、Business 和 Edu 用戶。測試數據顯示：掃描了 120 萬個 commits，識別 792 個嚴重漏洞和 10,561 個高危漏洞，其中 14 個已被記錄在 CVE 資料庫。假陽性率已下降超過 50%，誤報高危漏洞減少超過 90%。

影響: 使用 ChatGPT Pro/Enterprise/Business/Edu 的開發者和安全團隊可立即使用。AI 安全代理人能大幅加速程式碼審查效率，特別適合開源項目和企業代碼庫的安全審計。這是繼 Anthropic 幫助 Mozilla 發現 Firefox 漏洞後，又一個 AI 輔助安全的重要里程碑。

詳細分析

取捨考量

優點:

目前免費試用 1 個月（Pro/Enterprise/Business/Edu）
能發現傳統工具遺漏的複雜漏洞，包含專案特定威脅建模
假陽性率低，不會產生大量雜訊
直接生成修補建議，減少人工介入

缺點:

僅限 Pro、Enterprise、Business、Edu 訂閱用戶，免費用戶無法使用
目前為研究預覽版，可能存在限制
需要對 OpenAI 的程式碼分析有一定信任度（將程式碼送至 OpenAI 分析）

快速體驗（5-15 分鐘）

前往 ChatGPT → Codex → Codex Security（需 Pro/Enterprise 帳號）
連接 GitHub 倉庫並設定掃描範圍
查看生成的威脅模型並根據需要調整
執行掃描並審閱高信心度的漏洞報告

建議

如果您是 ChatGPT Pro 或 Enterprise 用戶，立即在試用期內測試 Codex Security。建議先在非關鍵的開源項目上試用，了解其威脅建模與漏洞分類的準確性，再考慮引入商業代碼庫的安全審計流程。

來源: OpenAI 官方公告 (官方) | The Hacker News (新聞)

🟠 L2 - 重要更新

ChatGPT for Excel 正式推出，整合金融數據服務 L2

信心度: 高

重點: OpenAI 發布 ChatGPT for Excel 插件，帶入 GPT-5.4 能力，可用自然語言建立、更新和分析試算表，並整合 FactSet、Dow Jones Factiva、LSEG、S&P Global 等金融數據服務。目前開放給美國、加拿大、澳洲的 Plus、Team、Enterprise 和 Edu 用戶。Google Sheets 版本也在規劃中。

影響: 金融、商業分析師等 Excel 重度用戶可大幅加速工作流程。投資銀行內部基準測試顯示，準確率從 GPT-5 的 43.7% 提升至 GPT-5.4 Thinking 的 87.3%。

詳細分析

取捨考量

優點:

自然語言操作 Excel，不需學習複雜公式
直接整合金融數據源（FactSet、LSEG 等）

缺點:

目前僅限三個國家，企業台灣用戶暫無法使用
需要 Plus 以上訂閱

快速體驗（5-15 分鐘）

前往 Microsoft AppSource 搜索 ChatGPT for Excel
安裝插件並使用 OpenAI 帳號登入
嘗試：「分析 A 欄到 D 欄的銷售趨勢並生成預測」

建議

若您的工作涉及大量財務模型或數據分析，這值得在 Plus 訂閱下試用。注意目前地區限制，台灣用戶可能需要等待後續展開。

來源: OpenAI 官方公告 (官方) | VentureBeat (新聞)

Hugging Face LeRobot v0.5.0：機器人 AI 最大版本更新，支援人形機器人 L2

信心度: 高

重點: Hugging Face 發布 LeRobot v0.5.0，是迄今最大的版本更新（200+ PR、50+ 新貢獻者）。新增 Unitree G1 人形機器人支援（首個人形機器人）、6 種新策略包括 Pi0-FAST 和 Real-Time Chunking、10x 更快的圖像訓練速度、3x 更快的編碼速度，以及 EnvHub 讓用戶直接從 Hugging Face Hub 載入模擬環境。需要 Python 3.12+ 和 Transformers v5。

影響: 機器人研究者和開發者可獲得更多硬體支援和更快的訓練流程。NVIDIA IsaacLab-Arena 整合讓 GPU 加速模擬成為可能。需要注意 Python 3.12+ 升級要求。

詳細分析

取捨考量

優點:

支援更多機器人硬體（Unitree G1 人形、Earth Rover 移動機器人）
10x 更快的訓練速度
插件系統讓社群可擴展自定義策略

缺點:

需要升級到 Python 3.12+ 和 Transformers v5，現有環境需遷移
部分新硬體整合仍在實驗階段

快速體驗（5-15 分鐘）

升級環境：pip install lerobot>=0.5.0（需 Python 3.12+）
嘗試新策略：lerobot-train --policy.type=pi0_fast
使用 EnvHub：lerobot-train --env.type=hub --env.hub_path="username/my-custom-env"

建議

機器人 AI 研究者應更新至 v0.5.0，特別是需要人形機器人支援或更快訓練速度的項目。注意提前規劃 Python 和 Transformers 的升級遷移工作。

來源: Hugging Face 官方部落格 (官方)

`?`	顯示此說明
`f`	聚焦公司篩選
`t`	聚焦等級篩選
`Esc`	關閉彈窗