4月15日消息,美國時間周二,OpenAI發布其最新旗艦人工智能模型的變體GPT-5.4-Cyber。該模型專為防御性網絡安全任務進行微調。
就在4月7日,Anthropic剛剛推出前沿AI模型Mythos,并在其Project Glasswing下進行內測。該計劃采取定向邀請制,授權特定機構將Claude Mythos預覽版應用于網絡防御。據悉,Mythos現已在各大操作系統、瀏覽器及底層軟件中排查出數千個高危漏洞。
針對GPT-5.4-Cyber的發布,OpenAI表示,鑒于該模型的網絡操作權限更為寬松,初期將僅向通過審核的安全供應商、機構及研究人員進行定向開放。
該公司在官方聲明中指出,正將其“網絡安全信任訪問”(TAC)計劃的覆蓋范圍,擴大至數千名經身份驗證的個人安全專家及數百個負責關鍵軟件安全的團隊。OpenAI為今年2月啟動的TAC計劃增設了全新的分級訪問機制。通過最高等級審核的用戶將獲得GPT-5.4-Cyber的訪問權限,在處理漏洞研究與分析等敏感任務時,其受到的系統限制將顯著減少。
據介紹,GPT-5.4-Cyber放寬了模型針對合法網絡安全指令的拒絕邊界,并支持二進制逆向工程(Binary Reverse Engineering)等高級防御工作流。該功能允許安全專業人員在無源代碼的情況下,分析已編譯軟件,以探測潛在漏洞及惡意軟件風險。
然而,由于模型權限較高,OpenAI強調將采取有限且迭代的部署方式。在“零數據保留”(ZDR)等缺乏透明度的使用場景中,或通過第三方平臺訪問時,由于OpenAI無法直接監控用戶、運行環境及請求意圖,該模型的高級權限可能會受到限制。目前,個人用戶可通過官網驗證身份申請加入TAC計劃,企業用戶則可經由專屬代表為其團隊申請信任訪問權限。
應對能力進化:算力飆升下的防御升級
面對AI技術在網絡攻防兩端的雙向應用,OpenAI重申了其推進網絡防御計劃的三項核心原則:訪問權限普惠化、迭代部署與生態系統韌性。
OpenAI在聲明中特別警示,隨著黑客與防御者開始在現有模型上使用更多的“測試時算力”(test-time compute),結合復雜的提示詞框架,模型正被激發出越來越強的能力邊界。這意味著安全保障措施不能坐等未來的某個單一閾值,而必須與模型能力同步擴展。
在訪問權限方面,OpenAI計劃通過“了解你的客戶”(KYC)和身份驗證等客觀標準,決定高級功能的訪問歸屬,以確保合法機構能獲取先進防御能力,同時防范技術濫用。在部署策略上,公司將通過實際應用持續更新模型和安全系統,提升模型對抗“越獄”等對抗性攻擊的韌性。
根據OpenAI的“準備狀態框架”,基礎版GPT-5.4已被評估為具備“高”網絡攻防能力評級。回顧其技術路徑,該公司自GPT-5.2起便引入了針對網絡安全的特定訓練。為支持防御者生態,OpenAI此前發布了自動代碼審計工具Codex Security。數據顯示,該工具自發布以來,已協助開發者修復逾3000個關鍵及高危漏洞。
展望后續產品,OpenAI評估認為,現有的安全保障措施足以支撐當前模型的廣泛部署。但隨著未來AI模型能力逐步超越現有的專用工具,業界需要同步構建更為廣泛和嚴密的防御機制。(易句)
(本文由AI翻譯,網易編輯負責校對)
