網易首頁 > 網易號 > 正文申請入駐

GPT-5.4發布：Sam Altman稱"沒有墻"，AI能力今年將"戲劇性提升"

2026-03-18 18:18:40　來源: 字節漫游指南

北京舉報

分享至

導讀：OpenAI CEO Sam Altman罕見公開表態，最新模型GPT-5.4在計算機使用和經濟價值任務上實現重大跨越，并斷言AI發展遠未觸及天花板。

人工智能領域的競爭格局正在發生微妙而深刻的變化。當業界還在爭論大模型是否已逼近能力上限時，OpenAI首席執行官Sam Altman用一條簡潔有力的推文打破了沉默。他轉發了關于GPT-5.4的技術評估，并給出了兩個關鍵判斷：一是新模型在"計算機使用"（computer use）和"經濟價值任務"（GDPval）方面實現了顯著提升；二是明確表示"我們沒有看到墻"（We see no wall），預測今年AI能力將繼續"戲劇性增長"（increase dramatically）。

這番表態的時機耐人尋味。過去數月，關于大模型是否遭遇"縮放定律"瓶頸的討論持續升溫，部分研究者認為單純堆砌算力和數據帶來的邊際收益正在遞減。Altman的回應不僅是對GPT-5.4技術實力的背書，更是對行業悲觀論調的直接反駁。

「計算機使用」能力躍遷：從對話工具到數字代理

GPT-5.4最引人注目的突破在于「計算機使用」能力的實質性提升。這一術語在AI領域特指模型操作圖形界面、執行多步驟軟件任務的能力——本質上是從"能說話"到"能動手"的跨越。

回顧OpenAI的技術路線，計算機使用能力一直是其重點攻關方向。2024年10月，OpenAI首次向公眾展示"Operator"功能，允許ChatGPT控制瀏覽器完成訂票、購物等任務。但早期版本存在明顯局限：操作速度慢、容錯率低、復雜任務容易中斷。GPT-5.4的進步意味著這些瓶頸可能已被顯著突破。

技術層面的具體改進尚未完全公開，但結合行業趨勢可以推斷，新模型在視覺理解、UI元素定位、長程任務規劃等關鍵環節應有重大優化。更值得關注的是，Altman將這一能力與"經濟價值任務"并列強調，暗示OpenAI正在重新校準其產品戰略——從追求通用智能的炫技，轉向創造可量化的商業回報。

「GDPval」指標：AI價值評估的新標尺

Altman推文中使用的"GDPval"一詞值得深究。這是OpenAI內部或關聯研究中采用的特定指標，用于衡量AI系統在執行任務時創造的經濟價值，并將其與全球GDP的貢獻進行對標。這一框架的提出，反映出AI行業評估體系的深層轉變。

傳統的大模型評測依賴學術基準測試，如MMLU（多任務語言理解）、HumanEval（代碼能力）等。但這些指標與真實商業場景存在脫節——一個模型可能在考試中拿高分，卻無法為企業節省成本或創造收入。GDPval試圖建立更直接的因果鏈條：AI完成的具體任務→替代或增強的人類勞動→可計算的宏觀經濟影響。

Altman聲稱GPT-5.4在這一指標上實現"重大提升"，意味著OpenAI可能已經驗證了模型在真實工作流中的部署效果。這與該公司近年的商業化節奏高度吻合：ChatGPT企業版用戶突破百萬，與微軟、Salesforce等巨頭的集成不斷深入，定制化AI代理服務成為新的收入增長點。當技術評估與財務表現掛鉤，AI競賽的規則正在被改寫。

「沒有墻」：對縮放定律爭議的直接回應

Altman的第二個判斷——「我們沒有看到墻」——針對性極強。2024年以來，關于大模型發展是否觸及物理極限的爭論愈演愈烈。核心爭議在于：隨著模型參數規模擴大，訓練所需的算力和能源呈指數級增長，但能力增益是否仍在同步提升？

部分研究給出了謹慎甚至悲觀的信號。2024年6月，Epoch AI發表的分析指出，高質量文本數據可能在2026年至2032年間耗盡；同期，多位OpenAI前研究員離職創業，公開質疑預訓練路線的可持續性。更廣泛的擔憂在于，當前架構下的"涌現能力"可能已接近天花板，需要范式級別的突破才能繼續推進。

Altman的表態顯然站在樂觀陣營。他使用的"dramatically"（戲劇性地）一詞，在英語語境中暗示非線性、跳躍式的進步，而非漸進改良。結合OpenAI近期的組織調整——包括將安全團隊并入研究主線、加速產品迭代周期——可以判斷該公司正處于技術釋放的關鍵窗口期。GPT-5.4可能只是序曲，更激進的模型更新已在 pipeline 之中。

行業格局前瞻：能力競賽與商業化的雙重加速

Altman的推文雖短，卻釋放了多重信號。首先，OpenAI正在重新定義技術領先的內涵：不僅是基準測試的分數，更是可部署、可量化、可擴展的實用能力。其次，"今年繼續戲劇性增長"的預測，實質是對競爭對手的施壓——Anthropic的Claude 3.5、谷歌的Gemini 2.0、xAI的Grok 3均在緊追不舍，OpenAI需要維持節奏主動權。

更深層的變量在于監管與地緣環境。美國新一屆政府對AI產業的態度趨于寬松，可能加速前沿模型的釋放；但歐盟《人工智能法案》的合規成本、芯片出口管制的持續收緊，又為全球擴張蒙上陰影。Altman選擇此時發聲，亦有爭取政策話語空間的考量。

對企業和開發者而言，GPT-5.4的升級意味著"AI員工"從概念驗證走向規模應用的臨界點正在逼近。當模型能夠可靠地操作軟件系統、完成具有經濟價值的任務，組織重構的壓力將遠大于技術采納的意愿。那些提前布局人機協作流程的企業，可能在未來12至18個月內獲得顯著的效率紅利；而觀望者或將面臨更陡峭的追趕曲線。

技術樂觀主義與商業現實主義在此交匯。Altman的斷言能否兌現，取決于GPT-5.4及后續模型的實際表現，但一個趨勢已清晰可見：AI能力的增長曲線尚未平緩，而衡量成功的標準正在從"更聰明"轉向"更有用"。這場競賽的下一階段，勝負手或許不在實驗室，而在真實經濟的毛細血管之中。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.