導讀:OpenAI CEO Sam Altman罕見公開表態,最新模型GPT-5.4在計算機使用和經濟價值任務上實現重大跨越,并斷言AI發展遠未觸及天花板。
人工智能領域的競爭格局正在發生微妙而深刻的變化。當業界還在爭論大模型是否已逼近能力上限時,OpenAI首席執行官Sam Altman用一條簡潔有力的推文打破了沉默。他轉發了關于GPT-5.4的技術評估,并給出了兩個關鍵判斷:一是新模型在"計算機使用"(computer use)和"經濟價值任務"(GDPval)方面實現了顯著提升;二是明確表示"我們沒有看到墻"(We see no wall),預測今年AI能力將繼續"戲劇性增長"(increase dramatically)。
![]()
這番表態的時機耐人尋味。過去數月,關于大模型是否遭遇"縮放定律"瓶頸的討論持續升溫,部分研究者認為單純堆砌算力和數據帶來的邊際收益正在遞減。Altman的回應不僅是對GPT-5.4技術實力的背書,更是對行業悲觀論調的直接反駁。
「計算機使用」能力躍遷:從對話工具到數字代理
GPT-5.4最引人注目的突破在于「計算機使用」能力的實質性提升。這一術語在AI領域特指模型操作圖形界面、執行多步驟軟件任務的能力——本質上是從"能說話"到"能動手"的跨越。
回顧OpenAI的技術路線,計算機使用能力一直是其重點攻關方向。2024年10月,OpenAI首次向公眾展示"Operator"功能,允許ChatGPT控制瀏覽器完成訂票、購物等任務。但早期版本存在明顯局限:操作速度慢、容錯率低、復雜任務容易中斷。GPT-5.4的進步意味著這些瓶頸可能已被顯著突破。
技術層面的具體改進尚未完全公開,但結合行業趨勢可以推斷,新模型在視覺理解、UI元素定位、長程任務規劃等關鍵環節應有重大優化。更值得關注的是,Altman將這一能力與"經濟價值任務"并列強調,暗示OpenAI正在重新校準其產品戰略——從追求通用智能的炫技,轉向創造可量化的商業回報。
「GDPval」指標:AI價值評估的新標尺
Altman推文中使用的"GDPval"一詞值得深究。這是OpenAI內部或關聯研究中采用的特定指標,用于衡量AI系統在執行任務時創造的經濟價值,并將其與全球GDP的貢獻進行對標。這一框架的提出,反映出AI行業評估體系的深層轉變。
傳統的大模型評測依賴學術基準測試,如MMLU(多任務語言理解)、HumanEval(代碼能力)等。但這些指標與真實商業場景存在脫節——一個模型可能在考試中拿高分,卻無法為企業節省成本或創造收入。GDPval試圖建立更直接的因果鏈條:AI完成的具體任務→替代或增強的人類勞動→可計算的宏觀經濟影響。
Altman聲稱GPT-5.4在這一指標上實現"重大提升",意味著OpenAI可能已經驗證了模型在真實工作流中的部署效果。這與該公司近年的商業化節奏高度吻合:ChatGPT企業版用戶突破百萬,與微軟、Salesforce等巨頭的集成不斷深入,定制化AI代理服務成為新的收入增長點。當技術評估與財務表現掛鉤,AI競賽的規則正在被改寫。
「沒有墻」:對縮放定律爭議的直接回應
Altman的第二個判斷——「我們沒有看到墻」——針對性極強。2024年以來,關于大模型發展是否觸及物理極限的爭論愈演愈烈。核心爭議在于:隨著模型參數規模擴大,訓練所需的算力和能源呈指數級增長,但能力增益是否仍在同步提升?
部分研究給出了謹慎甚至悲觀的信號。2024年6月,Epoch AI發表的分析指出,高質量文本數據可能在2026年至2032年間耗盡;同期,多位OpenAI前研究員離職創業,公開質疑預訓練路線的可持續性。更廣泛的擔憂在于,當前架構下的"涌現能力"可能已接近天花板,需要范式級別的突破才能繼續推進。
Altman的表態顯然站在樂觀陣營。他使用的"dramatically"(戲劇性地)一詞,在英語語境中暗示非線性、跳躍式的進步,而非漸進改良。結合OpenAI近期的組織調整——包括將安全團隊并入研究主線、加速產品迭代周期——可以判斷該公司正處于技術釋放的關鍵窗口期。GPT-5.4可能只是序曲,更激進的模型更新已在 pipeline 之中。
行業格局前瞻:能力競賽與商業化的雙重加速
Altman的推文雖短,卻釋放了多重信號。首先,OpenAI正在重新定義技術領先的內涵:不僅是基準測試的分數,更是可部署、可量化、可擴展的實用能力。其次,"今年繼續戲劇性增長"的預測,實質是對競爭對手的施壓——Anthropic的Claude 3.5、谷歌的Gemini 2.0、xAI的Grok 3均在緊追不舍,OpenAI需要維持節奏主動權。
更深層的變量在于監管與地緣環境。美國新一屆政府對AI產業的態度趨于寬松,可能加速前沿模型的釋放;但歐盟《人工智能法案》的合規成本、芯片出口管制的持續收緊,又為全球擴張蒙上陰影。Altman選擇此時發聲,亦有爭取政策話語空間的考量。
對企業和開發者而言,GPT-5.4的升級意味著"AI員工"從概念驗證走向規模應用的臨界點正在逼近。當模型能夠可靠地操作軟件系統、完成具有經濟價值的任務,組織重構的壓力將遠大于技術采納的意愿。那些提前布局人機協作流程的企業,可能在未來12至18個月內獲得顯著的效率紅利;而觀望者或將面臨更陡峭的追趕曲線。
技術樂觀主義與商業現實主義在此交匯。Altman的斷言能否兌現,取決于GPT-5.4及后續模型的實際表現,但一個趨勢已清晰可見:AI能力的增長曲線尚未平緩,而衡量成功的標準正在從"更聰明"轉向"更有用"。這場競賽的下一階段,勝負手或許不在實驗室,而在真實經濟的毛細血管之中。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.