本文將統一介紹OpenAI 的發展歷程,并討論其公司架構、技術演進、商業模式、財務和估值,以及對公司未來的思考,內含大量技術細節。
原文包含20多幅圖片,我給配了一些注釋,enjoy,歡迎點贊、關注和收藏。(之后我會更新一篇黃仁勛出道以來推薦過的書,這位老哥非常神奇,現年62歲、創業32年的他,似乎一共只推薦過7本書,但是本本經典,敬請期待。)
全文目錄1、前OpenAI時期(2015年之前) 2、OpenAI成立了 3、OpenAI的技術 4、OpenAI的商業模式 5、OpenAI的市場數據與競爭格局
6、OpenAI的未來
![]()
OpenAI 公司估值演變趨勢圖:此圖展示了 OpenAI 自 2015 年成立以來,估值隨時間推移的增長軌跡。從創立初期估值較低,到隨后呈指數級攀升。
1、前OpenAI時期 (2015年之前)
在前OpenAI 時期,也就是2015年之前,有三個重要因素為 OpenAI 的誕生奠定了基礎:
1.1 深度學習的興起
2012 年,Ilya Sutskever(OpenAI 前首席科學家,現 Safe Superintelligence 創始人)、Alex Krizhevsky 和“人工智能教父”Geoff Hinton 組成的團隊在一次競賽中大幅刷新了此前的基準成績。
![]()
2010–2015 年 ImageNet 圖像識別競賽冠軍模型錯誤率對比圖,該圖比較了ImageNet挑戰賽各年度獲勝模型的分類錯誤率(Error Rate),展示了 2012 年深度學習模型帶來的突破性進展。橫軸就是年份,縱軸表示錯誤率百分比,柱狀條高度代表當年冠軍模型在測試集中未能正確識別的比例,所以高度越低越好。
1.2 谷歌/Meta在AI 人才上的雙寡頭
在ImageNet大賽取得突破后,Facebook和Google圍繞AI人才幾乎形成了雙寡頭格局。最終,Google收購DeepMind,讓整個硅谷的從業者感到擔憂。這其中,尤其有兩個人對此不以為然,他們想要打造一個不同的選擇:一家致力于非營利AI研究的實驗室。
這兩個人就是Elon Musk和Sam Altman。
1.3 Sam Altman的崛起
隨著ChatGPT時刻的到來,Sam Altman成為OpenAI的首席執行官,并一直是公司對外的代表人物。在此之前,他曾出任創業孵化器Y Combinator的總裁,并且是Paul Graham(也是黑客與畫家的作者)最為賞識的創業者之一。
Graham曾說:“有人建議我在這個榜單里不要提及YC資助的創業者。但這樣的規矩對Sam Altman可不適用。只要他想上榜,他就一定會上榜坦白說,Sam和Steve Jobs一樣,都是我在指導初創公司時提及最多的創業者。在設計相關的問題上,我會問‘Steve會怎么做?’,但在考慮戰略與雄心的問題上,我會問‘Sam會怎么做?’。與Sam見面后,我意識到“天選之人”這一觀念,同樣適用于創業領域,但它的適用范圍遠比大多數人想象的小,投資創業公司并不是賽馬式地挑選贏家。但的確有極少數人,憑借堅定的意志力,終將獲得他們想要的一切。——Paul Graham,《Five Founders》)
上述三個要素,分別提供了技術突破、促成了創建一個抗衡谷歌/FB的實驗室的理由,并聚攏到了一位有能力引領這一全新事業的人才。然后,這一切匯聚到了一場如今已頗具傳奇色彩的聚會,它發生在硅谷著名的Sand Hill Road上的Rosewood酒店里。(一些細節可見這篇文章:)
2、OpenAI 的成立
正是在那次晚宴上,Elon和Sam向在座的頂尖AI研究人員提出了創建OpenAI的計劃。其中有一人,尤其被這個想法所吸引:Ilya Sutskever(被譽為OpenAI的“AI 天才”)。
不久之后,Ilya便與Greg Brockman(被稱為OpenAI的“埋頭實干者”)一起成為OpenAI的兩位主要領導者,并獲得了Elon Musk、Peter Thiel、Reid Hoffman等人合計 10 億美元的資金支持,Elon和Sam則共同出任董事會聯席主席。
當時,OpenAI的核心理念很明確:人工智能可能徹底改變世界,在這種情況下,讓一家不受盈利驅動的機構來開發這項技術對人類整體最為有利。
OpenAI創立初期的幾年,以大量試驗探索為標志,推出了一系列項目:OpenAI Gym(面向強化學習的工具包)、OpenAI Universe(構建虛擬環境中的AI)、OpenAI Five(挑戰Dota 2的AI代理),以及 OpenAI Dactyl(機械手機器人)。
2.1 Transformer 的出現
2017 年,谷歌發布了著名的論文《Attention Is All You Need》(《注意力機制就是一切》),首次提出了Transformer架構。
Ilya 對這一突破的重要性,立刻就有了感知,他當時的反應非常肯定。
這里先大致介紹一下原理,Transformer真正的突破,在于能夠將上下文納入模型輸出的考量。它通過計算詞語與其周圍其他詞語之間的“相關性”,以及它們在句子中的相對位置,并將這些信息與該詞的表示一起存儲,從而讓模型更好地理解上下文含義。
它的目標是將初始輸入數據,轉換為一系列向量,這些向量蘊含了輸入數據的語義信息,然后根據這些語義向量來預測下一個詞出現的概率。
![]()
Transformer 神經網絡架構(簡化示意),編碼器-解碼器結構,以及通過“注意力機制”融入上下文信息的工作原理。圖中左側是編碼器(Encoder),接受輸入序列的詞向量表示(加上位置編碼),并經過多層自注意力(Self-Attention)和前饋網絡逐步提取特征;右側是解碼器(Decoder),利用編碼器生成的表示和解碼器自身先前輸出,通過多頭注意力機制,來預測輸出序列的下一個單詞。
注意力(Attention)模塊通過計算詞與詞之間的相關性權重矩陣,使模型在生成某個詞時,能夠參考輸入序列中所有其他詞的重要程度。
例如,對于詞 “float”,模型可以根據上下文判斷它指的是“漂浮”(float on water)、“汽水冰淇淋”(root beer float)、“游行花車”(parade float)還是“飄飄然”(floating on cloud nine)。
Transformer模型的幾個核心階段包括:
1、輸入階段:tokens首先轉為Input Embedding(向量表示),同時加入Positional Encodings,以標記tokens在序列中的位置;
2、Encoder(編碼器),由多層Self AttentionFeed Forward組成,作用是理解整段輸入的上下文關系,生成富含語義的內部表示;
3、Decoder(解碼器):同樣堆疊 Self Attention 和 Feed Forward,在預測下一個詞時會參考編碼器的輸出,作用是基于編碼器的表示逐步生成目標序列,如翻譯內容或續寫文本;
4、輸出階段:解碼器輸出經Softmax轉為各候選詞的概率分布,選取概率最高的詞作為下一個輸出。生成序列會循環進行,直至滿足終止條件。
上圖突出了Transformer 的兩大關鍵:自注意力機制(Self Attention)使模型能同時關注整個序列的相關信息,而位置編碼Positional Encodings補足序列順序,讓模型理解詞語先后關系。
Transformer架構的關鍵,在于并行地處理整個序列,而不是逐詞翻譯,從而極大提高了效率和效果。這個架構為OpenAI此后的GPT系列模型奠定了基礎,是實現更深層次語言理解的里程碑,體現了 Transformer在上下文處理上的革命性突破。
Transformer的出現,為OpenAI在 2018 年發表的論文《Improving Language Understanding by Generative Pre-Training》中取得的突破奠定了基礎,那篇論文首次引入了 GPT-1 模型。
正如 Sam Altman所總結的那樣,這一突破意味著“人類發現了一種算法,能夠真正地學習任何數據分布,更確切地說,學習生成任何數據分布的底層規則”。
然而,Transformer中的“注意力機制”,極大地提高了計算需求,進而引發了對“規模化scaling”的探索。
后來的事實證明,增加模型參數規模和訓練數據量,模型性能就能以可預期的方式提升。
2.2 從非營利到營利的轉變(2019–2022)
毋庸置疑,OpenAI 從非營利組織慢慢轉變為營利公司的過程,引起了許多爭議。這一轉變,也導致 Elon Musk 與 OpenAI 分道揚鑣。
然而,“規模化scaling”這一發現,算是把OpenAI逼到了墻角。要利用擴大模型規模帶來的性能提升,就必須投入巨額資源,而吸引巨額資金的唯一途徑,就是給予巨額的財務回報。
2019 年,OpenAI 轉型為一家“封頂盈利”(capped-profit)的公司,并從微軟等投資者那里募集了 10 億美元。這一架構下,非營利的 OpenAI 組織管理著一個有盈利上限的營利公司:![]()
OpenAI 非營利組織與封頂盈利公司結構示意圖,這張圖描述了 OpenAI 獨特的雙層架構:頂層是非營利性的 OpenAI Inc.(公益機構),其下設立了一個封頂利潤的營利實體 OpenAI Global LLC( OpenAI LP)。OpenAI Inc. 通過特殊的公司結構完全控制著營利實體 OpenAI LP 的決策,外部投資者(如微軟等)可以向 OpenAI LP 投資,但他們的回報被限制在約定上限(例如利潤的若干倍)以內,超過上限的收益歸 OpenAI 非營利組織所有。
有了這筆新資金的支撐,OpenAI 開始迅猛發展。2020 年,他們發布了 GPT-3。2021 年,推出了 Codex(GitHub Copilot 背后的模型),同年還發布了 DALL-E。他們還再次從微軟獲得了 10 億美元投資。這一切最終將我們帶到了一個眾所周知的時刻——2022 年末 ChatGPT 的橫空出世,正是這個事件出乎意料地引爆了 AI 革命。
2.3Chat With GPT-3.5
Altman自己的原話是:“在 2022 年,OpenAI 還是一家默默無聞的研究實驗室,正在研究一個暫時稱為『Chat?With?GPT?3.5』的項目……我們一直都明白,總有一天會迎來一個臨界點,人工智能革命將就此啟動。只不過,我們不知道那個時刻究竟會以何種形式出現。讓我們驚訝的是,最后竟然是這一刻。”
值得稱道的是,微軟敏銳地抓住了這個機遇,豪擲 100 億美元投資 OpenAI。微軟隨即以最快速度將 OpenAI 的技術整合到自己幾乎所有的產品中,并將這項工作視作公司的頭號優先事項。
![]()
自那以后,圍繞 OpenAI 的故事已廣為人知:
OpenAI 已成為當代這場 AI 浪潮中當之無愧的標志性公司;
Sam Altman 一度離開 OpenAI,但不久后又重返公司;
OpenAI 正面臨來自 Anthropic、Meta、xAI、Google,以及崛起的 DeepSeek 等越來越多的競爭;
公司已獲得了數十億美元的融資,成為全球估值第三高的未上市公司;
他們發布了諸如 o3 等具備“推理”能力的模型,開辟了除規模擴張以外新的性能提升路徑;
截至 2024 年 12 月,ChatGPT 的用戶數量突破了 3 億。
據報道,公司此時的年度營收運行率(用短期收入外推到12個月收入)已達到約 40 億美元。
綜上所述,公司目前所面臨的局面是:
1、正處于開發通用型智能代理的臨界點;
2、面臨日益激烈的競爭,尤其是來自開源模型生態的挑戰;
3、正在努力平衡獨特的治理結構、建立可持續的商業模式,并推進“超級智能”的研發。
正如 Sam Altman 所說:“我們現在有信心知道如何構建傳統意義上所定義的 AGI。我們相信,在 2025 年,我們可能會看到首批 AI 智能體‘加入勞動力大軍’,對企業的產出帶來實質性改變。我們依然相信,反復將出色的工具交到人們手中,會帶來偉大且廣泛共享的成果。”
3、OpenAI 的技術
如果不把 AI 技術發展的來龍去脈講清楚,就很難解釋 LLM(大語言模型)的工作原理。
如果把AI的演進史高度概括,可以劃分出以下階段:提出 AI 概念 → 數十年研究積累 → 深度學習突破 → 注意力機制與 Transformer 出現 → 早期 LLM 面世 → ChatGPT 橫空出世 → 引入“推理”能力 → 誕生智能代理agent
3.1 AI 的根基和起源
人工智能的核心理念,是讓機器自動執行人類的常規任務,并最終逼近人類的智能水平。
從早期的計算器,到大型主機,再到軟件程序,都可以看作人工智能形態演進的縮影。計算技術的每一次飛躍,都讓我們更接近艾倫·圖靈對 AI 的最初設想:“我們想要的是一臺能夠從經驗中學習的機器……而讓機器自行改變其指令的可能性,為實現這一目標提供了機制。”
20 世紀 40 年代,人工神經網絡這一現代 AI 系統的基礎概念,就已經被提出。
神經網絡是由多層“節點nodes”組成的模型,可以想象成一系列可調節的旋鈕。通過賦予眾多節點之間不同的權重,神經網絡可以建模許多復雜的映射關系。
一般來說,網絡中的節點越多、層數越深,它就能學習和表示越復雜的模式。Generally, the more “nodes”, the more complex systems they can model.
![]()
多層人工神經網絡示意圖,這張圖展示了一個典型的多層神經網絡結構。圖中圓節點分布在幾層:最左側一層是輸入層,中間若干層是隱藏層,最右側一層是輸出層。
輸入層的節點,接收原始數據(例如圖像像素或文本的數值表示),然后通過連接線將信號傳遞給下一層的隱藏節點。每條連接線都帶有一定的權重(可理解為“旋鈕”的位置),決定了信號傳遞的強度。
隱藏層節點對接收到的信號,進行加權匯總并通過非線性函數轉換,將結果傳遞給下一層。
經過層層傳遞,最終輸出層節點給出模型的預測結果。
圖中的箭頭表示權重調整方向:在訓練過程中,模型通過反向傳播算法不斷調整各連接的權重,以盡可能降低輸出與真實值之間的誤差。
一般而言,增加節點數量(拓寬每層規模)或增加隱藏層層數(加深網絡深度),能夠提高模型對復雜函數關系的擬合能力,但也需要更多的數據和算力來支撐。
這些模型,通過大量與其模擬對象相關的數據進行訓練,訓練的目標,是將模型輸出與真實數據之間的“誤差或損失最小化minimize loss”。
通常而言,提供給模型的訓練數據越多,模型最終的效果肯定也就越好。
![]()
神經網絡從提出理論到實際大放異彩,經歷了數十年的漫長等待。
最終,促成現代深度學習蓬勃發展的有兩個關鍵因素:海量數據或者說big data的出現,以及 NVIDIAGPU所提供的強大并行計算能力。
2012 年 ,AlexNet 模型取得的突破,標志著人工神經網絡性能的一次飛躍,其背后的重要技術支撐之一,正是利用 GPU 對模型訓練進行并行加速。
3.2 現代?AI?系統:LLM 的黑盒
下一塊奠基石,正是 Transformer 模型。
2017 年,谷歌發表的《Attention is All You Need》論文,提出了這種如今家喻戶曉的架構。其核心思想在于,通過“注意力attention”機制,將上下文融入對單詞的語義表達。
例如在前文中就提到過的,英語單詞“float”的含義,可以是:“float on water漂浮”,也可以是“ a root beer float汽水冰淇淋”“a parade float游行花車”甚至“floating on cloud nine飄飄然的幸福感”。
Transformer 提供了一種方法,將單詞所處的上下文,整合進它的語義之中,使模型能夠依據上下文來判別 “float” 在具體句子里的含義
LLM 處理輸入的第一步,是獲取給定的文本(就是用戶給的prompt),將其拆分為一個個詞元(token),并將每個詞元的含義映射(embeddings)成一個語義向量(columns of data,可以理解為在高維空間中表示詞義的坐標)。
此時,模型已經得到一組向量化的語義表示,用來刻畫輸入的數據。
![]()
接著,transformer登場。
它的目標是生成一系列新的向量,使其中融入單詞的上下文意義。transformer 的關鍵理念就是attention:一次性處理整句,而不是逐詞依次翻譯。
本質上,模型會在一張 “attention?grid” 中考察詞與詞之間的關系。
![]()
Transformer 注意力權重矩陣示意圖,這張圖展示了 Transformer 模型在處理一句話時生成的“注意力”權重矩陣。
矩陣的行和列,分別對應輸入句子的各個詞。每個單元格顏色的深淺表示模型在計算某一行對應詞的表達時,對某一列對應詞的關注強度(權重大小)。
顏色越深,表示模型認為這兩個詞聯系越緊密、相關性越高。通過注意力矩陣,我們可以直觀地看到模型在理解句子時關注到哪些詞與哪些詞存在重要關聯。
注意力機制使模型在翻譯或生成時同時考慮句中所有詞語的相互關系,這相比逐詞處理的方法更充分地利用了全局語境信息。
隨后,這些信息會經過前饋網絡feed?forward layer,進一步精煉由 attention提取的特征信息。
當數據在模型中的各層不斷流動時,上述過程會被反復執行,持續更新embeddings,以便更準確地預測“正確答案”。
在數據處理完畢后,模型會輸出一個潛在詞語的概率列表(probabilities of potential words,就像我們的大腦想表達同一含義時,常有多種近義詞可選)。
最終,模型根據這些概率選擇一個詞,映射關系(embeddings)會被 “反嵌入unembed”回對應的人類語言單詞,并作為結果輸出給你看。
3.3、OpenAI 當前的技術:規模、推理與agent
基于 Transformer 架構訓練出的 LLM 模型,最初的表現其實并不算出色。要達到如今 ChatGPT 這樣的質量,他們做對了什么?
答案就是:規模化Scaling
投入更多的數據、使用更多的 GPU(現在甚至需要更多的能源),就能換來更好的性能——不斷擴大規模,直到模型能夠非常有效地掌握語言規律為止!
當然,讓 ChatGPT 如此出色的,遠不止規模一項,還有許多創新改進。但正是一系列創新與持續的規模化擴展相結合,推動了模型質量節節攀升。
對于現代 AI 系統,OpenAI 將 AI 能力的發展劃分為五個層級。
![]()
階段 1:聊天機器人(Chatbots)– 能進行自然語言對話的基礎 AI,例如當前的 ChatGPT。它可以理解用戶的語言輸入并給出合適的回復,但主要用途局限在信息查詢、問答對話等。
階段 2:推理機(Reasoners)– 具備連貫邏輯推理能力的高級 AI。此級別的模型能夠在回答問題時展開鏈式的內部思考,列舉多種可能的解答思路,評估其中哪種更優,再據此產出最終答案,使模型的解決問題能力更接近人類的縝密思維過程。
階段 3:智能代理(Agents)– 能自主采取行動執行任務的 AI。除了對話,這一層級的 AI 可以調用工具、與外部系統交互,完成諸如瀏覽網頁、調用應用接口、計劃行程、處理郵件等具體任務,將 AI 從信息提供者提升為任務執行者。
階段 4:創新者(Innovators)– 擁有創造力和自主創新能力的更高階 AI。不僅能完成預設的任務,還能主動提出新想法、設計原創方案,甚至在科學、藝術等領域有所發明創造。
階段 5:AI 組織(AI Organizations)– 多個 AI 代理協同工作、如同一個組織般運作的形態。若干 AI 分工合作、彼此通信,可以在幾乎無人工介入的情況下自主完成高度復雜的項目和決策,相當于一個由 AI 組成的虛擬組織。
這兩年開始,“推理reasoning”能力已經成為研發的中心。簡單說,具有推理能力的模型,會針對同一問題生成多個可能的答案,然后對這些答案進行評價,選出最優的一個來作為最終輸出。
這一過程更類似于人類的思考方式:先想出各種主意,再判斷哪個最好。
這五個階段,描繪了 OpenAI 對 AI 未來發展的愿景:AI 將從當前的智能對話助手,逐步進化出推理和規劃能力,繼而能夠執行復雜任務,甚至具備創造性,最終多個 AI 系統協作,構成自我運轉的智能網絡,從而對人類社會產生顛覆性影響。
![]()
根據 OpenAI 的描述:“通過強化學習,o1 模型學會了打磨自己的思維鏈條,優化使用的策略。它學會了識別并糾正自己的錯誤,將棘手的問題分解成更簡單的小問題。當現在的方法不起作用時,它會嘗試不同的方法,這個過程顯著提升了模型推理的能力。”
最終,引入“智能代理Agent”,賦予了 LLM 模型執行行動的能力。這使模型從一個更好的搜索工具,變成了一個真正可以替代人類執行部分勞動的智能體(至少對一些簡單任務來說)。
增強或者改良的搜索引擎固然有用,但稱不上顛覆性的。如果你擁有的是可以完成各種任務的智能代理,比如幫你規劃假期、預訂酒店、回復郵件、處理客服請求、安排會議等,這將真正改變游戲規則,徹底提升效率和體驗。
我們現在達到那個地步了嗎?并沒有。
明年就能達到嗎?或許可以。
十年之后呢?幾乎可以肯定。
這正是 OpenAI 前進的方向。正如他們自己所宣稱的:“我們相信在 2025 年,我們可能會看到首批 AI 智能體‘加入勞動力隊伍’,并實質性地改變企業的產出。”
4.2、OpenAI 的商業模式
OpenAI 的商業模式,就是一家垂直整合的 AI 公司,但只有模型是他們獨一無二的核心競爭力。他們在技術棧上向上整合,直接提供應用來獲取收入,并建立護城河,同時也向下整合技術棧,以降低邊際成本。
4.1 財務狀況
大模型本身,就是人們討論的焦點,目前, OpenAI約 72% 的收入就是來自 ChatGPT。
![]()
據The Information報道,OpenAI 2024 年的收入預計約為40 億美元,同時預計虧損約50 億美元。
![]()
在這 40 億美元收入的基礎上,OpenAI 的毛利率大約是41%,我猜測這個毛利率的計算范圍,只包含了托管和推理計算的直接成本。
他們預計到2028 年,毛利率可以提高到67%,這可比傳統軟件公司的毛利率還要高很多了。按照預測,到2029 年,當公司年收入突破1000 億美元時,將實現盈虧平衡并開始盈利。
那么,他們打算如何把年收入做到 1000 億美元呢?答案可以從下面這張非常有趣的圖表中找到。
![]()
這張圖表在之前 DeepSeek 宣布新模型的背景下,顯得尤為耐人尋味。
圖表顯示,OpenAI 達成1000 億美元年收入目標的路徑并不是依賴 API 接口業務,而是靠自家的應用產品驅動。甚至在2025 年,他們預計“新產品new products”的收入,就將超過 API 收入。
我們不應再把 ChatGPT 簡單看作一個聊天機器人,而要把它視為一個通用型的數字助理a general-purpose agent。
從我觀察到的跡象來看,ChatGPT 的愿景,是成為每個人的執行助手executive assistant:它可以與用戶所有的賬戶相連接,了解用戶偏好,它能對會議錄音并做記錄、安排后續跟進,它可以自動回復日常郵件,它能夠處理客服請求、安排日程。
這樣的 ChatGPT,而不只是一個聊天機器人,才能支撐起未來500 億美元(1000億的一半)的收入規模。
4.2 公司的治理結構
OpenAI 或許像它的重要性一樣復雜,們的公司架構如下所示。
![]()
OpenAI 公司架構與控制關系圖,這張圖形象地描繪了 OpenAI 獨特的公司治理結構。最上方是 OpenAI 的董事會,由非營利組織 OpenAI Inc. 指派,掌控著整個公司。董事會通過OpenAI GP LLC(OpenAI 有限合伙企業的普通合伙人)對下層的營利公司進行完全控制。下層主體OpenAI Global LLC(即 OpenAI 有限合伙企業,OpenAI LP)負責實際運營業務并接受外部投資。
如果你覺得這還不夠復雜,那么他們與微軟之間的關系更是錯綜復雜:
![]()
如圖所示,微軟作為外部投資者出現在結構的一側:2019 年微軟向 OpenAI 投資 10 億美元,此后又在 2023 年追加投資,總投資額達到137.5 億美元,從而獲得了 OpenAI Global LLC 相當比例的股權(據媒體報道最高可達 49%)以及利潤分成權(收益封頂為微軟獲得最多920 億美元的利潤)。
與此同時,OpenAI 使用微軟的 Azure 云基礎設施來訓練模型和提供服務,每年要向微軟支付逾10 億美元的云服務費用。
這一架構展現出 OpenAI 混合型的組織形式:頂層的非營利機構確保公司使命和長期利益不偏離造福人類的初衷;下層的封頂盈利公司則允許吸納來自微軟等投資者及員工的資本,以支撐其龐大的研發開支,但對投資回報進行上限約束,從而在逐利與公益之間取得平衡。
正如前文所言,OpenAI 的公司結構相當復雜,但也正因為這種安排,OpenAI 董事會(非營利組織)得以對公司保有完全控制權。
據報道,微軟可以獲得 OpenAI20% 的營收分成(直到獲得 920 億美元利潤為止)。作為交換,微軟會將其 Azure OpenAI 云服務收入的20%分潤給到 OpenAI。
此外,微軟還擁有 OpenAI 相當大比例的股權(具體比例不詳,隨著 OpenAI 結構和融資變化可能調整,有新聞稱微軟持股最高達 49%)。
從結果而論(取決于最終走向),Microsoft 對 OpenAI 的這筆投資很可能稱得上是史上最出色的投資之一。
但是“沖突”也在發生:Microsoft 曾作為 OpenAI 的獨家云服務提供商,但隨著 “Stargate” 項目的公布,這一點似乎已經發生了變化。
5、市場數據與競爭格局
首先,對你看到的任何benchmark(基準測試)都要保持懷疑。正如有人調侃的那樣:“我從未遇到過一個我不喜歡的 benchmark。”
Anthropic據估計在 2024 年底達到了9.6 億美元的年化收入運行率(annual run rate,用最近的一段時間的實際數據,按比例線性外推到 12 個月),并預計在 2025 年將產生20–40 億美元的營收。
相較之下,OpenAI 對 2025 年的營收預測為120 億美元。
尤其值得注意的是,OpenAI 在模型市場model market份額與應用市場application market份額之間,正出現分化趨勢。在模型層面,我們看到市場競爭日益激烈。
![]()
大型語言模型市場份額變化(2023 vs 2024)
從各類模型基準測試上看,也呈現出類似趨勢:OpenAI 雖然擁有質量最高的模型,但性能/價格比的“領導者”地位卻存在爭議。
![]()
例如,DeepSeek 公司研發的 R1 模型在性價比上就已經可以媲美 OpenAI 的 o3-mini 和 o1-mini 模型。
![]()
不同大型語言模型的性能與成本對比,理想狀態是模型位于圖的左上方,即以較低成本實現高性能。
不過,在應用層application business,ChatGPT的主導地位正日益擴大:
![]()
這是模型競爭加劇的更廣泛趨勢,它將迫使做基礎模型的公司們,不得不尋求在其他維度實現差異化并獲得盈利。數據也表明,對于OpenAI來說,即便在模型性能保持領先,通往可持續商業模式的道路仍在應用層。
6、OpenAI 的未來
與其泛泛而談“OpenAI 的未來”,不如用一種考慮各種可能性的視角來展望。在展開之前,我需要列出一些對 OpenAI 未來影響最大的變量,當然我可能會有所遺漏,這畢竟只是我的一些思考。
這些問題應被看作一些連續譜上的未知量:
6.1成本結構:OpenAI 在追求垂直整合、改善成本結構方面能取得多大成功?
6.2商業模式:OpenAI 如何從其模型中賺錢?其模型會在多大程度上被商品化(從而壓縮利潤空間)?
6.3市場格局:未來 AI 應用市場的最終狀態(規模、份額、盈利能力)將會如何?
6.4產品形態:OpenAI 如何將模型的智能轉化為實際行動能力(也即讓智能代理真正執行人類任務)?
6.5估值:我們該如何為 OpenAI 估值?
6.1 成本結構:掌控一切
第一個變量是關于垂直整合vertical integration,OpenAI 已經融資了數百億美元,既然手握重金,不妨努力把能掌控的環節都掌控在手里。
眼下,流入 AI 領域的資金比歷史上任何其他新興行業都要多——據估計,僅過去四年里,風投資本向 AI 投入了約4500 億美元,相比之下互聯網泡沫高峰時期是2560 億美元。
這意味著,從未有哪個行業的創業公司像 AI 這樣面對如此眾多且資金充沛的競爭者。
在這樣的環境中,要建立競爭壁壘是極其困難的。為此,OpenAI 正在沿著 AI 技術棧上下兩個方向推進垂直整合。正如我們已經看到的,通過 Stargate 項目以及自研 AI 芯片的嘗試,向技術棧下游發展能為他們在硬件層面帶來成本優勢和所需的自主可控性。
他們的大部分競爭對手,在某些方面有自身優勢:要么擁有自研定制的 AI 芯片(如 Google、Amazon、Meta),要么擁有龐大的自有數據中心(如 xAI 倚仗超大規模云廠商),OpenAI 不能因為缺乏對底層硬件的掌控,就眼睜睜丟掉競爭優勢。
然而,話說回來,沒有自建的數據中心或自研硬件,OpenAI 也未必無法存續。但以應用層取勝卻是必須做到的,這將是 OpenAI 實現經濟上可持續發展的關鍵途徑。
6.2 商業模式:如何實現可持續的盈利?
可預見的是,大量資本在未來還將涌向 OpenAI 的直接競爭對手,例如 Anthropic、xAI,以及 Safe Superintelligence 等公司的競品。
此外,幾家史上最龐大且最賺錢的科技巨頭,也把 OpenAI 視作存亡攸關的對手,投入重兵參與這場競賽。
更糟的是,DeepSeek 已經證明,可以訓練出一款成本更低、運行更省錢而質量幾乎相當的模型。
還有一些競爭者甚至選擇開源他們的模型,只要支付最基本的算力費用,任何人都能使用。
基于以上種種原因,在模型層面,單純依靠提供 API 接口來競爭在可見的未來都無法鑄就一個可持續的商業模式。
這就意味著,必須構筑軟件層面的護城河,比如提高用戶轉移成本、建立牢固的企業合作關系,而這些都要在應用層來實現。
6.3. 市場:十年后的 AI 應用市場會是什么樣?
如果,OpenAI 確實如我們所分析,是一家垂直整合的 AI 公司,并且,它的大部分利潤將來自應用層,那么這可能是最重要的問題:長遠來看, AI 應用市場究竟有多大?在這個市場里,價值將主要積累在哪里?
如果,以 AI 潛在能取代的知識工作總量potential knowledge work來衡量,這個市場規模會大得難以想象。
然而,商品的價格,總是傾向于接近其邊際生產成本。
對于 AI 應用來說,這個邊際成本無非是:硬件成本 + 能源成本 + AI 研究人員的成本 + 應用層你能保住的那部分利潤。
換句話說,AI 服務最終可能會以接近算力和電力成本的價格提供,加上一點點應用層的溢價。
那么,可以換個角度問:AI 未來究竟能解決哪些問題?
答案是:它能解決非常多的問題,其市場空間將極其龐大——可能達到數千億美元量級。只要 OpenAI 能持續執行并守住它的護城河,它所面對的蛋糕將大得遠遠超過今日的規模。
從目前來看,OpenAI 似乎將希望寄托于用其 AI 智能代理,來主導通用型工作流general-purpose workflows。他們曾展示過基于Deep Research的銷售場景工作流自動化的演示,這暗示了 OpenAI 認為自己有潛力吞下許多通用業務流程。(關于Openai想進入電商場景,可以看看這篇:)
如果成功,凡是可以交給 AI 完成的一般性任務流程中,有很大一部分都將被 OpenAI 的系統所承接。
當然,在醫療、金融、法律等垂直行業,很可能會涌現專注各自領域的AI解決方案,滿足這些領域特殊的集成需求、監管要求和業務流程,就像傳統軟件市場里,行業軟件各自分割垂直市場一樣。
但如果 OpenAI 真能非常成功,它也有可能成為這些垂直 AI 公司的底層平臺,或許通過向它們獨家提供自家最頂尖的模型,就像奢侈品行業里的高端供應商那樣。提供獨占的關鍵技術。
那么,這個市場大爆發會在什么時候發生?阿瑪拉定律有云:“我們往往高估一項技術在短期內的影響,卻低估它在長期內的作用。”Amara’s Law says, “We tend to overestimate the effect of a technology in the short run and underestimate the effect in the long run.”
很明顯,現有形態的知識型工作,在十年后幾乎注定會大幅改變。但一年之內就發生翻天覆地變化?這一點還很難說。
6.4 產品:OpenAI 已經聚合了信息,接下來如何聚合行動?
到目前為止,AI 的價值體現在它匯聚并提供信息的能力上。而未來 AI 的價值,將體現在它執行行動的能力上。
OpenAI 很早以前就認識到了這一點,并推出了 Plugins 插件體系,來實踐這個愿景。通過 Plugins,各家公司可以為 ChatGPT 預定義工作流,并提供認證接口,讓 ChatGPT 擁有訪問這些應用服務的權限,理論上,這套方案本該行之有效。
但是,結果卻不盡如人意。我的猜測是,當時整個生態并未準備好。Plugins 或許未能發揮作用,是因為基礎設施尚不到位,許多網站和服務還沒有開放 API、缺乏必要的集成和認證機制,ChatGPT無法有效對接足夠多的外部服務。
OpenAI 后來推出的Operator功能(盡管效率低一些),則在一定程度上繞開了上述限制。
它的邏輯更簡單明確:如果有官方 API 可以用,就用 API(if api == 1);如果沒有現成 API,就通過 Operator模擬人類操作來完成任務(if api == 0)。
要讓 AI 能夠執行復雜行動,另一個必要條件是推理能力:也就是在做決策時權衡各種因素的能力,想想規劃一場復雜旅行需要多少微小決策。(OpenAI在7月已經推出了結合Opeator和推理能力的Agent Mode)
OpenAI 的未來,是持續提升智能本身,而 ChatGPT 的未來是不斷增強行動能力。
這正是他們描繪的進軍 1000 億美元營收的愿景:ChatGPT 將不只是聊天,它會成為每個人的通用助理。
而再往后,它會演變成一個通用的“知識型工作者a general-purpose knowledge worker”,可以完成許多過去只有人類才勝任的腦力勞動。
6.5 估值:該如何給 OpenAI 定價?
這個問題很有意思,因為投資者考慮的因素實在太多了,比如:
1、頭部效應:OpenAI 是 AI 領域顯然的冪律贏家,如同過去的周期一樣,絕大部分價值往往流向最大的贏家;
2、賽道前景:AI 的機會確實如人們所宣稱的那樣巨大,而投資 OpenAI 就等于是押注整個 AI 行業的未來增長;
3、AGI 前瞻:某種形式的 AGI(通用人工智能)遲早會出現,而當它出現時,你肯定希望自己是“坐在牌桌邊”的人之一;
4、戰略價值:獲得接觸 OpenAI 的機會所帶來的信息和生態優勢,足以讓投資它在市場上占據領導地位,因此這種戰略意義本身值得付出高價;
5、相對估值:以 OpenAI 最近1570 億美元的投后估值來看,大約是其今年收入的39 倍(市銷率)。按照明年預計的120 億美元收入計算,則約為13 倍的前瞻市銷率。這個數字雖然昂貴,但對比公開市場上高速增長的科技公司也并非不可接受。(如果按照最新的3000 億美元估值的新一輪融資完成,那么上述倍數都將翻倍,在一定程度上削弱了本條的支撐力。)
現實中,投資決策的依據,可能是以上因素的綜合權衡。
對于高速成長的公司來說,其最終能達到的格局遠比中間過程中的任何階段性指標重要得多。你可以根據自己的成見,為任何估值找到看似合理的理由:如果你相信 AI 的長期價值,你自然會覺得今天的估值可以接受,我猜許多投資 OpenAI 的人正是抱有這種長期主義的信念。
這里我引用一句“名言”以供玩味:“如果你不準備持有一只股票 10 年,那就不要連 10 分鐘都持有它。”在如今這樣的時刻,這句話值得反復咀嚼。
對 OpenAI,我最后的想法是:把本文當作一篇暫時的日記,記錄下此刻對這家公司的思考。也許十年后 OpenAI 會成長為一家市值數萬億美元的巨擘,也許它會停滯許多年,在“消化”當前估值的同時,等待 AI 真正產生的價值追上市場預期。又或者,它會成為一個關于過早認定市場統治地位的反面教材(不過我個人對此持懷疑態度,但并不完全排除這種可能)。
但可以確定的是,冪律效應驅動下,科技領域總會誕生那些標志性的偉大公司——它們增長迅猛,推動技術進步,并成為全球家喻戶曉的名字:IBM、英特爾、蘋果、微軟、英偉達、亞馬遜、谷歌、SpaceX、特斯拉、Meta……
OpenAI暫時已經把自己帶入了這一公司行列,它是一個在迅速增長的市場中占據先機的領先者,基本與它所引領的這項技術本身畫上了等號。
![]()
全文總結如下:
1、深度學習因 GPU 的出現和大數據的積累而被引爆;
2、Transformer 引入了上下文注意力機制,這是語言處理的關鍵;
3、OpenAI 通過 ChatGPT 將這些技術推向大眾,引領了 AI 熱潮;
4、OpenAI 已成長為史上發展最快的公司之一(如果不是最快的話);
5、他們為將 ChatGPT 打造成通用助手而加入了代理、推理、語音、搜索等新能力;
6、競爭者紛紛涌入模型研發領域,但在應用層面 ChatGPT 的先發優勢依然明顯;
7、OpenAI 正在上下游同時垂直整合,致力于成為一家全棧的 AI 公司。
完。
(拖更好久終于更新了,歡迎關注、收藏和分享,點贊代表催稿下一篇,嘻嘻,之后我會發布黃仁勛出道以來推薦過的書,這位老哥非常神奇,現年62歲、創業32年的他,似乎一共只推薦過7本書,但是本本經典,敬請期待。)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.