![]()
站在2025年末回望,AI行業(yè)已然發(fā)生了翻天覆地的變化。OpenAI的周活躍用戶已突破驚人的8億大關(guān),這相當(dāng)于全球10%的人口。在這樣一個(gè)巨量規(guī)模下,早期的“大一統(tǒng)模型”理論似乎正在失效,取而代之的是專用模型、微調(diào)技術(shù)與智能體(Agent)的全面爆發(fā)。
日前,OpenAI開(kāi)發(fā)者平臺(tái)負(fù)責(zé)人Sherwin Wu與a16z合伙人Martin Casado進(jìn)行了一場(chǎng)深度對(duì)話,詳細(xì)拆解了OpenAI如何在模型、定價(jià)和基礎(chǔ)設(shè)施層面構(gòu)建其平臺(tái)體系。
雙方深入探討了OpenAI發(fā)生的轉(zhuǎn)型:從單一的通用模型,轉(zhuǎn)向由專業(yè)化系統(tǒng)、定制微調(diào)選項(xiàng)以及基于節(jié)點(diǎn)的智能體工作流組成的產(chǎn)品矩陣。Sherwin還闡述了從“提示工程(Prompt Engineering)”到“上下文設(shè)計(jì)(Context Design)”的演變。
值得注意的是,在談到定價(jià)策略時(shí),Sherwin Wu指出一個(gè)關(guān)鍵洞察:按結(jié)果定價(jià),可能是下一個(gè)“單向棘輪”。一旦你嘗到甜頭,你就再也回不去之前的模式了。
他指出,隨著推理時(shí)計(jì)算(Test-time Compute)的引入,用量和結(jié)果其實(shí)是高度正相關(guān)的。模型思考得越久(用量越大),解決難題的概率(結(jié)果)就越高。所以,也許按量計(jì)費(fèi)本身,就是一種近似的“按結(jié)果付費(fèi)”。
早在2025年3月17日,盛景率先提出AI RaaS(Result-as-a-Service,“結(jié)果即服務(wù)”)的商業(yè)模型。AI RaaS模式的核心特點(diǎn)正是按工作量和工作結(jié)果付費(fèi),從而實(shí)現(xiàn)了AI服務(wù)方與客戶最大程度的利益綁定。
以下是本次對(duì)話的精華實(shí)錄,為方便閱讀,盛景新經(jīng)濟(jì)進(jìn)行了適當(dāng)編輯,希望對(duì)你有所啟發(fā)~
01
平臺(tái)悖論:
既做裁判員,又做運(yùn)動(dòng)員?
Martin Casado:
Sherwin
是當(dāng)下最頂尖的
AI
思想領(lǐng)袖之一。
Sherwin
,非常感謝你的加入。
Sherwin Wu:謝謝 Martin,目前我統(tǒng)領(lǐng) OpenAI 開(kāi)發(fā)者平臺(tái)的工程團(tuán)隊(duì),其中最核心的產(chǎn)品當(dāng)然是 API。
Martin Casado:
我想聊聊
OpenAI
一個(gè)非常獨(dú)特的點(diǎn):你們既是一個(gè)
橫向公司
(提供
API
,作為數(shù)百萬(wàn)家公司的基礎(chǔ)設(shè)施),又是一個(gè)
縱向公司
(擁有
ChatGPT
這樣的超級(jí)應(yīng)用)。這在業(yè)界非常罕見(jiàn)。這兩者內(nèi)部有張力嗎?
API
會(huì)不會(huì)被視為在幫助那些與你們垂直版本競(jìng)爭(zhēng)的對(duì)手?
Sherwin Wu:確實(shí)非常罕見(jiàn),張力也確實(shí)存在。
但我認(rèn)為這得益于 Sam (Altman) 和 Greg (Brockman) 從第一天起就堅(jiān)持的原則:我們的使命是實(shí)現(xiàn) AGI(通用人工智能)并將利益廣泛分配。這意味著我們需要盡可能多的接觸面。ChatGPT是獲得8億用戶的最佳途徑,但通過(guò)API,我們能觸達(dá)更多樣化的場(chǎng)景。我們內(nèi)部常討論,API覆蓋的終端用戶范圍其實(shí)比ChatGPT還要廣。
至于競(jìng)爭(zhēng)張力,主要體現(xiàn)在產(chǎn)品側(cè)。比如 ChatGPT 發(fā)布了某個(gè)功能,可能會(huì)讓基于 API 開(kāi)發(fā)類似產(chǎn)品的客戶感到不滿。
Martin Casado:
這是云計(jì)算和操作系統(tǒng)最古老的故事了
平臺(tái)與開(kāi)發(fā)者爭(zhēng)利。
Sherwin Wu:對(duì)。但我感受到的壓力更多來(lái)自 API 客戶本身,他們會(huì)擔(dān)心:“天哪,你們會(huì)不會(huì)把我現(xiàn)在做的東西自己做了?”
Martin Casado:
歷史上,做
API
的風(fēng)險(xiǎn)在于容易被
去中介化
Disintermediation
)。開(kāi)發(fā)者可以在云之上構(gòu)建一層,用戶就不知道底層是哪朵云,這樣開(kāi)發(fā)者可以隨時(shí)切換服務(wù)商。
但我發(fā)現(xiàn),對(duì)于大模型來(lái)說(shuō),這種
抽象層
很難建立。模型太難被完美封裝了。這幾乎是一種
反去中介化
的技術(shù)
你必須把模型直接暴露給用戶。用戶知道自己在用
GPT-5
還是
GPT-4o
Sherwin Wu:非常深刻。整個(gè)行業(yè)在這個(gè)問(wèn)題上的認(rèn)知也在轉(zhuǎn)變。起初我們以為模型會(huì)像軟件一樣可以隨意互換。但隨著 GPT-5、o3 等產(chǎn)品的推出,用戶的感知極其敏銳。
Martin Casado:
沒(méi)錯(cuò),當(dāng)模型切換時(shí),我甚至能感覺(jué)到一種
情感
上的疏離。比如,
你對(duì)我沒(méi)以前那么好了
Sherwin Wu:是的。而且從技術(shù)角度看,開(kāi)發(fā)者,尤其是初創(chuàng)公司,會(huì)針對(duì)特定模型(比如 GPT-5)進(jìn)行深度迭代,打磨 Prompt,優(yōu)化框架。實(shí)際上,你是圍繞著那個(gè)特定模型構(gòu)建產(chǎn)品的。所以即使有人試圖做“模型路由”,模型的粘性依然驚人地高。
02
不會(huì)有“大一統(tǒng)模型”,
專用模型或迎來(lái)爆發(fā)式增長(zhǎng)
Martin Casado:
我用
Cursor
寫(xiě)代碼時(shí)也發(fā)現(xiàn)了這點(diǎn)。我用
GPT-5
進(jìn)行規(guī)劃,用
Cursor
自帶的模型補(bǔ)全,用
Composer
模型修改。
這就引出了一個(gè)大問(wèn)題:早年大家都認(rèn)為未來(lái)只會(huì)有一個(gè)超級(jí)模型(
AGI
)統(tǒng)治一切,連投資人都不投模型公司。但現(xiàn)在的現(xiàn)實(shí)是
模型的大爆發(fā)
。這對(duì)
AGI
OpenAI
意味著什么?你們會(huì)維護(hù)一個(gè)模型組合嗎?你認(rèn)為未來(lái)這一切會(huì)被某個(gè)
上帝模型
取代嗎?
Sherwin Wu:這整件事最瘋狂的地方在于大家的想法是如何隨著時(shí)間改變的。我清楚地記得,不久前,也就兩三年前,即使在OpenAI內(nèi)部,當(dāng)時(shí)的想法也是“一個(gè)模型統(tǒng)治一切”。那時(shí)候我們甚至覺(jué)得微調(diào)(Fine-tuning)API沒(méi)必要存在——為什么要有微調(diào)產(chǎn)品?為什么要迭代它?因?yàn)橹髂P蜁?huì)強(qiáng)大到能處理一切。
那也是當(dāng)時(shí)對(duì) AGI 樣貌最簡(jiǎn)單的看法。顯然,自那以后情況完全改變了。但也需要記住,未來(lái)可能還會(huì)變。不過(guò)現(xiàn)在越來(lái)越清晰的是,各種專用模型將擁有一席之地,很可能會(huì)出現(xiàn)各類模型的爆發(fā)式增長(zhǎng)。
你看我們?cè)?/strong>Codex模型本身上就這么做了,有GPT-4o、o1、o3、GPT-5等等。我不認(rèn)為這是壞事。如果說(shuō)有什么的話,隨著我們向 AGI 邁進(jìn),事情變得非常出乎意料,市場(chǎng)和產(chǎn)品組合也隨之演變。
因?yàn)椴皇勤A家通吃,也不會(huì)有贏家通吃的整合動(dòng)態(tài)。我們內(nèi)部經(jīng)常思考,隨著通用AI生態(tài)系統(tǒng)的增長(zhǎng),OpenAI從中受益匪淺。這就是為什么我們也開(kāi)始向其他模型開(kāi)放我們的部分產(chǎn)品,比如我們的 Evals(評(píng)估)產(chǎn)品現(xiàn)在允許你引入其他模型。這也是為什么我們開(kāi)源了。
03
強(qiáng)化學(xué)習(xí)微調(diào)的勝利
Martin Casado:
聊聊微調(diào)
API
。你們開(kāi)始轉(zhuǎn)向更復(fù)雜的微調(diào),這某種程度上是不是一種妥協(xié)?承認(rèn)通用模型無(wú)法解決所有垂直領(lǐng)域的特定數(shù)據(jù)問(wèn)題?正如你所說(shuō),與其說(shuō)是模型擴(kuò)散,不如說(shuō)很多數(shù)據(jù)實(shí)際上非常有價(jià)值。
在多大程度上這會(huì)變成一種
利益交換
?你們暴露將產(chǎn)品數(shù)據(jù)用于微調(diào)的能力,然后你們也從供應(yīng)商提供的數(shù)據(jù)中受益?還是說(shuō)這是
100%
隔離的,他們保留自己的數(shù)據(jù)?因?yàn)楦杏X(jué)這是下一階段擴(kuò)展的關(guān)鍵。
Sherwin Wu:我們最初投資微調(diào) API 的主要原因:第一,人們有巨大的需求想要更多地定制模型;第二,正是你說(shuō)的,公司們坐擁巨大的數(shù)據(jù)寶藏,他們想在這波 AI 浪潮中利用這些數(shù)據(jù)。
有趣的是,回到2022、2023年,微調(diào)產(chǎn)品太受限了,人們很難利用這些數(shù)據(jù)。那只是監(jiān)督微調(diào)(SFT)API。實(shí)際上它只對(duì)“指令遵循增強(qiáng)版”(Instruction Following++)有用,你改改語(yǔ)氣,指導(dǎo)它一下。
但我認(rèn)為最近發(fā)生的巨大解鎖是強(qiáng)化學(xué)習(xí)微調(diào)(Reinforcement Fine-Tuning, RFT)。有了這套機(jī)制,我們現(xiàn)在允許你真正運(yùn)行RL(強(qiáng)化學(xué)習(xí))。這更挑剔、更難,你需要投入更多,但它允許你更充分地利用你的數(shù)據(jù)。
我想說(shuō)的關(guān)于強(qiáng)化學(xué)習(xí)微調(diào)API的重點(diǎn)是,它將范式從微小的增量改進(jìn)(如SFT做的語(yǔ)氣改進(jìn))轉(zhuǎn)變?yōu)閷?shí)際上將模型在你知道的特定用例上提升到SOTA(業(yè)界頂尖)水平。這就是人們真正開(kāi)始使用RFT API的地方。
因?yàn)槿绻懻撝皇恰昂伲铱梢宰屵@個(gè)模型說(shuō)話方式更好一點(diǎn)”,那沒(méi)那么吸引人;但如果是“嘿,對(duì)于醫(yī)療保險(xiǎn)編碼或 Agent 規(guī)劃,你可以用 RFT 和你的數(shù)據(jù)集打造世界上最好的模型”,這就不同了。
Martin Casado:
你們會(huì)想辦法獲取這些數(shù)據(jù)嗎?比如如果我有數(shù)據(jù),我想要便宜的
GPU
,我會(huì)跟你換。
Sherwin Wu:我們確實(shí)在試點(diǎn)一些定價(jià)方案。如果你愿意分享數(shù)據(jù),我們可以提供推理折扣甚至免費(fèi)訓(xùn)練。這能雙贏。
04
提示工程已死?
不,這是“上下文工程”的時(shí)代
Martin Casado:
你剛才提到在這個(gè)過(guò)程中,對(duì)
提示工程(
Prompt Engineering
的看法也變了?
Sherwin Wu:是的。2022 年,主流觀點(diǎn)(包括我也這么認(rèn)為)是:未來(lái)不需要提示工程。因?yàn)楦鶕?jù)縮放定律(Scaling Laws),模型會(huì)聰明到能和你“心有靈犀”(mind meld),自動(dòng)理解意圖。
這完全錯(cuò)了。雖然現(xiàn)在的模型在指令遵循上比 GPT-3.5 強(qiáng)太多,但游戲的規(guī)則變了。現(xiàn)在的重點(diǎn)不再是以前那種“念咒語(yǔ)”式的提示工程,而是“上下文工程(Context Engineering)”。即:你給模型什么工具?它什么時(shí)候調(diào)用什么數(shù)據(jù)?
Martin Casado:
RAG
(檢索增強(qiáng)生成)就是一個(gè)很奇怪的例子。我們居然用余弦相似度(
Cosine Similarity
)這種簡(jiǎn)單的算法去檢索信息,然后喂給一個(gè)超級(jí)智能的大腦。這感覺(jué)像是在把智能
外包
給檢索步驟。
Sherwin Wu:RAG 誕生于模型還不夠聰明的時(shí)代。但現(xiàn)在有了o3這樣的推理模型——o3 是我最喜歡的模型之一,它是目前最勤奮的模型,能自己決定何時(shí)調(diào)用工具、何時(shí)寫(xiě)代碼。
范式已經(jīng)轉(zhuǎn)移到了:如何構(gòu)建環(huán)境讓模型去推理。
05
Agent,
是產(chǎn)品還是能力?
Martin Casado:
我們來(lái)談?wù)?/blockquote>Agent。你有API(橫向),你有ChatGPT(縱向),我們還沒(méi)談Pixel(圖像)。這些只是語(yǔ)言。Agent(智能體)是一種新模態(tài)(Modality)嗎?還是別的什么?Sherwin Wu:你說(shuō)的模態(tài)是什么意思?
Martin Casado:它們對(duì)我來(lái)說(shuō)既感覺(jué)像垂直也像橫向。對(duì)我來(lái)說(shuō),ChatGPT是個(gè)產(chǎn)品,我媽都在用。API是個(gè)開(kāi)發(fā)者工具。Agent介于兩者之間。它是一個(gè)產(chǎn)品嗎?如果是橫向的內(nèi)部是怎么處理的?是有個(gè)獨(dú)立的團(tuán)隊(duì)做Agent嗎?Sherwin Wu:有趣的是,你剛才的框架聽(tīng)起來(lái)好像 Agent 是一個(gè)單一的概念……
Martin Casado:也許更好的問(wèn)題是,對(duì)你來(lái)說(shuō)什么是AgentSherwin Wu:我對(duì) Agent 的總體看法是:它是一個(gè)能代表你采取行動(dòng)、并且能在長(zhǎng)時(shí)間跨度上工作的AI。
如果你這樣想,是的,也許這就是你說(shuō)的模態(tài),但它只是一種使用AI的方式。我們并不把它看作是獨(dú)立存在的。
Martin Casado:讓我解釋一下這個(gè)問(wèn)題的來(lái)源。我知道怎么構(gòu)建產(chǎn)品,我們也知道怎么做產(chǎn)品的市場(chǎng)推廣。我們知道把它們變成平臺(tái)的含義。我們也知道怎么做API,怎么計(jì)費(fèi),怎么處理開(kāi)發(fā)者張力。但我一直在試圖弄清楚,對(duì)于Agent,它屬于哪個(gè)陣營(yíng)?它更像產(chǎn)品陣營(yíng)嗎?比如我可以把編碼交給你,你作為用戶直接跟它對(duì)話;或者我可以把它嵌入我的App里。這對(duì)定價(jià)和生態(tài)系統(tǒng)意味著什么?比如如果我開(kāi)家公司,完全圍繞Codex構(gòu)建,你會(huì)介意嗎?Sherwin Wu:開(kāi)一家圍繞它的公司?我覺(jué)得那很棒。我們真的很喜歡 Codex SDK,希望人們能用它構(gòu)建。
實(shí)際上,我認(rèn)為這可能就是你想問(wèn)的,這也是OpenAI的一個(gè)獨(dú)特之處:歸根結(jié)底,OpenAI是一家AGI公司,是一家智能公司。Agent只是這種智能表現(xiàn)出來(lái)的眾多方式之一。
我們?cè)趦?nèi)部思考所有不同產(chǎn)品線——Sora、Codex、API、ChatGPT——的方式是,它們只是部署這種智能的不同界面。并沒(méi)有一個(gè)單一的團(tuán)隊(duì)在想“這就是Agent”。更多的是每個(gè)產(chǎn)品領(lǐng)域都在思考,這種智能如何轉(zhuǎn)化為一種形式,讓Agent行為成為可能。
在 ChatGPT 這樣的第一方產(chǎn)品中它長(zhǎng)什么樣?這就是為什么 Codex 最終變成了它自己的產(chǎn)品。在編碼產(chǎn)品中它長(zhǎng)什么樣?我們?cè)?ChatGPT 里探索過(guò),有點(diǎn)用,但實(shí)際上 CLI(命令行)界面更有意義,那是另一個(gè)部署界面。
如果你看 API 本身,這是另一個(gè)部署界面。你的思考方式略有不同,因?yàn)槭情_(kāi)發(fā)者優(yōu)先的思維,我們?cè)趲蛣e人構(gòu)建,定價(jià)略有不同,但這些都是核心智能——即 Agent 行為——的不同表現(xiàn)形式。
06
Agent Builder:
既要智能,又要受控
Martin Casado:你們最近發(fā)布了Agent Builder(智能體構(gòu)建器),用的是節(jié)點(diǎn)(Nodes)這種確定性的低代碼方式。很多人對(duì)此有爭(zhēng)議,覺(jué)得這就變回了老式的工作流,不夠AGISherwin Wu:我在發(fā)布 Agent Builder 時(shí)也收到了很多質(zhì)疑。大家問(wèn):“為什么還需要節(jié)點(diǎn)?為什么不直接讓 AI 端到端解決?”
這里有兩個(gè)原因。第一是實(shí)用性。模型雖然強(qiáng),但在長(zhǎng)鏈路任務(wù)上仍然做不到100% 完美。在此期間,人們想用模型,你能給他們構(gòu)建什么?
第二,也是更重要的一點(diǎn),我們發(fā)現(xiàn)工作中存在兩類任務(wù)。一類是像軟件工程師那樣,目標(biāo)明確但過(guò)程開(kāi)放的探索性工作;另一類是程序化工作(Procedural Work),也就是基于SOP(標(biāo)準(zhǔn)作業(yè)程序)的工作。
比如客戶支持、銷售、合規(guī)審核。這些領(lǐng)域的管理者不希望AI發(fā)揮創(chuàng)造力,他們需要AI嚴(yán)格遵循SOP。比如“只有金額小于多少時(shí)才能退款”。這種確定性需求巨大,我覺(jué)得硅谷的很多人并沒(méi)有意識(shí)到有大量的工作實(shí)際上屬于這一類。
而帶有節(jié)點(diǎn)的 Agent Builder 正是為了解決這類“既要智能又要受控”的問(wèn)題。
Martin Casado:就像游戲里的NPC(非玩家角色)。你不能讓NPC隨便說(shuō)話,它必須遵循游戲邏輯。所以人們現(xiàn)在會(huì)用代碼把邏輯硬編碼進(jìn)去,以此約束模型。Sherwin Wu:完全正確。這就是我們?cè)趪L試解決的問(wèn)題。如果不加約束,模型就會(huì)放飛自我,這在受監(jiān)管行業(yè)是不可接受的。
07
定價(jià)的終局:
單向棘輪與結(jié)果付費(fèi)
Martin Casado:聊聊定價(jià)。你們現(xiàn)在還是以Usage-based(按量計(jì)費(fèi))為主。Sherwin Wu:我們?cè)?API 上做基于用量的定價(jià),最簡(jiǎn)單的原因就是它最接近實(shí)際使用情況。
我們?cè)趦?nèi)部做的一件事是,我們總是確保我們的基于用量定價(jià)是從“成本加成”(Cost-plus)的角度來(lái)定價(jià)的,確保我們?cè)诶麧?rùn)率方面是負(fù)責(zé)任的。
我們不久前收購(gòu)了一家公司,關(guān)于定價(jià)我和公司的創(chuàng)始人聊過(guò)。他的觀點(diǎn)是,定價(jià)有點(diǎn)像一個(gè)“單向棘輪(One-way Ratchet)”。一旦你嘗到了基于用量定價(jià)的甜頭,你就再也回不去那種按部署付費(fèi)的模式了。
這是真的,因?yàn)樗絹?lái)越接近你實(shí)際獲得的效用。唯一的痛點(diǎn)在于,你要維護(hù)大量賬務(wù)系統(tǒng)才能做到這一點(diǎn)。但如果你能做到,他認(rèn)為這就是一個(gè)單向的趨勢(shì)——沒(méi)有回頭路。
現(xiàn)在最熱門(mén)的新事物是:“有了AI,你可以衡量結(jié)果(Outcomes)了。”如果那能行,也許那是下一個(gè)“單向棘輪”。
我思考過(guò)基于結(jié)果的定價(jià)(Outcome-based pricing),這在第一方產(chǎn)品側(cè)可能更多見(jiàn),在 API 側(cè)有點(diǎn)難。
API側(cè),這是一個(gè)典型的 usage-based 場(chǎng)景,我們必須打造支持這套體系的基礎(chǔ)設(shè)施,所以我們應(yīng)該會(huì)繼續(xù)使用量計(jì)費(fèi)。
但未來(lái)可能會(huì)有一種情況:AI 本身可以準(zhǔn)確判斷這些價(jià)值,然后把它綁定到計(jì)費(fèi)上。
Martin Casado這就是AI討論的問(wèn)題:任何時(shí)候你都可以說(shuō)未來(lái)它會(huì)變得足夠好Sherwin Wu:但到了那一步,它就真的不是問(wèn)題了。結(jié)果導(dǎo)向的定價(jià)聽(tīng)起來(lái)非常吸引人——如果它能跑通。
但我開(kāi)始發(fā)現(xiàn)的一件事是,隨著推理時(shí)計(jì)算(Test-time Compute)的引入,用量和結(jié)果其實(shí)是高度正相關(guān)的。模型思考得越久(用量越大),解決難題的概率(結(jié)果)就越高。
所以,也許按量計(jì)費(fèi)本身,就是一種近似的“按結(jié)果付費(fèi)”。
我個(gè)人會(huì)持續(xù)關(guān)注結(jié)果導(dǎo)向定價(jià)是否真正可行。
08
開(kāi)源的戰(zhàn)略思考
Martin Casado:你怎么看開(kāi)源?競(jìng)爭(zhēng)?互相蠶食?戰(zhàn)略目標(biāo)是什么?Sherwin Wu:我個(gè)人很喜歡開(kāi)源。如果沒(méi)有開(kāi)源,互聯(lián)網(wǎng)就不會(huì)存在,云也不會(huì)存在。
有趣的是,在我們發(fā)布開(kāi)源模型之前,我知道 Sam 也有這種感覺(jué)。有一種奇怪的心態(tài),因?yàn)?OpenAI 沒(méi)發(fā)布任何東西,看起來(lái)好像 OpenAI 超級(jí)反開(kāi)源。但我自從加入以來(lái)就一直和 Sam 討論開(kāi)源模型。我們?cè)噲D思考如何排序。算力總是個(gè)難題。我們一直想做這個(gè)。我很高興我們終于在今年早些時(shí)候做了……也就是發(fā)布GPT-OS的時(shí)候。
我對(duì)此的看法是:第一,作為一個(gè)既垂直又橫向的公司,我們想繼續(xù)投資生態(tài)系統(tǒng)。第二,從OpenAI的角度看,如果AI生態(tài)系統(tǒng)增長(zhǎng),水漲船高對(duì)我們有幫助。如果我們發(fā)布開(kāi)源模型能解鎖其他行業(yè)的用例,那很好。
Martin Casado:人們很少談?wù)摰氖沁@些開(kāi)源AI商業(yè)模式其實(shí)運(yùn)作得很好,因?yàn)榛ハ嘈Q食的風(fēng)險(xiǎn)其實(shí)很低。并不是說(shuō)他們拿了權(quán)重就能重現(xiàn)你的服務(wù)。而且推理其實(shí)超級(jí)難。Sherwin Wu:推理是個(gè)難題。所以我個(gè)人認(rèn)為開(kāi)源與API業(yè)務(wù)的關(guān)系是:第一,沒(méi)看到蠶食風(fēng)險(xiǎn)。第二,特別是對(duì)所有大實(shí)驗(yàn)室來(lái)說(shuō),通常有兩三個(gè)模型產(chǎn)生了所有的影響和收入。那些是我們投入大量資源改進(jìn)的模型,也是推理極其困難的模型。
如果你看我們的推理團(tuán)隊(duì),真的很強(qiáng)。我的感覺(jué)是,即使我們開(kāi)源了 GPT-5,要以我們能做到的水平去運(yùn)行推理也是非常非常難的。
Martin Casado:是否可能為產(chǎn)品垂直化模型?Sherwin Wu:我覺(jué)得我們?cè)谙蚰莻€(gè)方向移動(dòng)。問(wèn)題是垂直化多深。我們做的大部分是在后訓(xùn)練(Post-training)、工具使用層面。比如 GPT-5 Codex 特別擅長(zhǎng)使用 Codex 框架。但還有更深層的垂直化。
Martin Casado:我這很多的思維模型來(lái)自Pixel(圖像)領(lǐng)域。你可以LoRA一堆圖像模型,做很多事讓它更適合某些產(chǎn)品。你會(huì)相信你可以為編輯或剪切粘貼垂直化一個(gè)模型。但在文本領(lǐng)域你看不到這個(gè)。幾乎總是你只是暴露一個(gè)模型。Sherwin Wu:我認(rèn)為圖像模型和文本模型有區(qū)別。圖像模型往往小得多,迭代快得多。這就是為什么圖像模型那邊有瘋狂的爆發(fā)。而對(duì)于文本模型,總會(huì)有這個(gè)非常大的預(yù)訓(xùn)練模型。即使是后訓(xùn)練也不容易,算力還是挺重的。所以我認(rèn)為那是更大的瓶頸。在圖像方面,你可以微調(diào)它讓它極其擅長(zhǎng)編輯人臉……然后圍繞它構(gòu)建產(chǎn)品。
Martin Casado:我得說(shuō),在同一家公司做語(yǔ)言模型和像Pixel這樣的擴(kuò)散模型有點(diǎn)反模式Anti-pattern)。大多數(shù)嘗試過(guò)的公司都覺(jué)得很笨重。但你們和是兩個(gè)反例。這些基礎(chǔ)設(shè)施能融合嗎?是不同的組織嗎?共享基礎(chǔ)設(shè)施嗎?Sherwin Wu:我覺(jué)得你完全沒(méi)錯(cuò),這是反模式,很難搞定。我覺(jué)得要?dú)w功于我們的研究團(tuán)隊(duì),架構(gòu)得很好。但我認(rèn)為最重要的是,我們的世界模擬團(tuán)隊(duì)(構(gòu)建 Sora 的團(tuán)隊(duì))非常扎實(shí)。
Martin Casado:是同樣的基礎(chǔ)設(shè)施嗎?Sherwin Wu:是同樣的……其實(shí)相當(dāng)獨(dú)立。這也是我們能做到的原因之一。團(tuán)隊(duì)必須極強(qiáng),而且它們運(yùn)行得非常獨(dú)立。它們思考自己的路線圖,獨(dú)立思考產(chǎn)品化(這也是 Sora App 誕生的原因)。甚至推理?xiàng)R猜杂胁煌?/p>
Martin Casado:我以為API主要是基于文本的。你們做實(shí)際的基于圖像的東西嗎?Sherwin Wu:做,我們有一堆。DALL-E API。DALL-E 2 是那個(gè)讓我決定加入 OpenAI 的模型。我記得讓它畫(huà)一只鴨子,它生成了一張白鴨子的照片,那讓我決定加入。我們?cè)?API 里有圖像生成,也有視頻生成。
Martin Casado:我還有一百萬(wàn)個(gè)問(wèn)題想問(wèn)你,但時(shí)間到了。非常感謝。Sherwin Wu:謝謝。
2025盛景半年回顧
人生只有四千周,而企業(yè)生存期更短,跨越10年經(jīng)營(yíng)期的企業(yè)少之又少,企業(yè)要想有質(zhì)量地活下去,活得更好更久,“極簡(jiǎn)增長(zhǎng)”就是看透并掌控事物本質(zhì)的那個(gè)關(guān)鍵點(diǎn)。
選對(duì)了路,路就不會(huì)遠(yuǎn)。盛景推出《極簡(jiǎn)增長(zhǎng) 立竿見(jiàn)影》在線課程,期望能夠幫助更多的企業(yè)走上增長(zhǎng)道路。未來(lái)有多近,在于我們已經(jīng)走了多遠(yuǎn)。未來(lái)有多遠(yuǎn),在于我們與誰(shuí)同行。期待與你同行、共勉。
歡迎大家點(diǎn)擊底部【閱讀原文】觀看《極簡(jiǎn)增長(zhǎng) 立竿見(jiàn)影》的在線視頻課程,了解如何用極致簡(jiǎn)單的增長(zhǎng)方法論,實(shí)現(xiàn)快速增長(zhǎng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.