337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

全球算力格局震蕩,“高階TPU”崛起!

0
分享至


芯東西(公眾號:aichip001)
作者 程茜
編輯 漠影

芯東西3月2日消息,近日,多家外媒報道,非GPU芯片應(yīng)用迎來爆發(fā)期,前有Meta傳已與谷歌簽署數(shù)十億美元合作,大規(guī)模租用TPU訓(xùn)練模型;后有OpenAI被曝計劃導(dǎo)入英偉達基于Groq技術(shù)的AI推理芯片。

這些重磅合作正是全球AI算力格局加速重構(gòu)的縮影。2026年伊始,摩根大通的一份產(chǎn)能報告流出:谷歌計劃在2027年部署600-700萬顆TPU,大部分將供給Anthropic、OpenAI、Meta以及蘋果等外部客戶。

無獨有偶,2月13日,OpenAI上線GPT-5.3-Codex-Spark。這款模型選擇了一家特殊的芯片廠商來承接推理任務(wù)——Cerebras,一個以“晶圓級芯片”挑戰(zhàn)英偉達的“叛逆者”。這是OpenAI首次在主力模型上大規(guī)模采用非GPU芯片完成部署,背后原因在于Cerebras帶來的更低延遲與更低能耗,為實時編程帶來接近實時的響應(yīng)體驗。

僅僅半年之前,全球AI產(chǎn)業(yè)的目光還牢牢鎖定在英偉達的財報和產(chǎn)能分配上,人們爭相與這家算力巨擘結(jié)成利益同盟。如今,全球頭號AI玩家們紛紛重新規(guī)劃未來幾年的芯片訂單。

IDC預(yù)測,到2028年,中國非GPU服務(wù)器市場規(guī)模占比將接近50%;高盛投資研究部的模型顯示,全球AI服務(wù)器中非GPU芯片出貨占比,將從2024年的36%增長至2027年的45%。


▲全球AI芯片中GPU架構(gòu)和非GPU架構(gòu)比例(數(shù)據(jù)來源:高盛全球投資研究部,芯東西制圖)

面對日益清晰的算力變局,一個更深層的轉(zhuǎn)折正在發(fā)生:AI的競爭焦點正從單純的算力規(guī)模,深刻轉(zhuǎn)向?qū)δ苄П扰c延遲的極致追求

這一轉(zhuǎn)折,將GPU推向?qū)擂尉车兀河捎诿看斡嬎愣夹枰谕獠匡@存和計算單元之間頻繁往返搬運數(shù)據(jù),這種冗長的傳輸路徑讓GPU始終受困于高能耗和高延遲的先天缺陷。路透社爆料,OpenAI已多次表示對英偉達芯片的“不滿”——響應(yīng)速度未達預(yù)期,在代碼生成產(chǎn)品Codex上感受尤為明顯。

壓力迫使英偉達這條“巨龍”尋求改變。2025年底,英偉達不惜以近三倍溢價拿下Groq核心技術(shù)與團隊。這家公司的創(chuàng)始人Jonathan Ross正是谷歌TPU核心設(shè)計者。被稱為“TPU之父”的他,創(chuàng)立Groq的初衷就是要打造一款超越谷歌TPU的AI芯片。最終,英偉達以200億美元的天價,買下了這把“高階TPU”之劍。

去GPU化的趨勢仍在繼續(xù)。沒有人愿意把未來十年的基礎(chǔ)設(shè)施押注在一個能耗大、延遲高、系統(tǒng)封閉的技術(shù)上。但這場算力變局的核心懸念尚未解開:TPU能否真正扛起對抗GPU的大旗?那個讓英偉達不惜押下重注的Groq,又藏著怎樣的技術(shù)底牌?


一、從自用到商用:谷歌TPU擾動全球算力格局

一直以來,谷歌TPU都作為其內(nèi)部的核心算力支撐,專供自家大模型訓(xùn)練與推理使用。而去年至今,谷歌策略發(fā)生重大轉(zhuǎn)變,被曝要正式將TPU推向商用市場。

巨額訂單迅速涌向谷歌。

博通CEO透露,AI明星公司Anthropic下單了總額210億美元(約1486億元人民幣)的訂單,采購基于谷歌TPU構(gòu)建的AI算力系統(tǒng);與此同時,Meta被曝已與谷歌達成數(shù)十億美元的AI芯片交易。此外,潛在客戶還包括蘋果,以及已與SpaceX合并的xAI等,TPU市場規(guī)模持續(xù)擴大。

這背后是雙重機遇的疊加。

一方面,大模型進入規(guī)模化落地階段,全球算力需求爆發(fā)、成本壓力加劇,單一依賴GPU的架構(gòu)瓶頸日益凸顯

另一方面,谷歌TPU的性能已具備與頂級GPU分庭抗禮的實力——2025年推出的第七代TPU,是谷歌迄今為止性能最高、可擴展性最強的AI芯片:單芯片峰值算力4614 TFLOPS(FP8精度),最大集群9216顆芯片、總算力達42.5 EFLOPS。

TPU v7在同等算力輸出下功耗僅為英偉達B200的40%至50%。更為關(guān)鍵的是,依托自研光電路交換機(OCS)技術(shù),其萬卡級集群可實現(xiàn)近乎線性的加速比,顯著降低了傳統(tǒng)GPU集群在萬卡規(guī)模下的通信效率損耗。


▲Google TPU v5e、v5p、v6、v7 芯片關(guān)鍵性能對比(圖片來源:SemiAnalysis)

谷歌TPU崛起還有更為直接的例證:在TPU上訓(xùn)練的Gemini 3,在多個權(quán)威基準測試中位居榜首,為業(yè)界頂尖模型之一。

此外,對于大模型公司而言,算力成本是繞不開的難題。“每美元產(chǎn)生的Token數(shù)”正取代峰值算力,成為衡量芯片商業(yè)價值的標尺。TPU憑借AI專用架構(gòu)帶來的2-4倍能效優(yōu)勢,以及萬卡集群近乎線性的擴展能力,將大模型推理的綜合成本相比GPU拉低50%以上——這正是Anthropic、Meta們用訂單投票的根本邏輯。

因此,當下大多大模型企業(yè)會選擇采購TPU+GPU多元算力來緩解成本壓力。去年11月,半導(dǎo)體研究機構(gòu)SemiAnalysis對比大模型公司的采購成本后發(fā)現(xiàn):與OpenAI相比,同時使用TPU與GPU的Anthropic,在與英偉達談判時擁有更強的議價權(quán)。這一事實表明:未來頭部AI公司,大概率都會轉(zhuǎn)向“多芯片并行”路線,以降低對單一架構(gòu)的依賴、提升成本競爭力。


▲OpenAI與Anthropic購買算力的成本對比(圖片來源:SemiAnalysis)

綜上,谷歌TPU的性能跨越式提升、頂尖大模型的規(guī)模化驗證、頭部AI公司的主動布局,這三重因素共同印證,TPU已從過去的全球算力產(chǎn)業(yè)補充路線,正式升級為全球算力競爭中的主流路線。這不僅打破了長期由英偉達絕對主導(dǎo)的AI芯片格局,也為國內(nèi)外算力芯片打開了全新發(fā)展窗口。

二、不止于TPU:十年磨一劍,“TPU之父”探索更高階的可能

然而,谷歌TPU的成功并非終點。國內(nèi)外一批聚焦TPU芯片的創(chuàng)新企業(yè)快速崛起,它們擺脫復(fù)刻谷歌TPU的發(fā)展模式,逐步走出了一條差異化、多元化并行的發(fā)展之路。

這其中的代表玩家,就是被英偉達高價收購的AI芯片創(chuàng)企Groq。這家公司的創(chuàng)始人,被稱為“TPU之父”的Jonathan Ross,創(chuàng)立Groq的初衷就是要打造一款超越谷歌TPU的AI芯片。行業(yè)資深專家表示,二者的不同之處與芯片架構(gòu)密切相關(guān)。

谷歌TPU采用“固定架構(gòu)+集群擴展”的設(shè)計思路:其芯片內(nèi)部搭載相對固定的計算單元,依托二維數(shù)據(jù)流模式開展固定化的算力運算;在芯片間互聯(lián)層面,則通過構(gòu)建3D Torus拓撲結(jié)構(gòu),實現(xiàn)多芯片間的高效數(shù)據(jù)流傳輸與協(xié)同計算。


▲谷歌TPU架構(gòu)(圖片來源:谷歌官網(wǎng))

與谷歌TPU芯片的固定數(shù)據(jù)流不同,Groq的TSP(Tensor Streaming Processor)芯片是一種“軟件定義硬件”(Software Defined Hardware)的新型數(shù)據(jù)流處理器。

“通過構(gòu)建可重構(gòu)的軟硬件系統(tǒng),使其在保持可編程性的同時,達到接近ASIC的極致性能。”美國DARPA“電子復(fù)興計劃”(ERI)高度看好“軟件定義硬件”技術(shù),并將其作為國家級戰(zhàn)略布局的核心方向之一。

這也是Groq被稱之為“高階TPU”的原因。通過芯片內(nèi)功能切片化微架構(gòu)的底層設(shè)計,結(jié)合軟件層面的靈活配置能力,TSP可根據(jù)不同任務(wù)場景和計算需求實現(xiàn)計算邏輯與數(shù)據(jù)流路徑映射。同時,該芯片依托大容量片上SRAM及靜態(tài)調(diào)度機制,在顯著提升數(shù)據(jù)訪存效率的同時還能有效降低數(shù)據(jù)搬運能耗,實現(xiàn)計算效率的提升。

二者的性能表現(xiàn)對比,Groq的優(yōu)勢也已經(jīng)得到數(shù)據(jù)驗證。公開信息顯示,在相同推理任務(wù)中,Groq芯片的首token延遲比谷歌TPU v7芯片降低20%~50%,每token成本降低10%~30%

架構(gòu)選擇的背后,折射出整個產(chǎn)業(yè)對計算效率瓶頸的重新審視。計算機體系結(jié)構(gòu)泰斗、圖靈獎獲得者David Patterson教授在最新研究中指出,大模型每次生成都繞不開數(shù)據(jù)搬運,而搬運能耗遠高于計算本身,未來的核心命題是“讓數(shù)據(jù)離計算更近”。

為此,他提出了幾個AI芯片的演進方向:近內(nèi)存處理、3D堆疊、低延遲互連。這些均指向同一個目標——用架構(gòu)創(chuàng)新降低數(shù)據(jù)移動的能耗與延遲

David Patterson的洞察將AI規(guī)模化的競爭拉回最樸素的物理層面,誰能用更低的能耗、更低的延遲跑通下一代模型,誰就能在未來十年的算力牌桌上占得先機。

三、“高階TPU”含金量還在上升:三大創(chuàng)新將架構(gòu)優(yōu)勢發(fā)揮至極

相比于Groq所強調(diào)的確定性數(shù)據(jù)流能力,國內(nèi)的清微智能、海外的Cerebras等芯片企業(yè)在高效的多維度數(shù)據(jù)流動態(tài)配置及先進集成方式上,還在持續(xù)提升“高階TPU”的含金量。

主要表現(xiàn)為如下幾個方面:

其一,通過3D Chiplet技術(shù)構(gòu)建三維立體數(shù)據(jù)流架構(gòu)。依托“計算核心+3D DRAM芯粒”的組合,清微智能在“垂直+水平”兩個維度上形成高效數(shù)據(jù)流計算模式,核心目標是突破傳統(tǒng)二維數(shù)據(jù)流架構(gòu)的效率局限。

具體而言,三維數(shù)據(jù)流計算架構(gòu)可依據(jù)計算任務(wù)核心需求以及數(shù)據(jù)特性,在水平維度與垂直維度上實現(xiàn)數(shù)據(jù)流的靈活調(diào)度,最大化縮短數(shù)據(jù)傳輸路徑、提升數(shù)據(jù)流周轉(zhuǎn)效率,顯著降低數(shù)據(jù)搬運過程中的延遲與能耗,最終實現(xiàn)計算效率的進一步提升。

其二,是依托算力網(wǎng)格技術(shù)構(gòu)建靈活數(shù)據(jù)流計算范式。該技術(shù)可突破傳統(tǒng)固定組網(wǎng)的擴展性與語義適配瓶頸,通過靈活組網(wǎng)及Scale up與Scale out協(xié)同,能根據(jù)AI任務(wù)特性,實時下發(fā)數(shù)據(jù)流的動態(tài)配置信息,實現(xiàn)在多種互聯(lián)拓撲結(jié)構(gòu)間靈活切換和精準調(diào)度,降低互聯(lián)延遲,充分釋放數(shù)據(jù)流架構(gòu)算力。

其三,通過前沿的晶圓級芯片技術(shù),將數(shù)據(jù)流架構(gòu)的優(yōu)勢發(fā)揮到極致。具體而言,晶圓級芯片技術(shù)將數(shù)據(jù)流架構(gòu)思想從芯片內(nèi)部擴展至整片晶圓尺度,在整片晶圓高密度集成大量計算核心,極大縮短計算核心間的互聯(lián)距離,實現(xiàn)數(shù)量級的互聯(lián)帶寬提升與通信延遲的降低,從而將數(shù)據(jù)流架構(gòu)的算力規(guī)模與計算效能發(fā)揮到極致,是數(shù)據(jù)流計算架構(gòu)的理想物理載體。

以Cerebras晶圓級芯片為例。實測數(shù)據(jù)顯示,Cerebras CS 3系統(tǒng)在推理性能上較英偉達旗艦DGX B200 Blackwell GPU快21倍,成本與功耗均降低 1/3,在算力、成本、能效上展現(xiàn)出顯著的綜合優(yōu)勢。


▲Cerebras CS-3 vs英偉達GPU:大模型推理速度對比(圖片來源:Cerebras官網(wǎng))

結(jié)語:AI算力規(guī)則正在重構(gòu)

當谷歌TPU走出圍墻、OpenAI擁抱晶圓級芯片、英偉達天價收編Groq,這些信號均指向同一個方向:TPU已變成巨頭們真金白銀押注的主戰(zhàn)場。

算力世界的單極時代,正在被多元架構(gòu)終結(jié)。決定下一代AI天花板的,不再是算力堆砌的軍備競賽,而是能耗、延遲、確定性共同構(gòu)成的AI能力新指標。

對于國產(chǎn)芯片而言,這場變局既是機遇也是挑戰(zhàn)。跟隨者只能瓜分殘羹,唯有走出自己的底層創(chuàng)新之路,才有資格參與下一輪全球算力洗牌。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
科曼:斯密特適合巴薩,他可以成為德容與佩德里的結(jié)合體

科曼:斯密特適合巴薩,他可以成為德容與佩德里的結(jié)合體

懂球帝
2026-04-17 07:32:15
NBA附加賽:一場沒人想贏的饑餓游戲

NBA附加賽:一場沒人想贏的饑餓游戲

賽場速報局
2026-04-16 10:01:06
灰熊提前一小時通知莫蘭特離隊:一場精心設(shè)計的羞辱

灰熊提前一小時通知莫蘭特離隊:一場精心設(shè)計的羞辱

體壇觀察猿
2026-04-16 08:11:22
打了45天,伊朗終于發(fā)現(xiàn)最大敵人不是美國,不是以色列,而是他們

打了45天,伊朗終于發(fā)現(xiàn)最大敵人不是美國,不是以色列,而是他們

楠楠自語
2026-04-15 13:07:39
伊朗暫停石化產(chǎn)品出口,直至另行通知

伊朗暫停石化產(chǎn)品出口,直至另行通知

財聞
2026-04-16 17:32:56
《街頭霸王》真人電影首曝中字預(yù)告片,北美10月16日上映

《街頭霸王》真人電影首曝中字預(yù)告片,北美10月16日上映

IT之家
2026-04-16 22:02:32
村霸在我家魚塘電魚,我沒鬧,連夜倒8斤豬血,隔天一早他傻眼了

村霸在我家魚塘電魚,我沒鬧,連夜倒8斤豬血,隔天一早他傻眼了

白淺娛樂聊
2026-04-16 09:22:52
震驚!一女孩求職不順焦慮,父親轉(zhuǎn)來4.8萬,按月4000元當作工資

震驚!一女孩求職不順焦慮,父親轉(zhuǎn)來4.8萬,按月4000元當作工資

火山詩話
2026-04-14 07:33:54
「機器人+」智元人形機器人“上崗”龍旗產(chǎn)線!姚卯青預(yù)測:兩年后具身智能3C產(chǎn)線滲透率可達50%

「機器人+」智元人形機器人“上崗”龍旗產(chǎn)線!姚卯青預(yù)測:兩年后具身智能3C產(chǎn)線滲透率可達50%

華夏時報
2026-04-15 22:50:01
劉維偉最后悔的并非1800萬引進王奕博,而是放棄加盟浙江的約翰遜

劉維偉最后悔的并非1800萬引進王奕博,而是放棄加盟浙江的約翰遜

金風(fēng)說
2026-04-17 00:37:10
“老師最煩這種現(xiàn)眼包家長”,寶媽穿緊身裙參加運動會,被嘲

“老師最煩這種現(xiàn)眼包家長”,寶媽穿緊身裙參加運動會,被嘲

蝴蝶花雨話教育
2026-04-02 10:30:13
大眾小鵬首款聯(lián)合開發(fā)車型正式上市,22.99萬起售

大眾小鵬首款聯(lián)合開發(fā)車型正式上市,22.99萬起售

界面新聞
2026-04-16 22:06:49
當年咄咄逼人,如今滿是遺憾!頭部男主播深夜道歉!后悔切割退魚前一姐!女方現(xiàn)身開通年鉆!

當年咄咄逼人,如今滿是遺憾!頭部男主播深夜道歉!后悔切割退魚前一姐!女方現(xiàn)身開通年鉆!

新浪財經(jīng)
2026-04-17 00:40:08
網(wǎng)約車司機智斗境外間諜,獲特別重大貢獻獎勵

網(wǎng)約車司機智斗境外間諜,獲特別重大貢獻獎勵

環(huán)球網(wǎng)資訊
2026-04-16 08:50:01
趕緊關(guān)掉!國安部警示:很多人手機都開著,隱私全漏光

趕緊關(guān)掉!國安部警示:很多人手機都開著,隱私全漏光

墜入二次元的海洋
2026-04-16 11:32:22
許家印親自面試女大學(xué)生!建恒大歌舞團目的曝光:貴賓房非常恐怖

許家印親自面試女大學(xué)生!建恒大歌舞團目的曝光:貴賓房非常恐怖

風(fēng)過鄉(xiāng)
2026-04-17 07:14:57
等了 166 年,連做夢都不敢想的事,居然真的照進現(xiàn)實了。

等了 166 年,連做夢都不敢想的事,居然真的照進現(xiàn)實了。

果媽聊娛樂
2026-04-16 07:28:51
早上一碗燕麥,全天都在和饑餓感作斗爭——哈佛研究顛覆你的認知

早上一碗燕麥,全天都在和饑餓感作斗爭——哈佛研究顛覆你的認知

富貴說
2026-03-19 13:50:28
西媒:皇馬想找聲名顯赫的教練而非少帥;卡馬文加很可能離隊

西媒:皇馬想找聲名顯赫的教練而非少帥;卡馬文加很可能離隊

懂球帝
2026-04-17 02:12:14
美軍打擊伊朗,動用多少實力及總占比?

美軍打擊伊朗,動用多少實力及總占比?

高博新視野
2026-04-12 08:00:17
2026-04-17 08:16:49
芯東西 incentive-icons
芯東西
專注AI芯片、半導(dǎo)體產(chǎn)業(yè)媒體
2283文章數(shù) 8153關(guān)注度
往期回顧 全部

科技要聞

Anthropic推出Opus 4.7,坦言依不及Mythos

頭條要聞

以媒:從媒體上得知與黎巴嫩停火 以色列高官又驚又怒

頭條要聞

以媒:從媒體上得知與黎巴嫩停火 以色列高官又驚又怒

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

親子
健康
旅游
數(shù)碼
游戲

親子要聞

孩子積食,脾胃虛弱

干細胞抗衰4大誤區(qū),90%的人都中招

旅游要聞

4月16日最佳情報|中山公園沉靜古樸,泉城公園流蘇盛放!恭喜

數(shù)碼要聞

2999元!大疆Pocket 4出手就是王炸,兩年半等待值了

魔獸世界:時光服爭議不斷,DPS要求大鍋飯,團長選擇發(fā)放補貼

無障礙瀏覽 進入關(guān)懷版