337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產(chǎn)GPU迎戰(zhàn)英偉達H200

0
分享至



給國產(chǎn)芯片多一些時間

文/林書

編輯/劉宇翔

2025年12月17日,沐曦股份在科創(chuàng)板上市,首日收盤價829.90元,較發(fā)行價104.66元上漲725.24%,沐曦專注于高性能GPU芯片研發(fā),產(chǎn)品覆蓋人工智能計算、通用計算及圖形渲染領(lǐng)域。

就在不到兩周前的12月5日,摩爾線程正式登陸科創(chuàng)板,成為“國產(chǎn)GPU第一股”,是2025年科創(chuàng)板募資額最大的IPO,從受理到過會僅用88天,發(fā)行價為114.28元/股,上市首日漲幅達425.46%。

國產(chǎn)GPU 廠商的密集上市并備受市場追捧,某種程度上,對“狼又回來了”的回應(yīng)。據(jù)媒體報道,2025年12月8日,美國總統(tǒng)特朗普在社交媒體宣布:美國將允許英偉達向中國"經(jīng)批準(zhǔn)的客戶"出口H200人工智能芯片,但需將銷售收入的25%上繳美國政府。

美國智庫進步研究所報告顯示,H200的性能幾乎是H20的六倍,但仍與最新的Blackwell芯片存在代際差距——這恰好卡在"能用但不先進"的甜蜜點上。因此美國解禁 H200其實是其"溫水煮青蛙"策略的延續(xù)——“傾銷”性能相對落后但仍具競爭力的H200芯片,試圖延緩中國國產(chǎn)替代的進程。

更有意思的是,黃仁勛曾直言不諱地表示,增加對華芯片銷售額既能讓中國企業(yè)依賴其技術(shù),又能為公司帶來更多研發(fā)資金。這種"以戰(zhàn)養(yǎng)戰(zhàn)"的思路,與美國鷹派的"技術(shù)依賴論"不謀而合。

但這場"溫水煮青蛙"的意圖能否得逞,還要看我國接不接招。從加快國產(chǎn) GPU 廠商上市來看,顯然,我國并不上鉤。

01

沒有H200的日子

2022年至2025年,美國對華半導(dǎo)體出口管制政策層層加碼。2025年4月,美國進一步收緊管制,導(dǎo)致英偉達為中國市場定制的特供版H20芯片被迫停售,公司因此承受了約45億美元的庫存損失及80億美元的潛在收入損失。英偉達CEO黃仁勛在2025年10月公開表示,受出口管制影響,英偉達在中國的市場份額從95%驟降至0%,公司"100%離開了中國市場"。

這三年,被業(yè)界稱為中國AI芯片產(chǎn)業(yè)的"至暗時刻",但也正是這三年,催生了國產(chǎn)芯片的加速崛起。面對外部封鎖,國產(chǎn)GPU廠商采取了"三管齊下"的突圍策略:

在單卡性能暫時無法與英偉達匹敵的情況下,國產(chǎn)廠商通過堆面積、堆晶體管、堆芯片的方式來彌補性能差距。華為昇騰910C采用雙Die設(shè)計,F(xiàn)P16算力達到800 TFLOPS,性能逼近英偉達H100的80%;寒武紀(jì)思元590綜合性能達到英偉達A100的70-80%;海光信息深算二號FP16算力達1024 TFLOPS,接近A100的90%。

由于能效比較差,國產(chǎn)卡普遍采用"電力+工程能力"硬頂?shù)姆绞浇鉀Q功耗問題。摩爾線程的"平湖"架構(gòu)支持單芯片最高1000W TDP動態(tài)功耗管理,通過液冷等工程手段確保穩(wěn)定運行。雖然每瓦性能仍落后英偉達約30%,但國產(chǎn)卡低功耗版已經(jīng)正流片。

說白了,在這段時期,國產(chǎn)卡往往采用用更密集的液冷,堆更多服務(wù)器機架,試圖以更強的工程能力來補落后的能效。

最后是"生態(tài)兼容+編譯層hack"。面對英偉達CUDA生態(tài)的壟斷地位,國產(chǎn)廠商采取了兼容策略。海光DCU通過ROCm生態(tài)實現(xiàn)對CUDA的"軟兼容",實測遷移效率可達85%。華為CANN架構(gòu)采用"指令翻譯+動態(tài)調(diào)度"技術(shù),實現(xiàn)對CUDA API的80%覆蓋。

這里的“兼容 CUDA”,從技術(shù)上來說,相當(dāng)于做了一層翻譯器,讓國內(nèi) GPU 能跑英偉達的指令語言,例如英偉達的函數(shù)叫 CUDA_X,國產(chǎn)的函數(shù)叫 BR_X(比如壁仞),→ 相當(dāng)于就做一張“對應(yīng)關(guān)系表”,代碼調(diào)用 CUDA_X 時自動轉(zhuǎn)成 BR_X。就像查字典一樣,把“英偉達語”翻譯成“國產(chǎn)語”,通過合并算子、分拆算子、調(diào)整執(zhí)行順序等一系列手段,將CUDA中的算式變得更適合本地語法。

但問題也顯而易見:永遠慢半拍——因為對方不斷更新語言,你永遠要追新詞,英偉達每次更新CUDA、更新架構(gòu),國產(chǎn)廠商立刻要做新的翻譯器,這在戰(zhàn)略上十分被動。

H200 被擋在門口的三年,國產(chǎn) GPU 技術(shù)路線呈現(xiàn)出非常鮮明的“中國式風(fēng)格”——在工藝受限的情況下,通過“架構(gòu)取巧、集群堆疊、算子融合、軟件兼容”這些工程學(xué)上的努力,硬生生把落后的硬件打磨到可用、能上規(guī)模、適配大模型訓(xùn)練的程度。

這套路線不是工程上的最優(yōu)解,但在封鎖環(huán)境下,是現(xiàn)實可行的最優(yōu)解。

02

差距到底在哪?

要評估國產(chǎn)GPU與英偉達H200的技術(shù)差距,需要用統(tǒng)一的標(biāo)準(zhǔn)進行量化對比。根據(jù)美國商務(wù)部工業(yè)與安全局(BIS)定義的"總處理性能"(TPP)指標(biāo),可以對主流AI芯片進行橫向比較,作為參考。

這里的TPP指標(biāo),指的是解析:TPP = 2 × MacTOPS × 操作位長,通常以TFLOPS(FP16)× 16計算。根據(jù)伯恩斯坦研究2025年12月發(fā)布的報告,各芯片TPP性能對比如下:

- 英偉達H200:60,000 TPP(基于Hopper架構(gòu),141GB HBM3e,4.8TB/s帶寬)

- 英偉達H20:15,832 TPP(特供版,性能僅為H200的26%)

- 華為昇騰910C:36,912 TPP(性能約為H200的61.5%,國產(chǎn)最高)

- 寒武紀(jì)思元590:29,360 TPP(性能約為H200的49%)

- 海光BW1000/DCU3:14,688 TPP(性能約為H200的24.5%)

- 摩爾線程S4000:約20,000 TPP(性能約為H200的33%)

從公開數(shù)據(jù)可以看出,國產(chǎn)頂級芯片在單卡性能上仍落后H200約1.6-2倍,但已經(jīng)超越了H20,達到了"可用"的水平。

然而,在訓(xùn)練能力方面,國產(chǎn)卡單卡仍落后2-3倍,但所幸的是,集群層面可通過"堆卡+高速互聯(lián)"彌補部分差距。

華為CloudMatrix 384集群(384張昇騰910C)性能接近英偉達GB200 NVL72,在部分大模型訓(xùn)練任務(wù)中表現(xiàn)良好。但需要注意的是,由于工藝制程限制(國產(chǎn)芯片普遍采用7nm,H200采用4nm),每瓦性能仍落后30%左右。

推理能力方面,國產(chǎn)Top卡已持平甚至超越閹割版H20。華為昇騰910B2的INT8算力達到762 TOPS,在推理階段處理低精度數(shù)據(jù)效率較高;寒武紀(jì)思元590在推理場景中也表現(xiàn)優(yōu)異,KV-Cache放得下、帶寬夠用。沐曦曦云C550的顯存帶寬達到1600-1800GB/s,超越H200的4.8TB/s,在大規(guī)模推理任務(wù)中具有優(yōu)勢。

成本和功耗方面,目前海光BW100采購價格約10萬元/張,寒武紀(jì)590價格從最初8.5萬元降至6-7萬元,華為910C約18萬元,均顯著低于H200的30-40萬元。更重要的是,H200還需額外支付25%的"美國稅",使得國產(chǎn)卡在成本上具有約50%的優(yōu)勢。功耗方面,雖然國產(chǎn)卡單卡功耗較高,但考慮到H200的700W TDP,實際差距并不懸殊。

生態(tài)進度是國產(chǎn)芯片最大的短板,但也是進步最快的領(lǐng)域。

目前,華為昇騰的CANN 工具鏈已支持與 MindSpore 深度協(xié)同和 PyTorch 一鍵遷移。其他國產(chǎn)平臺也在做類似深度編譯器與中間表示 (IR) 適配,讓開發(fā)者可以更少手動改代碼地運行大模型。



其中的主要原因,在于不同國產(chǎn)芯片廠商、云廠商、軟件團隊、科研院校都在合作推動生態(tài)規(guī)范標(biāo)準(zhǔn)化、工具共享、適配案例共享。

這種產(chǎn)業(yè)協(xié)同在生態(tài)建設(shè)上是少見優(yōu)勢。

綜合來看,國產(chǎn)芯片與H200在訓(xùn)練方面的差距依舊存在,但在推理方面,已收斂到"能用+成本更低+可控"的水平。

現(xiàn)階段,國產(chǎn)芯片正從"勉強及格"向"好用"的爬坡階段邁進,根據(jù)根據(jù)伯恩斯坦的推測,預(yù)計2026-2027年,將在部分場景實現(xiàn)與H200的全面競爭。

03

未來的較量

在產(chǎn)業(yè)方面,從技術(shù)演進來看,英偉達剛剛發(fā)布的Blackwell Ultra系列仍延續(xù)"堆料漲性能"的路線,賭的是摩爾定律(或"黃氏定律")尚未終結(jié)。所謂“黃氏定律”,不是什么物理學(xué)定律,而是英偉達CEO黃仁勛提出的'GPU性能每兩年翻一倍'的經(jīng)驗法則。

這種“定律”與其說是自然規(guī)律,不如說是英偉達研發(fā)投入和市場策略的體現(xiàn)——每年投入超過70億美元的研發(fā)費用,讓競爭對手望塵莫及。

但國產(chǎn)芯片沒有直接硬碰硬,而是采用"架構(gòu)取巧+多芯片封裝+集群堆疊"的迂回戰(zhàn)術(shù)。華為昇騰采用雙Die設(shè)計,通過先進封裝技術(shù)提升集成度;摩爾線程"平湖"架構(gòu)實現(xiàn)Chiplet可擴展架構(gòu),支持計算Die、HBM3e存儲Die與IODie靈活配置;沐曦曦云C700系列進一步擴展對FP4等低精度的計算支持,對標(biāo)H100。

總體上來看,在先進工藝受限的情況下,國產(chǎn)芯片通過架構(gòu)創(chuàng)新實現(xiàn)了性能突破。華為昇騰910C采用達芬奇架構(gòu)3.0,集成32個自研AI Core,支持原生CANN異構(gòu)計算;寒武紀(jì)思元590采用MLUarch架構(gòu),通過指令集優(yōu)化提升計算效率;海光深算三號采用x86+GPGPU的Chiplet封裝,通過2.5D封裝實現(xiàn)HBM2e內(nèi)存直連,帶寬達1.6TB/s。

這些技術(shù)創(chuàng)新使得國產(chǎn)芯片在特定場景下能夠?qū)崿F(xiàn)與英偉達相媲美的性能表現(xiàn)。

并且從應(yīng)用層面看,國產(chǎn)AI芯片已經(jīng)找到了自己的"舒適區(qū)",而且干得相當(dāng)不錯。

例如智算中心這類場景,現(xiàn)在已經(jīng)成了華為的“主場”。截至2025年,全國600多個智算中心項目中,超過300套Atlas 900超節(jié)點已經(jīng)商用部署,華為昇騰在智算中心領(lǐng)域可以說是"一枝獨秀"。涵蓋互聯(lián)網(wǎng)、電信、制造等多個行業(yè)。中國電信粵港澳大灣區(qū)的智算昇騰超節(jié)點,更是成為全球首個商用的超節(jié)點項目。

同樣地,在面向國內(nèi)大生態(tài)的專用場景,例如智能安防、金融風(fēng)控、OCR / 文本語義檢索、音視頻內(nèi)容處理(如自動剪輯、AI 轉(zhuǎn)碼)等任務(wù)中,國產(chǎn)卡可針對特定算法做深度定制優(yōu)化。

通過自研編譯器和算子庫直接對接國內(nèi)框架如MindSpore,在“我只要這個任務(wù)跑得快就夠了”的場景下,專用定制往往比通用 GPU 效率更高。

而在低延遲/ 小規(guī)模邊緣場景,例如邊緣 AI、工控設(shè)備、機器人本地推理等場景,國產(chǎn) NPU/ASIC 方案比通用 GPU 效率更高。因為架構(gòu)從一開始就針對推理做到低功耗,不依賴重型 CUDA 生態(tài)



說到底,國產(chǎn)芯片的優(yōu)勢場景都有一個共同點:對成本、功耗、供應(yīng)鏈安全敏感。在這些場景,性能不是唯一指標(biāo),性價比和自主可控才是王道。

總結(jié)而言,H200的有限解禁是美國"技術(shù)依賴"策略的體現(xiàn),試圖通過提供次高端產(chǎn)品維持中國對美國技術(shù)的依賴。但這一策略為時已晚——在H200“斷供”的封鎖期內(nèi),中國AI芯片產(chǎn)業(yè)已經(jīng)建立起從硬件到軟件、從單卡到集群的完整解決方案。

而這套日益牢固的基本盤,不是一塊H200 就能輕易“打回原形”的。

更重要的是,大模型越來越穩(wěn)定,訓(xùn)練次數(shù)變少的當(dāng)下,最貴的訓(xùn)練不再那么頻繁,但推理量是每天都在爆炸,國產(chǎn)卡能不能吃掉訓(xùn)練,短期不重要,只要把推理吃死,整個產(chǎn)業(yè)也就立住了。

在進入“戰(zhàn)略相持”階段的當(dāng)下,倘若再多給國產(chǎn)芯片一些時間,假以時日,國產(chǎn)訓(xùn)練卡也將"上桌掰手腕"。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
運河風(fēng)波升級,美方指責(zé)中國“扣押”巴拿馬旗船只,威脅全球供應(yīng)鏈

運河風(fēng)波升級,美方指責(zé)中國“扣押”巴拿馬旗船只,威脅全球供應(yīng)鏈

麓谷隱士
2026-04-05 00:10:12
美國怕的不是伊朗,如果不是中國虎視眈眈,美伊戰(zhàn)爭或許早已結(jié)束

美國怕的不是伊朗,如果不是中國虎視眈眈,美伊戰(zhàn)爭或許早已結(jié)束

安安說
2026-03-29 13:42:09
學(xué)醫(yī)后才知道,腦梗最危險信號,不是手腳麻,而是頻繁出現(xiàn)4癥狀

學(xué)醫(yī)后才知道,腦梗最危險信號,不是手腳麻,而是頻繁出現(xiàn)4癥狀

岐黃傳人孫大夫
2026-04-04 20:19:16
生下早夭畸形兒?帶吸奶器上節(jié)目?闞清子終究崩潰了,謠言太離譜

生下早夭畸形兒?帶吸奶器上節(jié)目?闞清子終究崩潰了,謠言太離譜

曉肂愛八卦
2026-04-04 16:19:46
新能源汽車銷量同比降21%,為何電車賣不動了?三個原因制約銷量

新能源汽車銷量同比降21%,為何電車賣不動了?三個原因制約銷量

王五說說看
2026-04-04 12:21:39
微信出現(xiàn)這條杠,你已經(jīng)不是對方好友了

微信出現(xiàn)這條杠,你已經(jīng)不是對方好友了

小影的娛樂
2026-03-10 07:44:17
真的要變天了…

真的要變天了…

子說一點
2026-04-03 18:15:23
56歲虞美人集團董事長與26歲男友大婚:陪嫁5000萬,男方身份被扒

56歲虞美人集團董事長與26歲男友大婚:陪嫁5000萬,男方身份被扒

老貓觀點
2026-03-19 08:35:09
金昌民遭6人活活打死!目擊者:店內(nèi)遭勒脖已暈厥 施暴者竟笑出來

金昌民遭6人活活打死!目擊者:店內(nèi)遭勒脖已暈厥 施暴者竟笑出來

ETtoday星光云
2026-04-02 17:30:09
麥當(dāng)勞推出“玩家套餐”!這波設(shè)計腦洞炸了

麥當(dāng)勞推出“玩家套餐”!這波設(shè)計腦洞炸了

游民星空
2026-04-03 20:08:18
美國要變天了!一個比特朗普更難纏的80后,已經(jīng)掌握了共和黨

美國要變天了!一個比特朗普更難纏的80后,已經(jīng)掌握了共和黨

夢的微塵
2026-04-03 20:52:31
金飾價格一夜又跌11元

金飾價格一夜又跌11元

財聯(lián)社
2026-04-04 12:36:05
“爸爸昨晚打媽媽,媽媽疼得直叫”,孩子的話讓姥姥臉紅:不敢說

“爸爸昨晚打媽媽,媽媽疼得直叫”,孩子的話讓姥姥臉紅:不敢說

大果小果媽媽
2026-02-04 13:32:40
“科大男生9秒視頻”火了,生猛操作令人嘆為觀止:不愧是高才生

“科大男生9秒視頻”火了,生猛操作令人嘆為觀止:不愧是高才生

妍妍教育日記
2026-03-20 21:33:36
4S店蹭飯260次龐先生本想直播澄清,結(jié)果一不小心說漏嘴了

4S店蹭飯260次龐先生本想直播澄清,結(jié)果一不小心說漏嘴了

西樓知趣雜談
2026-04-02 13:09:45
“破日不上墳,上墳辱先人”,4月5日清明節(jié),今年哪天上墳最好?

“破日不上墳,上墳辱先人”,4月5日清明節(jié),今年哪天上墳最好?

小談食刻美食
2026-04-02 20:48:49
半場-切爾西暫3-0維爾港 哈托開場64秒閃擊 內(nèi)托助攻佩德羅破門

半場-切爾西暫3-0維爾港 哈托開場64秒閃擊 內(nèi)托助攻佩德羅破門

天光破云來
2026-04-05 01:21:30
三任嬌妻皆絕色,他卻晚景凄涼,一生令人唏噓

三任嬌妻皆絕色,他卻晚景凄涼,一生令人唏噓

嘮叨說歷史
2026-03-27 16:39:19
女子被觸摸隱私部位后續(xù)!衣服全被脫光,商家只開除,拒絕賠償

女子被觸摸隱私部位后續(xù)!衣服全被脫光,商家只開除,拒絕賠償

潮鹿逐夢
2026-03-18 10:26:41
別再穿大一碼了!遮肉根本不是靠寬松

別再穿大一碼了!遮肉根本不是靠寬松

Yuki女人故事
2026-04-04 00:05:15
2026-04-05 02:48:49
最話Funtalk
最話Funtalk
不寫平庸的故事
585文章數(shù) 597關(guān)注度
往期回顧 全部

科技要聞

內(nèi)存一年漲四倍!國產(chǎn)手機廠商集體漲價

頭條要聞

伊朗發(fā)動第七輪導(dǎo)彈襲擊 耶路撒冷攔截導(dǎo)彈升空

頭條要聞

伊朗發(fā)動第七輪導(dǎo)彈襲擊 耶路撒冷攔截導(dǎo)彈升空

體育要聞

剎不住的泰格·伍茲,口袋里的兩粒藥丸

娛樂要聞

Q女士反擊,否認逼宋寧峰張婉婷離婚

財經(jīng)要聞

中微董事長,給半導(dǎo)體潑點冷水

汽車要聞

17萬級海豹07EV 不僅續(xù)航長還有9分鐘滿電的快樂

態(tài)度原創(chuàng)

本地
時尚
手機
游戲
家居

本地新聞

跟著歌聲游安徽,聽古村回響

別再穿大一碼了!遮肉根本不是靠寬松

手機要聞

華為新機再曝,旗艦、闊折疊、常規(guī)折疊都有!

好玩還上頭!創(chuàng)新與傳統(tǒng)并存的戰(zhàn)棋黑馬《永鈴回響》值不值得玩?

家居要聞

溫馨多元 愛的具象化

無障礙瀏覽 進入關(guān)懷版