北歐神話中的屠龍少年西古爾德,殺死巨龍法夫納后用龍血沐浴,從而全身長滿鱗片變得刀槍不入,但他洗澡時一片葉子落到了肩膀上,這里成為他唯一的弱點,而且是致命的,最后他也因此而被結拜兄弟殺死。
人可以有弱點,但這個弱點不能致命。
我去全球第二大的軍火供應商雷神集團面試,英語面試時說得磕磕巴巴,公司說:“說你不能交流呢,你還是能說一些,但說你能交流呢……算了,進來有語言環(huán)境后練習幾個月就好了。”于是我就進去了,英文口語只能算我的弱點,不能算命門。
![]()
華為、中興、聯(lián)想在芯片上都是弱項,但對中興、聯(lián)想而言這是致命的弱點,所以2018年中興事件發(fā)生后中興立刻跪了,無條件接受美國方面的規(guī)定和處罰,所有部門無條件且“脫得精光”地接受美國監(jiān)管,沒有任何機密可言,用“屈辱”二字形容不為過。
聯(lián)想是比較“聰明”的,玩的是皇帝的新衣,不用你說,自己先脫光,還裝模作樣一副我弱我有理,惹毛了就高喊兩句“科技無國界”,所以現(xiàn)在聯(lián)想暢通無阻地玩轉全球,因為它真得很弱,對美國而言沒有任何威脅。
這就像當年拉涅利在切爾西的待遇一樣,溫格和弗格森都稱贊他是好人,但等切爾西的主教練換成穆里尼奧后,溫格和弗格森就開始破口大罵了,再無紳士風度。因為拉涅利率領的切爾西就是弱雞,對兩人的球隊構不成任何威脅,換作穆里尼奧后一上來就把他們拉下冠軍寶座。
芯片對華為而言雖然也是弱項,但華為已經(jīng)解決了有無的問題,它對華為而言不致命,但對美國來說就是致命的威脅,所以美國對華為是嚴防死守,從設計到制造、檢測……全方位圍堵。
這種情況下華為是不能倒,更不能輸?shù)模驗槿A為太強了,太能打了,以一當十,讓美國寢食難安。華為芯片和手機業(yè)務力抗高通和蘋果,操作系統(tǒng)以一敵二挑戰(zhàn)谷歌和微軟,AI芯片亮劍英偉達,數(shù)據(jù)庫硬剛甲骨文Oracle,盤古大模型對決OpenAl……
這就像當年蒙古攻打西夏一樣,因為對手太強了,征服西夏后讓成吉思汗心驚不已,下令黨項之間不得通婚,目的是避免養(yǎng)虎為患,必須斬草除根。
西夏敗了,黨項人消失在歷史長河之中,華為如果敗了,同樣沒有投降和茍延殘喘一說,這樣的對手活著就是罪過和威脅。
所以華為必須贏,因為祖國必須“升”。華為代表的已經(jīng)不只是中國科技力量的崛起,而是一種不屈的精神,民族復興和中國崛起的圖騰,大匠功成時的赤霞滿天。
利物浦名帥比爾·香克利說過:“足球無關乎生死,卻高于生死。”同理,華為無關乎戰(zhàn)爭,但兇險程度遠高于戰(zhàn)爭。
2024年,美國打壓六年后發(fā)現(xiàn)華為的科技韌性十足,越壓越強,已經(jīng)無法全面壓制華為。于是美國調整策略,集中力量于一點欲打掉中國的AI產(chǎn)業(yè),也是全球未來二十年的經(jīng)濟和國運增長點。
![]()
實際上,這場科技戰(zhàn)爭中美國并不擔心DeepSeek,也不擔心通義千問、豆包、夸克這些公司和模型。因為這些公司無論內功練得再好,外家功夫完全是不設防的,不堪一擊。
美國掌握著它們的命門——AI芯片,猶如天山童姥握著三十六島七十二洞高手的“生死符”,做到了閻王要你三更死,不會留你到五更的底氣。
但華為昇騰芯片問世后,尤其是最新一代的“昇騰384超節(jié)點”技術讓美國人真急了。因為“昇騰384超節(jié)點”的性能對標英偉達NVL72,通信帶寬提升15倍,已經(jīng)到了能和美國扳手腕的地步。
更讓美國害怕的是華為找到了在AI芯片上不對稱作戰(zhàn)的密匙——光子通訊技術,即在超節(jié)點范圍內用高速總線互聯(lián)替代傳統(tǒng)以太,通信帶寬提升了15倍,通信時延從2微秒做到200納秒,降低了10倍。
這幾乎實現(xiàn)了AI算力芯片之間近乎無縫的連接。
AI模型算力為王,其理論原理如同航天火箭的運載能力,要想推力大就盡可能并聯(lián)越多的發(fā)動機。對火箭而言,發(fā)動機并聯(lián)后的最大難題是發(fā)動機工作時彼此之間的干擾、湍流和共振。
AI芯片想提升算力同樣需要并行處理,將上萬顆處理器并接在一起進行擴展。這時的關鍵是運算的協(xié)同和數(shù)據(jù)的交換,負責擴展而連接芯片之間的跨機帶寬成為最為關鍵的瓶頸和技術。
跨機寬帶好比第一次漢城戰(zhàn)役中的漢江大橋,當時南韓軍隊大敗,潰兵和老百姓全部擠到漢江大橋上往對岸逃命,人多橋窄很快形成擁堵,根本無法做到有序和及時撤離。
最后李承晚不得不壯士斷腕,在橋上依舊還有大批韓國軍民、車輛和坦克的情況下下令炸橋。兵馬再多,無法撤退到對岸都是白搭。
英偉達的優(yōu)勢是芯片算力,華為的優(yōu)勢是通訊技術,當AI集群技術到來的時候,英偉達和華為的優(yōu)勢是各有千秋了。
英偉達的AI芯片相當于是時速400公里的法拉利跑高速,華為的CloudMatrix 384昇騰芯片相當于是巡航速度150公里的彩虹-10傾轉旋翼機天高任鳥飛。
AI密集型模型是既要算力,也要高速通訊通道,二者缺一不可。
在華為創(chuàng)新的架構和光子通訊加持下,華為用12個計算柜和4個總線柜把384顆昇騰AI處理器集合在一起,實現(xiàn)300 PFLOPS的最大算力和48TB的高速內存(注:1 petaflop=每秒1千萬億次運算)。
而且多個這樣的昇騰384芯片還可以再相互組合,通過華為超節(jié)點技術這種組成方式,目前最大的集群是華為十萬卡級的Atlas 900 SuperCluster超節(jié)點集群。
測試結果顯示,昇騰超節(jié)點384在處理Meta的LLama 3等密集型AI模型時,單卡性能達到132 tokens/秒(TPS),是傳統(tǒng)集群的2.5倍。對于Qwen以及DeepSeek等通信密集型多模態(tài)及MoE模型,華為架構的單卡性能達到600至750 TPS,也實現(xiàn)了3倍以上性能的提升。
![]()
當前華為CloudMatrix 384使用的是昇騰910C處理器,910C性能是英偉達H100的60%。華為現(xiàn)在的解決方案是依靠規(guī)模優(yōu)勢和領先的通訊技術抵消自身單個芯片性能較弱的不足。
總結,目前的現(xiàn)狀是華為在芯片技術上落后美國一代,但其擴展解決方案比英偉達和超微半導體(AMD)當前的市場產(chǎn)品領先一代。
而且華為AI算力芯片的更新速度更快,媲美H100的910D已經(jīng)試產(chǎn),將在月底公測,第三季度對外供應。
目前唯一制約中國芯片發(fā)展的是光刻機,如同當年我國的戰(zhàn)斗機發(fā)動機一樣,在持續(xù)不斷地投入之下,突破是遲早的事。一旦突破,華為的芯片制造技術迎頭趕上,而擴展方案又一馬當先,那時就是中國重塑下一代AI模型訓練的整個底層邏輯了。
留給美國的時間不多了。這就像當年毛主席說的一樣:“封鎖吧,封鎖個十年八年的,我們就全部都有了。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.