千問大模型每天要處理多少用戶請求?這個數字恐怕連阿里自己都難以精確統計。但如今,支撐這些海量計算的,已不再是清一色的英偉達GPU。
就在今天,阿里巴巴旗下半導體公司“平頭哥”官網悄然上線了名為“真武810E”的高端AI芯片。
![]()
圖源:平頭哥
這款此前經央視《新聞聯播》曝光的PPU,官方參數顯示其整體性能與英偉達H20相當,標志著阿里成為全球第二家實現大模型研發、云計算平臺與AI芯片全鏈條自主設計與制造的科技企業。
![]()
阿里“真武”亮劍
根據披露的技術參數,“真武810E”配備了96GB的HBM2e高帶寬內存,芯片間互聯帶寬高達700GB/s,支持PCIe 5.0接口,整卡功耗控制在400W左右。
而對比來看,英偉達H20的賣點正是其96GB的HBM3內存和900GB/s的NVLink帶寬,功耗卻高達550W。
可以說,阿里的“真武”在顯存容量上完成了對齊,在互聯帶寬上達到了H20的75%以上,并大幅超越了之前的A800。
這背后傳遞出一個冷峻的現實:國產芯片廠商已經放棄了在“單卡絕對峰值算力”上與英偉達H100/H200死磕(受限于制造工藝和制程),轉而尋找一種更務實的“系統級平衡”。
阿里很清楚,如果能在通信帶寬上咬住英偉達,通過萬卡集群的規模效應,完全可以彌補單片性能的微弱差距。
![]()
圖源:《財經》雜志
另一方面,“真武”之所以被稱為PPU(Parallel Processing Unit,并行處理器),而非傳統的GPU(圖形處理器),是因為它從設計之初就剝離了圖形渲染等冗余功能。
作為阿里全棧自研的產物,“真武”在硬件架構上針對Transformer結構的大模型做了深度優化。
在同等算力指標下,運行通義千問(Qwen)等模型的效率,會由于底層指令集的匹配而獲得額外加成。這種“專芯專用”的思路,正是阿里敢于對標英偉達的底氣所在。
不過,我們也必須客觀看到,在HBM技術路徑上,阿里選擇的是HBM2e而非最先進的HBM3/3e。
但這不叫“落后”,而是一種基于供應鏈安全的防御性選擇。
當前全球HBM產能高度緊張,且先進制程封裝(CoWoS)依然是扼住國產芯片咽喉的繩索。
阿里通過自研并行計算架構,試圖用更成熟的封裝工藝和內存方案,實現接近頂尖芯片的效果,這叫“工程學上的最優折中”。
![]()
從“平頭哥”到“通云哥”,阿里的鐵三角陽謀
如果只看芯片,我們看到的只是孤島。
但如果把平頭哥放在阿里巴巴的整體版圖中,你會發現一個名為“通云哥”的龐然大物正在成型。
所謂“通云哥”,即:通義大模型+阿里云+平頭哥。這個組合在全球范圍內,只有谷歌(TPU+Google Cloud+Gemini)能與之完全對應。
甚至連英偉達,在缺乏自研大模型和頂級公有云業務的閉環下,在生態縱深上也略遜一籌。
![]()
圖源:每日經濟新聞
而這背后,是阿里長達17年持續戰略投入的結果:
從2009年創建阿里云,到2018年收購中天微并成立平頭哥芯片公司,再到2019年啟動大模型研究,阿里在關鍵技術領域的長期主義投入,終于在今天形成了協同效應。
相比單一環節的創新,這種全棧優化帶來的效率提升和成本降低是幾何級的。
在傳統的采購模式下,阿里云購買英偉達的芯片,模型層調優算法。這種“拼積木”的方式在算力過剩時代沒有問題。但現在,每一片芯片都價值連城,每一瓦功耗都影響利潤。
因此,阿里自研芯片最大的優勢就在于“軟硬一體的深度調優”。
當通義實驗室的算法專家發現某個算子在訓練中存在瓶頸時,他們可以直接與平頭哥的硬件工程師對話,在芯片層級進行優化——這是任何第三方芯片廠商無法提供的。
據業內估算,這種垂直整合帶來的系統能效提升,往往能抵消制程落后帶來的20%-30%的性能損耗。
![]()
圖源:微博
然而,國產芯片最大的挑戰不是“造不出來”,而是“沒人敢用”。
阿里解決這個問題的辦法很簡單:自己先用。
目前,“真武”PPU已經在阿里云內部實現了多個萬卡集群的部署。
背后的含義很清晰:當這款芯片真正推向市場時,它已經經歷了淘寶雙11的流量洪峰、千問大模型的萬億參數訓練等種種高負荷場景的考驗。
這種“自家果園實驗,自家超市售賣”的模式,徹底解決了國產芯片的信任危機。據悉,國家電網、小鵬汽車等400多家客戶已經開始采用阿里方案,本質上買的不是那一塊硅片,而是阿里在那塊硅片上跑通了的整套大模型基礎設施。
長期以來,中國AI開發者一直活在CUDA生態的陰影下。英偉達最強大的護城河不是算力,而是其近乎壟斷的底層軟件生態。
阿里通過自研芯片和與之配套的軟件棧,正在嘗試構建一個基于國產算力的、可獨立演進的生態支點。
如果“真武”能配合阿里云的算力調度系統,讓開發者在不感知底層差異的情況下實現一鍵遷移,那么英偉達的護城河就出現了一道裂縫。
![]()
國產芯片沖刺IPO,仍需慎重
2026年初,平頭哥、昆侖芯、摩爾線程等芯片巨頭紛紛傳出上市消息。客觀來看,這不是資本的狂歡,更像是一場關于“存活”的賽跑。
眾所周知,芯片研發是一個吞金獸。
平頭哥成立8年來,依托阿里的海量投入,已經完成了從RISC-V架構(玄鐵)、服務器CPU(倚天)到AI芯片(含光、真武)的全線布局。
但在阿里整體戰略轉向“更加敏捷”的背景下,平頭哥的獨立IPO就顯得很有必要。
首先是降本增效。通過獨立上市,平頭哥可以利用資本市場的資金繼續進行后續制程(如3nm/2nm)的研發,減輕母公司的現金流壓力。
其次是去阿里化。作為獨立實體,平頭哥不僅能服務阿里云,更能以更加中立的身份去贏得競爭對手(如騰訊云、華為云或其他私有云客戶)的訂單。
只有成為“社會化產品”,國產芯片才能在真正的市場競爭中洗禮出生命力。
當然,這并不意味著我們在國際市場已經開始“遙遙領先”。
在狂熱的討論中,我們必須保持一份清醒。盡管“真武”在某些參數上比肩H20,但我們要意識到,H20本身就是英偉達為了適應貿易規則而劃出的“天花板”。我們的“比肩”,在某種程度上是對比人家“退而求其次”的產品。
在單卡雙精度浮點運算、先進光刻工藝的獲取、以及全球開發者生態的粘性上,國產芯片依然面臨漫長的追趕。
阿里的“真武”是一個極好的開端,它證明了我們在特定場景、特定架構下具備了與世界巨頭掰手腕的能力,但這并不意味著我們已經可以高枕無憂。
未來的AI競爭,表面上是芯片性能的競爭,底層則是“算力能效比”的競爭,例如英偉達的Blackwell架構已經在追求單卡功耗超過1000W。
而對于中國而言,電力資源和碳中和目標決定了我們不能無止境地推高功耗。
阿里的機會在于,如何利用其在云計算調度上的積累,讓算力像自來水一樣,經過高效的處理和分配,以最低的成本觸達企業。
如果“真武”芯片能配合阿里的液冷數據中心技術和分布式并行框架,實現比英偉達方案更優的“單位算力成本”,那么在商業邏輯上,阿里就贏了。
對于阿里巴巴而言,平頭哥的獨立與“真武”的實戰,同樣意味著它正在完成從一家“互聯網公司”向“硬核AI基礎設施供應商”的驚險一躍。
作者 | 劉峰
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.