![]()
在短暫叫停之后,特斯拉Dojo項目又“殺”回來了。這次,它換上了全新的思路。
1月19日,特斯拉創始人馬斯克在X平臺發文宣布,隨著AI5芯片設計完成,公司將重啟超級計算機項目Dojo 3的開發工作。同時,他發出“英雄帖”,招聘人才參與研發“世界上產量最高的芯片”,并要求用三個要點介紹自己解決過的最棘手技術難題。
![]()
五個月前,特斯拉曾全面叫停Dojo項目。彼時,馬斯克回復網友稱,特斯拉分散資源并同時開發兩種截然不同的AI芯片設計是沒有意義的。特斯拉的AI5、AI6及后續芯片在推理方面將表現出色,至少在訓練方面相當不錯,所有努力都將集中在這些芯片上面。
如此,伴隨著Dojo 3超級計算機項目的重啟,特斯拉自研AI算力戰略再次回歸,并進行了一次策略修正。
01
一場激進的技術豪賭
Dojo是特斯拉自主研發、專為AI訓練設計的超級計算集群。其核心目標是處理特斯拉全球車隊收集的海量視頻數據,以極快速度訓練和迭代其全自動駕駛(FSD)系統。
2021年特斯拉AI Day上,首款用于打造Dojo的芯片D1亮相,采用分布式結構和7納米工藝,搭載500億個晶體管、354個訓練節點,僅內部的電路就長達17.7公里,實現了超強算力和超高帶寬。
![]()
從馬斯克透露的消息來看,D1的設計哲學是極致優化,即通過剝離一代通用計算功能,打造出一個精簡的、大規模并行的訓練“猛獸”,其激進架構主要體現在兩方面。
一是無緩存的雙層存儲系統。Dojo的D1計算芯片完全摒棄了傳統的緩存層次結構和虛擬內存,354個內核都能直接訪問1.25MB的本地SRAM。這通過去除復雜的內存管理硬件,最大化了計算密度和功耗效率。
二是“無膠化(Glueless)”的晶圓級互連。Dojo的真正核心是其互連設計,由于其“邊緣”都是一個速度高達40TB/s的互聯連接器。這意味著D1芯片可以直接以“邊對邊”的形式連接,并由此組成了一個Dojo超級計算機的單個訓練模塊。
后者由25個D1芯片組成,因每個D1芯片之間都是無縫連接在一起,相鄰芯片之間的延遲極低,訓練模塊最大程度上實現了帶寬的保留,配合特斯拉自創的高帶寬、低延遲的連接器;在不到1立方英尺的體積下,算力高達9PFLOPs(9千萬億次),I/O帶寬高達36TB/s。
基于此,馬斯克提出:將使用D1芯片打造的超級計算機集群Dojo ExaPOD。其由120個節點、總共3000塊D1芯片組成,計算單元數超過100萬(3000*354),在BF16/CFP8精度下的算力達到1.1ExaLOPS,遠超目前全球最快的超級計算機富岳,后者算力為44.201 TFlops。
![]()
彼時,馬斯克還在推特上回復網友時表示,ExaPOD的運算能力足以模擬人腦。而這僅僅是一個開始,他稱下一代Dojo還將得到10倍的性能提升。
02
三重困境導致項目擱淺
然而,這一超前設計在2025年遭遇重挫。
2025年8月8日,有外媒報道稱,特斯拉正在解散其Dojo團隊,其負責人Peter Bannon也將離開公司,該團隊剩余的員工將被重新分配到特斯拉內部的其他數據中心和計算項目,公司計劃增加對外部技術合作伙伴的依賴。
對此,馬斯克本人給出的解釋是,分散資源設計兩款不同的芯片沒有意義。
![]()
但這顯然并不是全部,其背后是技術、人才、成本三重困境的疊加。
技術上,架構復雜難以駕馭,產業鏈存在制造瓶頸。
Dojo項目的核心矛盾源于其顛覆性的設計理念。該架構摒棄了傳統CPU/GPU的通用性設計思路,專注于將AI訓練負載的計算密度與能效推向極致。然而,這種對特定目標的極致追求,導致其在內存和互連系統上引入了極高的技術復雜度。
架構復雜性的直接后果是極低的制造良率。在晶圓尺寸的模組上,任何微小的布線缺陷或25顆D1芯片中任一的貼裝瑕疵,都可能導致高價值的Training Tile整體報廢。低良率使得規模化部署的成本高昂,較難具備商業上的經濟可行性。
這種設計在理論上性能卓越,但在工程實踐和量產中面臨的挑戰巨大,成為項目失敗的根本原因。
人才上,則是核心團隊集體流失。
![]()
DensityAI 創始團隊。資料來源:華泰證券
據彭博社報道,2023年Dojo負責人Ganesh Venkataramanan離開后,成立了競對初創公司DensityAI,隨后陸陸續續約20名核心工程師離開特斯拉并加入DensityAI。
成本上,充分考慮效益平衡,并開始依靠外部合作伙伴。
馬斯克長期將Dojo定位為高風險、高回報的“前瞻性項目”,其可行性核心在于:定制化架構在性能上的優勢能否足以抵消所需的巨額投入與研發難度。然而,隨著英偉達Blackwell、Rubin系列及AMD MI350、MI400系列等高性能芯片相繼推出,Dojo的潛在性能領先空間明顯收窄。
在內部成本持續攀升、項目進度多次延期且需從其他戰略重點轉移資源的背景下,特斯拉在充分考慮成本效益平衡下,轉而傾向于外部成熟方案。
![]()
Dojo分布式架構示意圖
因此,特斯拉在2025年7月轉向務實路線:與三星簽訂165億美元的AI6芯片代工合同,并在訓練算力上加強依賴英偉達與AMD等。
03
Dojo 3.0“務實”回歸
作為“第一性原理”的堅定信徒,馬斯克并未放棄自研算力的夢想。此次回歸,他帶來的是一個截然不同、更為務實的Dojo 3.0方案。
重啟的關鍵前提,是特斯拉新一代車端AI芯片(AI5/AI6) 取得進展。
根據馬斯克透露,特斯拉AI5芯片已接近設計完成,而AI6芯片目前處于早期階段,后續還將推出AI7、AI8、AI9,目標是在9個月內完成設計周期。
其中,AI5用于智能汽車和機器人。AI6則是機器人和數據中心都能用。AI7將瞄向太空算力。
![]()
這一速度明顯快于行業平均水平。目前,主流芯片廠商通常采用一年左右的更新周期。
不過,外界對馬斯克這一言論存有質疑。據此前公開表態,馬斯克曾在2023年7月稱AI5芯片已經“設計完成”。若此說法屬實,則當前再度提及“接近完成設計”便顯得前后不一。
但無論如何,AI5對特斯拉確實非常重要。
AI5是特斯拉用于車端的下一代輔助駕駛芯片,即HW(Hardware)系列的延續。
馬斯克透露,AI5芯片將主要用于自動駕駛系統的訓練與推理計算,并為特斯拉人形機器人Optimus提供算力基礎。目前,特斯拉在售車型主要依賴AI4(HW4)芯片來運行FSD系統。
根據馬斯克描述,AI5芯片單顆SoC性能大致相當于英偉達Hopper級別,雙芯配置則接近Blackwell級別,但其成本極低,功耗也更低。
![]()
特斯拉劇透AI5芯片性能
“解決AI5芯片問題對特斯拉來說至關重要。”馬斯克解釋道:“如今AI5進展順利,我們終于有了一些余力,可以重新啟動Dojo3的研發工作了。”
盡管Dojo重啟,但與此前相比,還是進行了一定的調整。
與此前不同,Dojo 3項目的核心在于架構重構與成本優化,徹底摒棄了前兩代Dojo依賴自研D1芯片及晶圓級封裝的復雜路徑。
根據特斯拉戰略規劃,Dojo 3本質上是將512顆AI5或AI6芯片密集集成于單塊主板,形成超級計算機集群,這種設計能將網絡布線復雜性與硬件成本降低數個數量級,同時保留大規模并行計算能力。其中AI6芯片將采用2納米制程工藝,計劃整合原Dojo架構優勢,實現車輛、Optimus機器人與數據中心的AI生態適配。
這一轉變的好處是顛覆性的。
成本與復雜度驟降:直接采用成熟、可大規模生產的芯片,繞過了D1恐怖的制造良率陷阱。馬斯克稱,這能將網絡布線復雜性和成本“降低幾個數量級”。
生態協同:實現了車端、機器人、云端數據中心的算力底層統一。芯片研發成果可多處復用,極大提升了研發效率和生態凝聚力。
風險可控:芯片制造依賴三星等成熟代工廠,特斯拉專注于自己更擅長的系統架構與集成創新。
特斯拉Dojo項目的重啟,不是一次簡單的“復活”,而是一場戰略進化。它標志著特斯拉的AI算力戰略從追求極致的單一架構探索,演進為更務實、更系統化的生態構建:即以車端AI芯片為核心基點,通過架構創新將其擴展為高效的云端訓練集群,從而實現車輛、機器人、數據中心三位一體的算力協同。
如果成功,Dojo 3或將不僅為特斯拉的自動駕駛與機器人夢想提供澎湃動力,更可能重塑AI時代算力基礎設施的構建范式。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.