來(lái)源:華夏基石e洞察
![]()
4月15日,英偉達(dá)CEO黃仁勛接受播客主持人Dwarkesh Patel的深度訪談,就英偉達(dá)如何掌控日益緊張的先進(jìn)芯片供應(yīng)鏈?TPU能否打破英偉達(dá)在AI計(jì)算領(lǐng)域的壟斷地位?為什么英偉達(dá)不成為超大規(guī)模數(shù)據(jù)中心運(yùn)營(yíng)商?美國(guó)是否應(yīng)該向中國(guó)出售 AI 芯片?為什么英偉達(dá)不生產(chǎn)多種不同的芯片架構(gòu)?等熱點(diǎn)話題,做了詳細(xì)的解答。
在談到中國(guó)市場(chǎng)上,黃仁勛指出,中國(guó)擁有豐富的能源、大量的芯片以及絕大多數(shù)的人工智能研究人員,把中國(guó)變成敵人,可能并非最佳方案,開(kāi)展對(duì)話和研究性對(duì)話或許是最穩(wěn)妥的做法。如果建立兩個(gè)生態(tài)系統(tǒng)——一個(gè)是只能運(yùn)行在外國(guó)技術(shù)棧上的開(kāi)源生態(tài)系統(tǒng),另一個(gè)是運(yùn)行在美國(guó)技術(shù)棧上的封閉生態(tài)系統(tǒng)——那將是極其愚蠢的。“我認(rèn)為這對(duì)美國(guó)來(lái)說(shuō)將是一個(gè)糟糕的結(jié)果。”
黃仁勛表示,中國(guó)的計(jì)算能力非常龐大。“如果他們想整合計(jì)算資源,完全可以滿足需求。黃仁勛講到了他所提出的AI五層蛋糕的說(shuō)法,“人工智能的本質(zhì)就像一個(gè)五層蛋糕,最底層是能源。能源充足時(shí),芯片就足夠了;芯片充足時(shí),能源就足夠了。例如,美國(guó)能源匱乏,這就是為什么英偉達(dá)必須不斷改進(jìn)我們的架構(gòu),并進(jìn)行這種極致的協(xié)同設(shè)計(jì)。但如果你的瓦數(shù)完全充足,而且是免費(fèi)的,你又何必在意每瓦性能呢?你已經(jīng)綽綽有余了。你可以用舊芯片來(lái)做。所以7nm芯片已經(jīng)足夠好了,充足的能源是中國(guó)的優(yōu)勢(shì)。”
黃仁勛指出,中國(guó)擁有世界上最頂尖的AI研究人員,由于計(jì)算能力有限,反而創(chuàng)造出了極其智能的算法。“我們必須承認(rèn),人工智能的大部分進(jìn)步都源于算法的進(jìn)步,而不僅僅是硬件的改進(jìn)。既然大部分進(jìn)步都來(lái)自算法、計(jì)算機(jī)科學(xué)和編程,那么他們龐大的人工智能研究人員隊(duì)伍難道不是他們最根本的優(yōu)勢(shì)嗎?我們都看到了這一點(diǎn)。DeepSeek 絕非無(wú)關(guān)緊要的進(jìn)步。如果DeepSeek先在華為平臺(tái)上發(fā)布,那對(duì)我們國(guó)家來(lái)說(shuō)將是災(zāi)難性的。”
以下為訪談全文:
英偉達(dá)最大的護(hù)城河是其對(duì)稀缺供應(yīng)鏈的控制嗎?
Q:我們已經(jīng)看到許多軟件公司的估值暴跌,因?yàn)槿藗冾A(yù)期人工智能會(huì)使軟件商品化。有一種可能過(guò)于天真的想法是:你看,英偉達(dá)把GDS2文件發(fā)給臺(tái)積電。臺(tái)積電制造邏輯芯片,制造交換機(jī)芯片,然后將它們與SK海力士、美光和三星生產(chǎn)的HBM內(nèi)存封裝在一起。之后,臺(tái)積電將封裝好的芯片發(fā)給臺(tái)灣的ODM廠商,由他們組裝成機(jī)架。從本質(zhì)上講,英偉達(dá)制造的是其他人制造的軟件,如果軟件商品化了,英偉達(dá)也會(huì)商品化嗎?
黃仁勛:最終,總得有某種機(jī)制將電子轉(zhuǎn)化為tokens。將電子轉(zhuǎn)化為tokens,并隨著時(shí)間的推移提升這些tokens的價(jià)值,這很難完全商品化。從電子到tokens的轉(zhuǎn)化是一個(gè)不可思議的旅程。制造tokens就像讓一個(gè)分子比另一個(gè)分子更有價(jià)值,讓一個(gè)tokens比另一個(gè)更有價(jià)值。顯然,我們正在實(shí)時(shí)見(jiàn)證著tokens價(jià)值的提升,其中蘊(yùn)含著大量的藝術(shù)、工程、科學(xué)和發(fā)明創(chuàng)造。這種轉(zhuǎn)化、制造以及所有相關(guān)的科學(xué)原理,我們遠(yuǎn)未被完全理解,這段旅程也遠(yuǎn)未結(jié)束。我懷疑它最終能否實(shí)現(xiàn)。
我們當(dāng)然會(huì)提高效率。你提出的問(wèn)題正是我對(duì)我們公司的理解。輸入是電子,輸出是tokens。英偉達(dá)位于中間。我們的工作是在必要范圍內(nèi)盡可能少地干預(yù),從而以驚人的能力實(shí)現(xiàn)這種轉(zhuǎn)型。我所說(shuō)的“盡可能少地干預(yù)”,是指任何我不需要親自完成的事情,我都會(huì)與其他合作伙伴一起,將其納入我的生態(tài)系統(tǒng)。
如果你看看今天的英偉達(dá),我們可能擁有規(guī)模最大的合作伙伴生態(tài)系統(tǒng),涵蓋供應(yīng)鏈的上下游,包括所有計(jì)算機(jī)公司、應(yīng)用開(kāi)發(fā)商和模型構(gòu)建者。人工智能就像一個(gè)五層蛋糕,我們的生態(tài)系統(tǒng)遍布所有五個(gè)層面。我們盡量少做,但事實(shí)證明,我們必須做的那部分工作極其困難。我認(rèn)為這部分工作無(wú)法商品化。(We try to do as little as possible, but the part that we have to do, as it turns out, is insanely hard)
事實(shí)上,我也不認(rèn)為企業(yè)軟件公司、工具制造商……如今大多數(shù)軟件公司都是工具制造商。當(dāng)然,也有一些公司不是,它們開(kāi)發(fā)的是工作流程編碼系統(tǒng)。但對(duì)很多公司來(lái)說(shuō),它們確實(shí)是工具制造商。例如,Excel 是工具,PowerPoint 是工具,Cadence開(kāi)發(fā)工具,Synopsys也開(kāi)發(fā)工具。實(shí)際上,我看到的恰恰與人們的看法相反。我認(rèn)為代理的數(shù)量和工具用戶的數(shù)量都將呈指數(shù)級(jí)增長(zhǎng)。所有這些工具的實(shí)例數(shù)量很可能會(huì)激增。
Synopsys Design Compiler的實(shí)例數(shù)量很可能會(huì)激增,使用平面規(guī)劃器、布局工具和設(shè)計(jì)規(guī)則檢查器的代理數(shù)量也會(huì)隨之大幅增長(zhǎng)。如今,我們受限于工程師的數(shù)量。未來(lái),這些工程師將得到大量agent的支持。我們將以前所未有的方式探索設(shè)計(jì)空間,并繼續(xù)使用我們今天使用的工具。
我認(rèn)為工具的使用將推動(dòng)軟件公司蓬勃發(fā)展。之所以目前還沒(méi)有出現(xiàn)這種情況,是因?yàn)閍gents還不擅長(zhǎng)使用這些工具。要么這些公司會(huì)自行開(kāi)發(fā)代理商,要么agents會(huì)變得足夠熟練,能夠使用這些工具。我認(rèn)為最終會(huì)是兩者的結(jié)合。
Q:在你們最新的文件中,你們與代工廠、內(nèi)存和封裝廠商簽訂了近1000億美元的采購(gòu)承諾。SemiAnalysis報(bào)道稱(chēng),你們這類(lèi)采購(gòu)承諾的總額將達(dá)到2500億美元。一種解讀是,英偉達(dá)的護(hù)城河實(shí)際上在于你們鎖定了未來(lái)幾年這些稀缺組件的供應(yīng)。其他廠商或許擁有加速器,但他們真的能獲得所需的內(nèi)存嗎?他們真的能獲得所需的邏輯芯片嗎?這真的是英偉達(dá)未來(lái)幾年最大的護(hù)城河嗎?
黃仁勛:這是我們能做到而別人很難做到的事情之一。我們?cè)谏嫌瓮度肓舜罅抠Y源。有些是明確的,比如你提到的這些承諾。有些則是隱性的。例如,我們供應(yīng)鏈上的許多上游投資都是由他們進(jìn)行的,因?yàn)槲以鴮?duì)各位CEO說(shuō):“讓我告訴你們這個(gè)行業(yè)將會(huì)發(fā)展到多大的規(guī)模,讓我解釋一下原因,讓我和你們一起分析,讓我向你們展示我所看到的。”
通過(guò)與上游各行各業(yè)的CEO們溝通、啟發(fā)和協(xié)調(diào),他們才愿意進(jìn)行投資。為什么他們?cè)敢鉃槲叶皇菫槠渌送顿Y呢?原因在于,他們知道我有能力購(gòu)買(mǎi)他們的產(chǎn)品,并通過(guò)我的下游渠道銷(xiāo)售。事實(shí)上,英偉達(dá)的下游供應(yīng)鏈和我們的下游需求都非常龐大,因此他們?cè)敢膺M(jìn)行上游投資。
如果你看看GTC大會(huì),人們都會(huì)驚嘆于它的規(guī)模和參會(huì)人員之多。它涵蓋了人工智能領(lǐng)域的方方面面,可謂包羅萬(wàn)象。他們齊聚一堂,是因?yàn)楸舜诵枰涣鳌N野阉麄兙奂谝黄穑菫榱俗屜掠纹髽I(yè)了解上游,上游企業(yè)了解下游,讓所有人都能了解人工智能的最新進(jìn)展。更重要的是,他們還能與人工智能領(lǐng)域的專(zhuān)家、正在蓬勃發(fā)展的人工智能初創(chuàng)公司以及所有令人驚嘆的成果見(jiàn)面,親眼見(jiàn)證我所講述的一切。我花費(fèi)大量時(shí)間,直接或間接地向我們的供應(yīng)鏈、合作伙伴和生態(tài)系統(tǒng)傳達(dá)我們面前的機(jī)遇。
有些人總是說(shuō):“Jensen,大多數(shù)主題演講都是一個(gè)接一個(gè)的公告。”但我們的主題演講總會(huì)有一部分內(nèi)容讓人感覺(jué)有點(diǎn)“折磨”,因?yàn)樗鼛缀跸袷窃谶M(jìn)行教育。事實(shí)上,這正是我所關(guān)注的。我需要確保整個(gè)供應(yīng)鏈,從上到下,整個(gè)生態(tài)系統(tǒng),都了解即將發(fā)生的事情,它為什么會(huì)發(fā)生,何時(shí)發(fā)生,規(guī)模有多大,并且能夠像我一樣系統(tǒng)地思考和分析它。
關(guān)于您所描述的護(hù)城河,我們有能力為未來(lái)做好準(zhǔn)備。如果未來(lái)幾年我們的規(guī)模達(dá)到萬(wàn)億美元,我們擁有相應(yīng)的供應(yīng)鏈。如果沒(méi)有我們的影響力,我們業(yè)務(wù)的發(fā)展速度……就像現(xiàn)金流、供應(yīng)鏈和客戶流失一樣,如果業(yè)務(wù)流失率很低,沒(méi)有人會(huì)為一個(gè)架構(gòu)構(gòu)建供應(yīng)鏈。我們之所以能夠維持如此龐大的規(guī)模,完全是因?yàn)橄掠涡枨缶薮蟆K麄兛吹搅诉@一點(diǎn),聽(tīng)到了相關(guān)信息,預(yù)見(jiàn)到了這一切。這使我們能夠以如此大的規(guī)模去做我們能夠做的事情。
Q:我確實(shí)想更具體地了解上游能否跟上步伐。多年來(lái),你們的收入每年都翻一番。你們提供給全球的Flops數(shù)每年都增長(zhǎng)三倍以上。
黃仁勛:現(xiàn)在以這種規(guī)模翻倍真的太不可思議了。
Q:沒(méi)錯(cuò)。但你再看看邏輯。你是臺(tái)積電N3工藝節(jié)點(diǎn)的最大客戶,也是N2工藝節(jié)點(diǎn)的最大客戶之一。今年人工智能整體將占N3工藝節(jié)點(diǎn)的60%,根據(jù)SemiAnalysis的預(yù)測(cè),明年將達(dá)到86%。如果你已經(jīng)占據(jù)了大部分市場(chǎng)份額,如何才能實(shí)現(xiàn)翻番?又該如何逐年實(shí)現(xiàn)這一目標(biāo)?我們現(xiàn)在是否正處于一個(gè)由于上游工藝的限制,人工智能計(jì)算增長(zhǎng)速度不得不放緩的階段?你認(rèn)為有什么辦法可以解決這個(gè)問(wèn)題?最終,我們?nèi)绾尾拍軐?shí)現(xiàn)每年兩倍的晶圓廠建設(shè)量?
黃仁勛:在某種程度上,瞬時(shí)需求大于全球上下游的供應(yīng)。在任何時(shí)刻,我們都可能面臨plumbers數(shù)量不足的限制,而這種情況實(shí)際上也時(shí)有發(fā)生。
Q:plumbers受邀參加明年的GTC大會(huì)。
黃仁勛:順便說(shuō)一句,這主意不錯(cuò)。但這只是個(gè)好條件。你想要的是一個(gè)瞬時(shí)需求大于行業(yè)總供給的行業(yè)。反之則顯然不好。如果我們之間的距離太遠(yuǎn),如果某個(gè)特定組件的供應(yīng)量太少,整個(gè)行業(yè)就會(huì)蜂擁而至。例如,你會(huì)發(fā)現(xiàn)現(xiàn)在人們很少再談?wù)揅oWoS了。
原因在于,過(guò)去兩年我們?nèi)σ愿埃瑢?shí)現(xiàn)了超負(fù)荷的產(chǎn)能擴(kuò)張。我們連續(xù)數(shù)次加倍,每次都翻倍。現(xiàn)在我認(rèn)為我們形勢(shì)相當(dāng)不錯(cuò)。臺(tái)積電現(xiàn)在也意識(shí)到,CoWoS的供應(yīng)必須跟上邏輯電路和存儲(chǔ)器的需求。他們正以與邏輯電路相同的速度擴(kuò)展CoWoS和未來(lái)的封裝技術(shù)。這非常棒,因?yàn)殚L(zhǎng)期以來(lái),CoWoS和HBM存儲(chǔ)器都屬于小眾技術(shù)。但現(xiàn)在它們不再是小眾技術(shù)了。人們現(xiàn)在意識(shí)到它們已經(jīng)成為主流的計(jì)算技術(shù)。
當(dāng)然,我們現(xiàn)在更有能力影響供應(yīng)鏈的更大范圍。在人工智能革命之初,我五年前就說(shuō)過(guò)現(xiàn)在我說(shuō)的這些話。有些人相信它并進(jìn)行了投資,例如Sanjay和美光團(tuán)隊(duì)。我仍然清楚地記得那次會(huì)議,會(huì)上我清楚地闡述了將會(huì)發(fā)生什么、為什么會(huì)發(fā)生以及今天的預(yù)測(cè)。他們確實(shí)加倍投入。我們?cè)贚PDDR和HBM內(nèi)存領(lǐng)域與他們展開(kāi)了合作,他們也確實(shí)投入了大量資金。這顯然對(duì)公司產(chǎn)生了巨大的影響。有些人加入得晚一些,但現(xiàn)在他們都在這里了。
這些瓶頸問(wèn)題都受到了高度重視。現(xiàn)在,我們正在提前數(shù)年預(yù)先解決這些瓶頸問(wèn)題。例如,過(guò)去幾年我們對(duì)Lumentum 、Coherent以及硅光子生態(tài)系統(tǒng)的投資,真正重塑了供應(yīng)鏈。我們圍繞臺(tái)積電構(gòu)建了一條完整的供應(yīng)鏈。我們與他們合作開(kāi)發(fā)了COUPE 項(xiàng)目,發(fā)明了大量技術(shù),并將這些專(zhuān)利授權(quán)給供應(yīng)鏈,以保持其開(kāi)放性和高效性。
我們正在通過(guò)發(fā)明新技術(shù)、新工作流程、新型測(cè)試設(shè)備(例如雙面探針測(cè)試)來(lái)構(gòu)建供應(yīng)鏈,同時(shí)投資于相關(guān)企業(yè)并幫助它們擴(kuò)大產(chǎn)能。可以看出,我們正努力塑造整個(gè)生態(tài)系統(tǒng),使供應(yīng)鏈能夠支持規(guī)模化發(fā)展。
Q:似乎有些瓶頸比其他瓶頸更容易解決。例如,擴(kuò)展 CoWoS 與其他擴(kuò)展方式相比。
黃仁勛:順便說(shuō)一句,我碰到的是難度最高的那一個(gè)。
Q:哪個(gè)?
黃仁勛:水管工和電工。這就是我對(duì)那些描述工作終結(jié)和職業(yè)消亡的末日論者感到擔(dān)憂的原因之一。如果我們勸阻人們成為軟件工程師,我們就會(huì)面臨軟件工程師短缺的問(wèn)題。十年前也出現(xiàn)過(guò)同樣的預(yù)測(cè)。一些末日論者告誡人們:“無(wú)論如何,千萬(wàn)別當(dāng)放射科醫(yī)生。”你可能還會(huì)在網(wǎng)上看到一些這樣的視頻,說(shuō)放射科醫(yī)生將是第一個(gè)消失的職業(yè),世界將不再需要更多的放射科醫(yī)生。猜猜我們現(xiàn)在缺什么?放射科醫(yī)生。
Q:回到之前關(guān)于有些東西可以規(guī)模化生產(chǎn),而有些東西卻不行這一點(diǎn)……你究竟如何才能每年生產(chǎn)兩倍的邏輯電路?歸根結(jié)底,存儲(chǔ)器和邏輯電路的瓶頸都在于極紫外光刻(EUV)。你如何才能逐年獲得兩倍的極紫外光刻設(shè)備?
黃仁勛:這些都不是無(wú)法快速擴(kuò)展的。所有這些都可以在兩三年內(nèi)輕松實(shí)現(xiàn)。你只需要一個(gè)需求信號(hào)。一旦你能造出一個(gè),你就能造出十個(gè);一旦你能造出十個(gè),你就能造出一百萬(wàn)個(gè)。這些都不難復(fù)制。
Q:你會(huì)追溯到供應(yīng)鏈的哪個(gè)環(huán)節(jié)?你會(huì)去找ASML說(shuō):“嘿,如果我展望三年后,英偉達(dá)的年收入達(dá)到兩萬(wàn)億美元,我們需要更多的EUV光刻機(jī)”嗎?
黃仁勛:有些我必須直接說(shuō)服,有些需要間接,還有一些……如果我能說(shuō)服臺(tái)積電,ASML也會(huì)被說(shuō)服。我們必須考慮關(guān)鍵的瓶頸。但如果臺(tái)積電被說(shuō)服了,幾年后你們就會(huì)有很多EUV光刻機(jī)可用了。
我的意思是,所有瓶頸都不會(huì)持續(xù)超過(guò)兩三年,一個(gè)都不會(huì)。與此同時(shí),我們的計(jì)算效率提高了10倍、20倍,以Hopper到Blackwell為例,甚至提高了30倍到50倍。由于CUDA的靈活性,我們不斷開(kāi)發(fā)新的算法。我們正在開(kāi)發(fā)各種新技術(shù),以提高效率,同時(shí)提升產(chǎn)能。這些我都不擔(dān)心。真正讓我擔(dān)憂的是下游的問(wèn)題。那些阻礙能源發(fā)展的能源政策……沒(méi)有能源,就無(wú)法建立任何產(chǎn)業(yè)。沒(méi)有能源,就無(wú)法建立一個(gè)全新的制造業(yè)。
我們希望重振美國(guó)工業(yè)。我們希望恢復(fù)芯片制造、計(jì)算機(jī)制造和封裝產(chǎn)業(yè)。我們希望研發(fā)電動(dòng)汽車(chē)和機(jī)器人等新產(chǎn)品。我們希望建設(shè)人工智能工廠。所有這些都離不開(kāi)能源,而且這些項(xiàng)目都需要很長(zhǎng)時(shí)間。增加芯片產(chǎn)能,這需要兩到三年的時(shí)間。增加CoWoS產(chǎn)能,也需要兩到三年的時(shí)間。
Q:有意思。我感覺(jué)有時(shí)候客人會(huì)跟我說(shuō)完全相反的話。這種情況下,我確實(shí)缺乏相關(guān)的專(zhuān)業(yè)知識(shí)來(lái)判斷。
黃仁勛:最妙的是,你是在和專(zhuān)家對(duì)話。
TPU能否打破英偉達(dá)在 AI 計(jì)算領(lǐng)域的壟斷地位?
Q:我想問(wèn)問(wèn)你們的競(jìng)爭(zhēng)對(duì)手。如果你看看TPU ,可以說(shuō)全球排名前三的模型中,有兩款——Claude和Gemini——都是用TPU訓(xùn)練的。這對(duì)英偉達(dá)未來(lái)的發(fā)展意味著什么?
黃仁勛:我們打造的是截然不同的東西。英偉達(dá)打造的是加速計(jì)算,而不是張量處理單元。加速計(jì)算的應(yīng)用范圍非常廣泛:分子動(dòng)力學(xué)、量子色動(dòng)力學(xué)、數(shù)據(jù)處理、數(shù)據(jù)幀、結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。它也用于流體動(dòng)力學(xué)和粒子物理學(xué)。此外,我們還將其應(yīng)用于人工智能領(lǐng)域。
加速計(jì)算的范疇遠(yuǎn)比這廣泛得多。雖然人工智能是當(dāng)今的熱門(mén)話題,而且顯然非常重要且影響深遠(yuǎn),但計(jì)算的范疇遠(yuǎn)不止于此。英偉達(dá)徹底革新了計(jì)算方式,從通用計(jì)算轉(zhuǎn)向加速計(jì)算。我們的市場(chǎng)覆蓋范圍遠(yuǎn)遠(yuǎn)超過(guò)任何TPU或ASIC芯片所能企及的范圍。從我們的市場(chǎng)地位來(lái)看,我們是唯一一家能夠加速所有類(lèi)型應(yīng)用程序的公司。我們擁有龐大的生態(tài)系統(tǒng)。因此,各種框架和算法都可以在英偉達(dá)平臺(tái)上運(yùn)行。
因?yàn)槲覀兊挠?jì)算機(jī)設(shè)計(jì)之初就考慮到了由他人操作,所以任何具備操作能力的人都可以購(gòu)買(mǎi)我們的系統(tǒng)。而大多數(shù)自建系統(tǒng)則需要用戶自行操作,因?yàn)樗鼈兊脑O(shè)計(jì)初衷并非為了方便他人操作。由于任何人都可以操作我們的系統(tǒng),因此我們的產(chǎn)品已部署在包括 Google、Amazon、Azure 和 OCI 在內(nèi)的所有云平臺(tái)上。
如果您想以租賃方式運(yùn)營(yíng),最好擁有一個(gè)涵蓋多個(gè)行業(yè)的龐大客戶生態(tài)系統(tǒng),以便他們成為承購(gòu)方。如果您想自行運(yùn)營(yíng),我們當(dāng)然有能力幫助您,就像我們之前為埃隆·馬斯克提供的 xAI 服務(wù)一樣。而且,由于我們能夠賦能任何公司和任何行業(yè)的運(yùn)營(yíng)者,您可以利用這項(xiàng)技術(shù)為禮來(lái)公司構(gòu)建一臺(tái)用于科學(xué)研究和藥物研發(fā)的超級(jí)計(jì)算機(jī)。我們可以幫助他們運(yùn)營(yíng)自己的超級(jí)計(jì)算機(jī),并將其用于我們所加速的各個(gè)藥物研發(fā)和生物科學(xué)領(lǐng)域。
我們能夠解決很多TPU無(wú)法解決的應(yīng)用問(wèn)題。英偉達(dá)打造CUDA的目的不僅在于使其成為一個(gè)出色的張量處理單元,它還能處理數(shù)據(jù)處理、計(jì)算、人工智能等各個(gè)生命周期。我們的市場(chǎng)機(jī)會(huì)更大,覆蓋范圍也更廣。因?yàn)槲覀儸F(xiàn)在支持全球所有應(yīng)用,所以無(wú)論你在哪里構(gòu)建英偉達(dá)系統(tǒng),都無(wú)需擔(dān)心找不到客戶。這完全是兩碼事。
Q:這將是一個(gè)很長(zhǎng)的問(wèn)題。你們的營(yíng)收非常驚人,但你們每季度600億美元的收入并非來(lái)自制藥和量子計(jì)算領(lǐng)域。你們之所以能做到這一點(diǎn),是因?yàn)槿斯ぶ悄苁且豁?xiàng)前所未有的技術(shù),而且它正以前所未有的速度發(fā)展。
那么問(wèn)題就變成了:哪種方案最適合人工智能?我不太了解細(xì)節(jié),但我跟我的人工智能研究朋友聊過(guò),他們說(shuō):“你看,我用TPU的時(shí)候,它是一個(gè)大型的脈動(dòng)陣列,非常適合做矩陣乘法,而GPU則非常靈活。當(dāng)你需要處理大量分支或不規(guī)則的內(nèi)存訪問(wèn)時(shí),它就非常棒。”
但人工智能究竟是什么?它不過(guò)是不斷重復(fù)進(jìn)行這些非常可預(yù)測(cè)的矩陣乘法運(yùn)算。你無(wú)需為線程束調(diào)度器或線程與內(nèi)存庫(kù)之間的切換而犧牲任何芯片面積。而且,TPU 針對(duì)當(dāng)前計(jì)算領(lǐng)域收入增長(zhǎng)和應(yīng)用場(chǎng)景的大量需求進(jìn)行了優(yōu)化。我想知道你對(duì)此有何看法。
黃仁勛:矩陣乘法是人工智能的重要組成部分,但并非全部。如果你想提出新的注意力機(jī)制、以不同的方式進(jìn)行分解,或者發(fā)明一種全新的架構(gòu)——例如混合SSM——你需要一個(gè)通用的可編程架構(gòu)。如果你想創(chuàng)建一個(gè)融合擴(kuò)散和自回歸技術(shù)的模型,你同樣需要一個(gè)通用的可編程架構(gòu)。我們幾乎可以運(yùn)行你所能想象的一切。這就是它的優(yōu)勢(shì)所在。由于它是一個(gè)可編程系統(tǒng),因此可以更輕松地發(fā)明新的算法。
人工智能之所以能如此快速發(fā)展,真正的原因在于其不斷發(fā)明新算法的能力。與其他任何事物一樣,TPU(技術(shù)處理單元)也受到摩爾定律的影響,而摩爾定律的年增長(zhǎng)率約為25%。要想真正實(shí)現(xiàn)10倍甚至100倍的飛躍,唯一的辦法就是每年從根本上改變算法及其計(jì)算方式。
這就是英偉達(dá)的根本優(yōu)勢(shì)。我們之所以能讓 Blackwell 的能效比 Hopper 高出 50 倍,唯一的原因是……當(dāng)初我宣布 Blackwell 的能效將比 Hopper 高出 35 倍時(shí),沒(méi)人相信。后來(lái)Dylan寫(xiě)了篇文章說(shuō)我故意隱瞞,但實(shí)際上能效是 Hopper 的 50 倍。單憑摩爾定律是無(wú)法實(shí)現(xiàn)這一點(diǎn)的。我們解決這個(gè)問(wèn)題的方法是采用新的模型,例如MoE(模塊化執(zhí)行單元),這些模型可以并行化、解耦并分布在整個(gè)計(jì)算系統(tǒng)中。如果沒(méi)有能力真正深入研究并利用 CUDA 開(kāi)發(fā)新的內(nèi)核,這一切都很難做到。
這得益于我們架構(gòu)的可編程性,以及英偉達(dá)作為一家極致的協(xié)同設(shè)計(jì)公司的優(yōu)勢(shì)。我們甚至可以將部分計(jì)算任務(wù)卸載到架構(gòu)本身(例如NVLink )或網(wǎng)絡(luò)(例如Spectrum-X)中。我們可以同時(shí)對(duì)處理器、系統(tǒng)、架構(gòu)、庫(kù)和算法進(jìn)行更改。如果沒(méi)有 CUDA,我真不知道該從何入手。
Q:這引出了一個(gè)關(guān)于英偉達(dá)客戶群的有趣問(wèn)題。你們60%的收入都來(lái)自五大超大規(guī)模數(shù)據(jù)中心運(yùn)營(yíng)商。如果換個(gè)時(shí)代,面對(duì)不同的客戶群體——比如說(shuō)進(jìn)行實(shí)驗(yàn)的教授——他們需要CUDA。他們無(wú)法使用其他加速器。他們只需要用CUDA運(yùn)行PyTorch ,并且所有功能都得到優(yōu)化。
但這些超大規(guī)模數(shù)據(jù)中心運(yùn)營(yíng)商擁有編寫(xiě)自有內(nèi)核的資源。事實(shí)上,為了獲得其特定架構(gòu)所需的最后 5% 的性能提升,他們必須這樣做。Anthropic 和 Google 大多運(yùn)行著自己的加速器,或者使用 TPU 和Trainium 。即使是使用 GPU 的 OpenAI,也使用Triton ,因?yàn)樗麄冃枰约旱膬?nèi)核。甚至在 CUDA C++ 方面,他們也沒(méi)有使用cuBLAS和NCCL ,而是擁有自己的技術(shù)棧,該技術(shù)棧還可以編譯到其他加速器上。如果你的大多數(shù)客戶能夠并且確實(shí)找到了 CUDA 的替代方案,那么 CUDA 在多大程度上真的能夠推動(dòng) Nvidia 平臺(tái)上的前沿 AI 應(yīng)用?
黃仁勛:CUDA 擁有豐富的生態(tài)系統(tǒng)。如果您想先在任何計(jì)算機(jī)上進(jìn)行構(gòu)建,那么首先基于 CUDA 進(jìn)行構(gòu)建是非常明智的選擇。正因?yàn)槠渖鷳B(tài)系統(tǒng)如此豐富,我們才能支持所有框架。如果您想創(chuàng)建自定義內(nèi)核……例如,我們?yōu)?Triton 做出了巨大貢獻(xiàn)。因此,Triton 的后端使用了大量的 Nvidia 技術(shù)。
我們很高興能夠幫助每個(gè)框架發(fā)揮其最大潛力。框架種類(lèi)繁多,例如Triton、vLLM 、SGLang等等。現(xiàn)在又涌現(xiàn)出許多新的強(qiáng)化學(xué)習(xí)框架,例如verl和NeMo RL 。隨著訓(xùn)練后處理和強(qiáng)化學(xué)習(xí)的不斷發(fā)展,整個(gè)領(lǐng)域正經(jīng)歷著爆炸式增長(zhǎng)。因此,如果您想基于某個(gè)架構(gòu)進(jìn)行開(kāi)發(fā),那么基于 CUDA 無(wú)疑是最佳選擇,因?yàn)?CUDA 的生態(tài)系統(tǒng)非常完善。
你知道,如果出了問(wèn)題,更有可能出在你的代碼里,而不是底層那堆積如山的代碼里。構(gòu)建這些系統(tǒng)時(shí),別忘了你要處理的代碼量有多大。如果出了問(wèn)題,是你的問(wèn)題還是電腦的問(wèn)題?你肯定希望問(wèn)題總是出在你身上,并且能夠信任電腦。當(dāng)然,我們自己也存在很多 bug,但我們的系統(tǒng)已經(jīng)過(guò)充分測(cè)試,至少你可以在這個(gè)基礎(chǔ)上繼續(xù)開(kāi)發(fā)。這就是第一點(diǎn):生態(tài)系統(tǒng)的豐富性、可編程性和強(qiáng)大功能。
第二點(diǎn)是,如果你是一名開(kāi)發(fā)者,無(wú)論開(kāi)發(fā)什么軟件,你最看重的就是用戶基數(shù)。你希望你編寫(xiě)的軟件能夠在大量的其他計(jì)算機(jī)上運(yùn)行。你開(kāi)發(fā)軟件并非僅僅為了自己,而是為了你的服務(wù)器群,或者其他所有人的服務(wù)器群,因?yàn)槟闶且幻蚣軜?gòu)建者。英偉達(dá)的 CUDA 生態(tài)系統(tǒng)最終是其最大的財(cái)富。
現(xiàn)在市面上已經(jīng)有數(shù)億個(gè)GPU。每個(gè)云平臺(tái)都配備了GPU。從A10 、A100 、H100 、H200 ,到L系列、P系列等等,種類(lèi)繁多,尺寸和形狀也各不相同。如果你是一家機(jī)器人公司,你肯定希望CUDA協(xié)議棧能夠直接在機(jī)器人上運(yùn)行。我們的產(chǎn)品幾乎無(wú)處不在。龐大的用戶群意味著,一旦你開(kāi)發(fā)出軟件或模型,它就能在任何地方使用。這簡(jiǎn)直太有價(jià)值了。
最后,我們能夠覆蓋所有云平臺(tái),這使我們真正獨(dú)樹(shù)一幟。如果您是一家人工智能公司或開(kāi)發(fā)者,您可能并不確定應(yīng)該與哪家云服務(wù)提供商合作,或者在哪里運(yùn)行。我們幾乎可以在任何地方運(yùn)行,如果您愿意,我們也可以為您提供本地部署服務(wù)。豐富的生態(tài)系統(tǒng)、龐大的用戶群以及我們靈活的部署方式,共同造就了 CUDA 的無(wú)可比擬的價(jià)值。
Q:這很有道理。我好奇的是,這些優(yōu)勢(shì)對(duì)你的主要客戶來(lái)說(shuō)是否重要。對(duì)很多人來(lái)說(shuō),這些優(yōu)勢(shì)可能很重要。能夠構(gòu)建自己軟件棧的那類(lèi)人貢獻(xiàn)了你的大部分收入。尤其是在人工智能越來(lái)越擅長(zhǎng)那些具有嚴(yán)格驗(yàn)證循環(huán)、可以進(jìn)行強(qiáng)化學(xué)習(xí)的領(lǐng)域……如何編寫(xiě)一個(gè)內(nèi)核,使其在規(guī)模化應(yīng)用中能夠最高效地處理注意力機(jī)制或多層感知器(MLP)?這是一個(gè)非常容易驗(yàn)證的反饋循環(huán)。
所有超大規(guī)模數(shù)據(jù)中心運(yùn)營(yíng)商都能自行編寫(xiě)這些定制內(nèi)核嗎?英偉達(dá)的性價(jià)比依然很高,所以他們可能仍然更傾向于使用英偉達(dá)的產(chǎn)品。但問(wèn)題在于,最終會(huì)不會(huì)演變成誰(shuí)能以最低的價(jià)格提供最佳的規(guī)格、浮點(diǎn)運(yùn)算能力和內(nèi)存帶寬?歷史上,英偉達(dá)憑借CUDA的護(hù)城河,在人工智能領(lǐng)域(包括硬件和軟件)一直保持著最高的利潤(rùn)率,高達(dá)70%。而問(wèn)題是,如果大多數(shù)客戶能夠負(fù)擔(dān)得起自行構(gòu)建,而不是依賴(lài)CUDA的護(hù)城河,英偉達(dá)還能維持這樣的利潤(rùn)率嗎?
黃仁勛:我們?yōu)檫@些人工智能實(shí)驗(yàn)室配備了數(shù)量驚人的工程師,他們與這些實(shí)驗(yàn)室合作,優(yōu)化他們的技術(shù)棧。原因在于,沒(méi)有人比我們更了解我們的架構(gòu)。這些架構(gòu)不像CPU那樣通用。CPU有點(diǎn)像凱迪拉克,它是一款舒適的巡航車(chē),速度不會(huì)太快,每個(gè)人都能輕松駕馭。它配備了巡航控制,一切都很簡(jiǎn)單。但在很多方面,英偉達(dá)的GPU和加速器就像F1賽車(chē)。我估計(jì)每個(gè)人都能以每小時(shí)一百英里的速度駕駛它,但要將其性能發(fā)揮到極致,則需要相當(dāng)豐富的專(zhuān)業(yè)知識(shí)。我們運(yùn)用了大量的人工智能技術(shù)來(lái)創(chuàng)建我們的內(nèi)核。
我非常肯定,在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi),我們?nèi)匀粫?huì)被需要。我們的專(zhuān)業(yè)知識(shí)通常能幫助我們的人工智能實(shí)驗(yàn)室合作伙伴輕松地將他們的技術(shù)棧性能提升兩倍。我們完成技術(shù)棧優(yōu)化或特定內(nèi)核優(yōu)化后,他們的模型速度提升三倍、兩倍甚至五成的情況并不少見(jiàn)。這是一個(gè)巨大的數(shù)字,尤其考慮到他們龐大的設(shè)備基數(shù),包括他們所有的 Hopper 和 Blackwell 等計(jì)算單元。性能提升一倍,收入也會(huì)翻倍。這直接轉(zhuǎn)化為實(shí)際收益。
英偉達(dá)的計(jì)算堆棧是全球性價(jià)比最高的,沒(méi)有之一。目前世界上沒(méi)有任何一個(gè)平臺(tái)能證明它的性能/總擁有成本比更高。沒(méi)有一家公司能做到。事實(shí)上,現(xiàn)有的基準(zhǔn)測(cè)試,比如Dylan的InferenceMAX ,人人都能用,但沒(méi)有任何一家公司能做到……TPU不會(huì)推出,Trainium也不會(huì)推出。
我鼓勵(lì)他們使用 InferenceMAX 來(lái)展示他們驚人的推理成本。這真的很難。沒(méi)人愿意來(lái)。MLPerf 。我倒是很想聽(tīng)聽(tīng) Trainium 展示一下他們一直聲稱(chēng)的 40% 的成本優(yōu)勢(shì)。我很想聽(tīng)聽(tīng)他們?nèi)绾巫C明 TPU 的成本優(yōu)勢(shì)。在我看來(lái),這完全說(shuō)不通。一點(diǎn)道理都沒(méi)有。從根本上來(lái)說(shuō),這根本說(shuō)不通。
所以我認(rèn)為我們?nèi)绱顺晒Φ脑蚝芎?jiǎn)單,就是我們的總體擁有成本 (TCO) 非常低。其次,您提到我們 60% 的客戶是前五大企業(yè),但其中大部分業(yè)務(wù)都是外部業(yè)務(wù)。例如,AWS 上的英偉達(dá)產(chǎn)品大部分是為外部客戶而非內(nèi)部用戶提供的。Azure 上的所有客戶也都是外部客戶。OCI 上的所有客戶也都是外部客戶,而非內(nèi)部用戶。他們之所以青睞我們,是因?yàn)槲覀兊母采w范圍非常廣。我們可以為他們帶來(lái)全球所有優(yōu)秀的客戶。這些客戶都基于英偉達(dá)的產(chǎn)品。而所有這些公司之所以都基于英偉達(dá)的產(chǎn)品,正是因?yàn)槲覀兏采w范圍廣、功能多樣。
所以我認(rèn)為真正的飛輪效應(yīng)在于用戶基數(shù)、我們架構(gòu)的可編程性、我們生態(tài)系統(tǒng)的豐富性,以及全球人工智能公司數(shù)量眾多這一事實(shí)。現(xiàn)在有成千上萬(wàn)家人工智能公司。如果你是其中一家人工智能初創(chuàng)公司,你會(huì)選擇哪種架構(gòu)?你會(huì)選擇最普及的架構(gòu)。而我們的架構(gòu)是全球最普及的。你會(huì)選擇用戶基數(shù)最大的架構(gòu)。而我們的用戶基數(shù)最大。你還會(huì)選擇擁有豐富生態(tài)系統(tǒng)的架構(gòu)。
這就是飛輪效應(yīng)。原因在于:首先,我們的每美元性能如此之高,以至于他們的tokens成本最低。其次,我們的每瓦性能是全球最高的。因此,如果我們的合作伙伴建造了一個(gè)1吉瓦的數(shù)據(jù)中心,那么這個(gè)1吉瓦的數(shù)據(jù)中心必須能夠產(chǎn)生最大的收益和tokens數(shù)量,這直接轉(zhuǎn)化為收入。您希望它產(chǎn)生盡可能多的代幣,從而最大化數(shù)據(jù)中心的收益。我們擁有全球最高的每瓦代幣產(chǎn)量架構(gòu)。最后,如果您的目標(biāo)是租用基礎(chǔ)設(shè)施,我們擁有全球最多的客戶。這就是飛輪效應(yīng)發(fā)揮作用的原因。
Q:有意思。我想問(wèn)題的關(guān)鍵在于,實(shí)際的市場(chǎng)結(jié)構(gòu)究竟如何?因?yàn)榧幢氵€有其他公司……原本可能存在成千上萬(wàn)家人工智能公司,它們大致平分計(jì)算資源。但即便通過(guò)這五家超大規(guī)模數(shù)據(jù)中心,真正使用亞馬遜計(jì)算資源的仍然是 Anthropologie、OpenAI 以及那些有能力且能夠自行部署不同加速器的大型基金會(huì)實(shí)驗(yàn)室。
黃仁勛:不,我認(rèn)為你的前提是錯(cuò)誤的。
Q:也許吧。不過(guò),我想問(wèn)你一個(gè)稍微不同的問(wèn)題。如果價(jià)格、性能、每瓦性能等等這些說(shuō)法都是真的,那么你認(rèn)為為什么像 Anthropic 這樣的公司會(huì)在幾天前宣布他們與 Broadcom 和 Google 達(dá)成了一項(xiàng)數(shù)吉瓦的 TPU 協(xié)議,用于他們的大部分計(jì)算呢?
顯然,對(duì)谷歌來(lái)說(shuō),TPU占據(jù)了大部分計(jì)算資源。所以,如果我觀察這些大型人工智能公司,會(huì)發(fā)現(xiàn)它們的很多計(jì)算資源……曾經(jīng)有一段時(shí)間它們都依賴(lài)英偉達(dá)的加速器,但現(xiàn)在情況并非如此。因此,我很好奇,如果這些說(shuō)法在理論上成立,它們?yōu)槭裁磿?huì)選擇其他加速器呢?
黃仁勛:Anthropic 是一個(gè)特例,而非一種趨勢(shì)。如果沒(méi)有 Anthropic,TPU 又怎會(huì)增長(zhǎng)?它完全是 Anthropic 的功勞。如果沒(méi)有 Anthropic,Trainium 又怎會(huì)增長(zhǎng)?它也完全是 Anthropic 的功勞。我認(rèn)為這一點(diǎn)已廣為人知。ASIC 的機(jī)會(huì)并不多,Anthropic 只有一個(gè)。
Q:但OpenAI 與 AMD 達(dá)成了協(xié)議……他們正在打造自己的Titan加速器。
黃仁勛:是的,但我想我們都應(yīng)該承認(rèn),它們很大程度上是英偉達(dá)的競(jìng)品。我們?nèi)匀粫?huì)繼續(xù)合作。我不介意其他人使用其他產(chǎn)品或嘗試其他技術(shù)。如果他們不去嘗試,又怎么知道我們的產(chǎn)品有多好呢?有時(shí)候,我們需要有人提醒自己這一點(diǎn)。我們必須不斷地努力才能保住現(xiàn)在的地位。
總是有很多夸張的說(shuō)法。看看有多少ASIC項(xiàng)目被取消就知道了。就算你打算造ASIC……你還得造出比英偉達(dá)更好的產(chǎn)品。造出比英偉達(dá)更好的產(chǎn)品可沒(méi)那么容易。實(shí)際上,這根本不現(xiàn)實(shí)。英偉達(dá)肯定漏掉了什么,真的。因?yàn)槲覀兊囊?guī)模和速度,我們是世界上唯一一家每年都能持續(xù)產(chǎn)出新產(chǎn)品的公司。每年都有巨大的飛躍。
Q:我猜他們的邏輯是,“嘿,它不需要更好。它只需要比原來(lái)的差不超過(guò)70%就行了”,因?yàn)樗麄兏督o你的是70%的利潤(rùn)率。
黃仁勛:不,別忘了,即使是ASIC芯片,利潤(rùn)率也相當(dāng)高。比如說(shuō),英偉達(dá)的利潤(rùn)率是70%。但ASIC芯片的利潤(rùn)率只有65%。你到底能省多少錢(qián)?
Q:哦,你是說(shuō)博通之類(lèi)的公司嗎?
黃仁勛:當(dāng)然,總得付錢(qián)給別人吧。就我所知,ASIC的利潤(rùn)率非常高。他們自己也這么認(rèn)為,而且他們對(duì)ASIC驚人的利潤(rùn)率相當(dāng)自豪。
所以,你問(wèn)了為什么。很久以前,我們確實(shí)沒(méi)有能力做到這一點(diǎn)。當(dāng)時(shí),我并沒(méi)有深刻意識(shí)到建立像 OpenAI 和 Anthropic 那樣的基礎(chǔ)性人工智能實(shí)驗(yàn)室有多么困難,也沒(méi)有意識(shí)到他們需要供應(yīng)商投入巨資。我們當(dāng)時(shí)根本無(wú)力向 Anthropic 投資數(shù)十億美元,讓他們使用我們的計(jì)算資源。但谷歌和 AWS 有。他們一開(kāi)始就投入了巨資,作為回報(bào),Anthropic 可以使用他們的計(jì)算資源。而我們當(dāng)時(shí)確實(shí)沒(méi)有能力做到這一點(diǎn)。
我覺(jué)得我的錯(cuò)誤在于,我沒(méi)有真正理解他們其實(shí)別無(wú)選擇,風(fēng)險(xiǎn)投資家絕不會(huì)把50億到100億美元投資到一個(gè)人工智能實(shí)驗(yàn)室,指望它能像Anthropic那樣成功。所以這是我的失誤。但即便我當(dāng)時(shí)理解了這一點(diǎn),我想我們當(dāng)時(shí)也沒(méi)有能力這么做。但我不會(huì)再犯同樣的錯(cuò)誤了。
我很高興能投資 OpenAI,也很高興能幫助他們擴(kuò)大規(guī)模,而且我認(rèn)為這樣做至關(guān)重要。后來(lái),當(dāng) Anthropic 找到我們時(shí),我也很高興能成為他們的投資者,幫助他們擴(kuò)大規(guī)模。只是當(dāng)時(shí)我們力不從心。如果一切可以重來(lái)——如果英偉達(dá)當(dāng)時(shí)就能達(dá)到現(xiàn)在的規(guī)模——我絕對(duì)會(huì)非常樂(lè)意這么做。
為什么英偉達(dá)不成為超大規(guī)模數(shù)據(jù)中心運(yùn)營(yíng)商?
Q:這確實(shí)很有意思。多年來(lái),英偉達(dá)一直是人工智能領(lǐng)域最賺錢(qián)的公司,賺了很多錢(qián)。現(xiàn)在你們開(kāi)始投資人工智能了。據(jù)報(bào)道,你們?cè)贠penAI投資了高達(dá)300億美元,在Anthropic投資了100億美元。現(xiàn)在它們的估值都提高了,我相信還會(huì)繼續(xù)增長(zhǎng)。
所以,如果你這些年來(lái)一直為他們提供計(jì)算資源,并且預(yù)見(jiàn)到它的發(fā)展方向,而幾年前——甚至在某些情況下,一年前——他們的價(jià)值只有現(xiàn)在的十分之一,而你又手握大量現(xiàn)金——那么,英偉達(dá)完全可以轉(zhuǎn)型為基金會(huì)實(shí)驗(yàn)室,進(jìn)行巨額投資來(lái)實(shí)現(xiàn)這一目標(biāo),或者更早地以現(xiàn)在的估值完成你現(xiàn)在達(dá)成的這些交易。而且你當(dāng)時(shí)也有足夠的資金這樣做。所以我很想知道,為什么你沒(méi)有更早地這樣做呢?
黃仁勛:我們盡早完成了這件事。如果可以,我甚至?xí)缛プ觥.?dāng)時(shí)Anthropic需要我們做這件事的時(shí)候,我們卻無(wú)能為力。這樣做也不符合我們的本性。
Q:怎么會(huì)這樣?是現(xiàn)金交易之類(lèi)的嗎?
黃仁勛:是的,投資規(guī)模的問(wèn)題。當(dāng)時(shí)我們從未在公司外部投資過(guò),而且投資額也不大。我們當(dāng)時(shí)沒(méi)意識(shí)到需要投資。我一直以為他們可以像其他公司一樣,直接去風(fēng)投那里融資,我的天哪。但他們想做的事情,風(fēng)投是做不到的。OpenAI想做的事情,風(fēng)投是做不到的。我現(xiàn)在明白了。當(dāng)時(shí)我并不知道。
但這就是他們的過(guò)人之處。這就是他們聰明的原因。他們當(dāng)時(shí)意識(shí)到自己必須做這樣的事。我很高興他們這么做了。盡管我們導(dǎo)致Anthropic不得不轉(zhuǎn)投他人,但我仍然為此感到高興。Anthropic的存在對(duì)世界意義重大。我為此感到欣慰。
Q:我猜你仍然賺了很多錢(qián),而且每個(gè)季度都在賺得更多。
黃仁勛:有遺憾也是正常的。
Q:所以問(wèn)題依然存在。既然我們已經(jīng)到了這里,而且你們也一直在賺這筆錢(qián),那么英偉達(dá)應(yīng)該怎么用呢?一個(gè)答案是,現(xiàn)在已經(jīng)出現(xiàn)了一個(gè)完整的中間商生態(tài)系統(tǒng),可以將這些實(shí)驗(yàn)室的資本支出轉(zhuǎn)化為運(yùn)營(yíng)支出,以便他們能夠租用計(jì)算資源。因?yàn)樾酒浅0嘿F,而且由于人工智能模型不斷改進(jìn),它們?cè)谄渖芷趦?nèi)能帶來(lái)巨額利潤(rùn)。因此,它們創(chuàng)造的價(jià)值,也就是它們的代幣,正在不斷增長(zhǎng),但搭建這些系統(tǒng)成本很高。英偉達(dá)有足夠的資金來(lái)承擔(dān)這些資本支出。事實(shí)上,據(jù)報(bào)道,你們?yōu)镃oreWeave項(xiàng)目提供了高達(dá)63億美元的支持,并且已經(jīng)投資了20億美元。
為什么英偉達(dá)不自己做云服務(wù)商?為什么不自己做超大規(guī)模云服務(wù)商,把計(jì)算資源出租出去?他們有這么多錢(qián)可以這么做。
黃仁勛:這是公司的理念,我認(rèn)為很明智。我們應(yīng)該盡可能少地投入,只做必要的事情。這意味著,如果我們不去構(gòu)建我們的計(jì)算平臺(tái),我相信這項(xiàng)工作就無(wú)法完成。如果我們不承擔(dān)現(xiàn)在承擔(dān)的風(fēng)險(xiǎn)——如果我們不以現(xiàn)在的方式構(gòu)建 NVLink,如果我們不構(gòu)建整個(gè)技術(shù)棧,如果我們不以現(xiàn)在的方式創(chuàng)建生態(tài)系統(tǒng),如果我們不投入 20 年的時(shí)間,即使大部分時(shí)間都在虧損,也要致力于 CUDA 的發(fā)展——如果我們不去做,其他人就不會(huì)去做。
如果我們當(dāng)初沒(méi)有創(chuàng)建所有CUDA-X 庫(kù),使它們都針對(duì)特定領(lǐng)域……十五年前,我們開(kāi)始大力開(kāi)發(fā)領(lǐng)域特定庫(kù),因?yàn)槲覀円庾R(shí)到,如果我們不創(chuàng)建這些領(lǐng)域特定庫(kù),無(wú)論是光線追蹤、圖像生成,甚至是早期人工智能的模型,無(wú)論是數(shù)據(jù)處理、結(jié)構(gòu)化數(shù)據(jù)處理還是矢量數(shù)據(jù)處理,如果我們不創(chuàng)建它們,就不會(huì)有人創(chuàng)建。我對(duì)此深信不疑。我們創(chuàng)建了一個(gè)名為cuLitho的計(jì)算光刻庫(kù)。如果我們不創(chuàng)建它,就不會(huì)有人創(chuàng)建。因此,如果我們不做這些,加速計(jì)算就不會(huì)發(fā)展到今天這樣的程度。
所以我們應(yīng)該這樣做。我們應(yīng)該傾盡全力,全心全意地投入到這項(xiàng)工作中。然而,世事難料。如果我不做,也會(huì)有人去做。因此,我們公司至今仍然秉持著“盡可能多做,但盡可能少做”(doing as much as needed but as little as possible)的理念。我所做的每一件事,都遵循著這個(gè)原則。
就云計(jì)算而言,如果我們當(dāng)初不支持CoreWeave ,這些 neoclouds、這些 AI 云就不會(huì)存在。如果我們當(dāng)初沒(méi)有幫助 CoreWeave 發(fā)展,它們也不會(huì)存在。如果我們當(dāng)初沒(méi)有支持Nscale ,它們就不會(huì)有今天的成就。如果我們當(dāng)初沒(méi)有支持Nebius ,它們也不會(huì)有今天的成就。如今,它們發(fā)展得非常出色。
這算是一種商業(yè)模式嗎?我們應(yīng)該盡可能多地做事,盡可能少地干預(yù)。所以我們投資于我們的生態(tài)系統(tǒng),因?yàn)槲蚁M覀兊纳鷳B(tài)系統(tǒng)蓬勃發(fā)展。我希望架構(gòu)和人工智能能夠與盡可能多的行業(yè)、盡可能多的國(guó)家連接起來(lái),使整個(gè)地球能夠基于人工智能和美國(guó)的技術(shù)棧而運(yùn)轉(zhuǎn)。這正是我們正在追求的愿景。
您剛才提到的一點(diǎn)是……有很多非常優(yōu)秀的基金會(huì)模式公司,我們盡量投資所有這些公司。這也是我們所做的。我們不挑選贏家。我們需要支持所有公司。這是我們投資的樂(lè)趣所在,也是我們業(yè)務(wù)的必要組成部分。但我們也會(huì)刻意避免挑選贏家。所以,當(dāng)我投資一家公司時(shí),我也會(huì)投資所有相關(guān)的公司。
Q:你為什么刻意不去挑選贏家?
黃仁勛:第一,這不是我們的職責(zé)。第二,英偉達(dá)創(chuàng)立之初,有60家3D圖形公司。我們是唯一一家存活下來(lái)的。如果你把這60家圖形公司都列出來(lái),問(wèn)問(wèn)自己哪家會(huì)成功,英偉達(dá)肯定排在失敗名單的首位。
這事發(fā)生在你很久以前,但英偉達(dá)的圖形架構(gòu)一開(kāi)始確實(shí)是錯(cuò)的,不是一點(diǎn)點(diǎn)錯(cuò),而是我們創(chuàng)造了一個(gè)徹頭徹尾的錯(cuò)誤架構(gòu),開(kāi)發(fā)者根本無(wú)法維護(hù)。它注定失敗。我們當(dāng)初的出發(fā)點(diǎn)是好的,但最終卻得到了錯(cuò)誤的解決方案。所有人都認(rèn)為我們會(huì)失敗。而我們現(xiàn)在卻成功了。
所以我足夠謙遜,能夠認(rèn)識(shí)到這一點(diǎn)。不要人為地挑選贏家。要么讓他們各自發(fā)展,要么就幫助他們所有人。
Q:有一點(diǎn)我不明白,你說(shuō):“我們優(yōu)先發(fā)展這些NeoCloud項(xiàng)目,并非僅僅因?yàn)樗鼈兪荖eoCloud,我們想扶持它們。”但你又列舉了一堆NeoCloud項(xiàng)目,說(shuō)如果沒(méi)有NVIDIA,它們根本不會(huì)存在。這兩件事怎么能自相矛盾呢?
黃仁勛:首先,他們必須有創(chuàng)業(yè)的意愿,并且主動(dòng)來(lái)尋求我們的幫助。當(dāng)他們有創(chuàng)業(yè)意愿,并且擁有商業(yè)計(jì)劃、專(zhuān)業(yè)知識(shí)和熱情時(shí)……他們顯然也必須具備一定的自身能力。但如果最終他們需要一些投資才能啟動(dòng)項(xiàng)目,我們也會(huì)全力支持。不過(guò),他們?cè)皆鐔?dòng)自己的發(fā)展引擎越好……
你的問(wèn)題是:“我們是否想涉足融資業(yè)務(wù)?”答案是否定的。融資業(yè)務(wù)已經(jīng)存在,我們更愿意與他們合作,而不是自己成為融資者。我們的目標(biāo)是專(zhuān)注于我們自身的核心業(yè)務(wù),盡可能簡(jiǎn)化我們的商業(yè)模式,并支持我們的生態(tài)系統(tǒng)。
像 OpenAI 這樣的公司,在上市前就需要 300 億美元的投資,而我們深信他們,我也深信他們將會(huì)成為……嗯,他們現(xiàn)在就已經(jīng)是一家非凡的公司了。他們將會(huì)成為一家了不起的公司。世界需要他們,世界希望他們存在,我也希望他們存在。他們現(xiàn)在順風(fēng)順?biāo)W屛覀冎С炙麄儯屗麄儼l(fā)展壯大。我們會(huì)進(jìn)行這些投資,因?yàn)樗麄冃枰覀冞@樣做。但我們并非試圖盡可能多地投資,而是試圖盡可能少地干預(yù)。
Q:這可能是一個(gè)顯而易見(jiàn)的問(wèn)題,但我們已經(jīng)在 GPU 短缺的情況下生活了很多年,而且隨著模型性能的提高,這種情況現(xiàn)在變得更加嚴(yán)重了。
黃仁勛:我們?nèi)鄙貵PU。
Q:是的。眾所周知,英偉達(dá)在分配稀缺資源方面并非只看出價(jià),而是會(huì)考慮“我們想確保這些新云平臺(tái)能夠存在。所以我們給CoreWeave分配一些,給Crusoe分配一些,給Lambda分配一些。”這對(duì)英偉達(dá)有什么好處呢?首先,你是否同意這種將市場(chǎng)分割的說(shuō)法?
黃仁勛:不,不。你的前提完全錯(cuò)誤。我們對(duì)這些事情非常重視。首先,如果沒(méi)有采購(gòu)訂單,再多的討論也無(wú)濟(jì)于事。在拿到采購(gòu)訂單之前,我們能做什么?所以,首要任務(wù)是與所有人密切合作,努力完成預(yù)測(cè),因?yàn)檫@些項(xiàng)目需要很長(zhǎng)時(shí)間才能建成,數(shù)據(jù)中心的建設(shè)更是如此。我們通過(guò)預(yù)測(cè)來(lái)確保供需平衡等等。明白嗎?這是首要任務(wù)。
第二,我們已盡力與盡可能多的人進(jìn)行預(yù)測(cè),但最終您仍然需要下單。或許由于某種原因,您尚未下單。我能怎么辦?在某些情況下,我們會(huì)遵循先到先得的原則。但除此之外,如果您因?yàn)閿?shù)據(jù)中心尚未準(zhǔn)備就緒,或者某些組件尚未到位而無(wú)法搭建數(shù)據(jù)中心,我們可能會(huì)優(yōu)先服務(wù)其他客戶。這只是為了最大限度地提高我們工廠的產(chǎn)能。我們可能會(huì)對(duì)此進(jìn)行一些調(diào)整。
除此之外,優(yōu)先級(jí)是先進(jìn)先出。你必須下訂單。如果你不下訂單……當(dāng)然,這方面有很多傳聞。比如,這一切都源于一篇關(guān)于拉里和埃隆和我共進(jìn)晚餐的文章,文章里他們懇求我提供GPU 。這事根本沒(méi)發(fā)生過(guò)(That never happened)。我們確實(shí)一起吃了頓飯。我們確實(shí)一起吃了頓飯,而且那是一頓非常棒的晚餐。他們從來(lái)沒(méi)有懇求我提供GPU。他們只需要下訂單。一旦他們下訂單,我們會(huì)盡力滿足他們的產(chǎn)能需求。我們的流程很簡(jiǎn)單。
Q:好的。聽(tīng)起來(lái)好像有個(gè)排隊(duì)機(jī)制,然后根據(jù)你的數(shù)據(jù)中心是否準(zhǔn)備就緒以及你何時(shí)下訂單,你才能在特定時(shí)間獲得資源。但這仍然不像是價(jià)高者得。這樣做有什么原因嗎?
黃仁勛:我們從來(lái)不那樣做。
Q:為什么不直接選擇價(jià)高者得呢?
黃仁勛:因?yàn)檫@是糟糕的商業(yè)做法。你定好價(jià)格,然后讓別人決定買(mǎi)不買(mǎi)。我知道芯片行業(yè)的其他公司會(huì)在需求旺盛時(shí)調(diào)整價(jià)格,但我們不會(huì)。這從來(lái)都不是我們的行事方式。您可以信賴(lài)我們。我更愿意做一個(gè)可靠的人,成為行業(yè)的基石。您無(wú)需猜測(cè)。如果我報(bào)了價(jià),那就是我們報(bào)的價(jià)格。就是這樣。如果需求激增,那就順其自然。
Q:另一方面,這就是為什么你和臺(tái)積電保持著良好的合作關(guān)系,對(duì)吧?
黃仁勛:是的,英偉達(dá)和他們合作已經(jīng)快30年了。英偉達(dá)和臺(tái)積電之間沒(méi)有正式的法律合同。所以總會(huì)有些不公平的待遇。有時(shí)候我判斷對(duì),有時(shí)候我判斷錯(cuò)。有時(shí)候我能拿到更好的價(jià)格,有時(shí)候會(huì)拿到更差的價(jià)格。但總的來(lái)說(shuō),我們之間的關(guān)系非常棒。我完全信任他們,完全可以依靠他們。
選擇英偉達(dá),有一點(diǎn)可以肯定:今年,Vera Rubin將會(huì)非常出色。明年,Vera Rubin Ultra將問(wèn)世。后年,F(xiàn)eynman將橫空出世。再后年,我還沒(méi)公布名字呢。每年,你都可以信賴(lài)我們。你得去全世界找找其他 ASIC 團(tuán)隊(duì)——隨便挑一個(gè)——才能找到一個(gè)可以讓你說(shuō):“我可以把我的全部家產(chǎn)都押上,我可以把我的整個(gè)公司都押上,你們每年都會(huì)為我服務(wù)。你們的token成本每年都會(huì)下降一個(gè)數(shù)量級(jí),我可以像信賴(lài)時(shí)鐘一樣信賴(lài)你們。”(“I can bet the farm, I can bet my entire business that you will be here for me every single year. Your token cost will decrease by an order of magnitude every single year. I can count on it like I can count on the clock.”)
我剛才提到了臺(tái)積電。歷史上沒(méi)有任何其他代工廠能做到這一點(diǎn)。但如今,你可以這樣評(píng)價(jià)英偉達(dá)。每年你都可以信賴(lài)我們。如果你想購(gòu)買(mǎi)價(jià)值十億美元的AI工廠計(jì)算資源,沒(méi)問(wèn)題。如果你想購(gòu)買(mǎi)價(jià)值一億美元的,沒(méi)問(wèn)題。你想購(gòu)買(mǎi)價(jià)值一千萬(wàn)美元的,或者僅僅是一個(gè)機(jī)架,都沒(méi)問(wèn)題。或者僅僅是一張顯卡,好的,沒(méi)問(wèn)題。如果你想訂購(gòu)價(jià)值一千億美元的AI工廠,沒(méi)問(wèn)題。我們是當(dāng)今世界上唯一一家可以這樣說(shuō)的公司。
臺(tái)積電的情況也一樣。我想買(mǎi)一臺(tái),買(mǎi)十億臺(tái),都沒(méi)問(wèn)題。我們只需要按部就班地做好規(guī)劃,做所有成熟企業(yè)都會(huì)做的事情。所以我認(rèn)為,英偉達(dá)能夠成為全球人工智能產(chǎn)業(yè)的基石,是我們花了二十多年才取得的成就。這需要巨大的投入和奉獻(xiàn)。公司的穩(wěn)定性、公司的持續(xù)發(fā)展,對(duì)我們來(lái)說(shuō)至關(guān)重要。
我們應(yīng)該向中國(guó)出售人工智能芯片嗎?
Q:好的。我想問(wèn)問(wèn)關(guān)于中國(guó)的問(wèn)題。其實(shí)我也不知道對(duì)向中國(guó)出售芯片到底好不好有什么看法,但我喜歡和嘉賓唱反調(diào)。所以,上次達(dá)里奧做客“誰(shuí)支持出口管制”節(jié)目時(shí),我問(wèn)他,為什么美國(guó)和中國(guó)不能都擁有數(shù)據(jù)中心領(lǐng)域的天才人才呢?不過(guò)既然你持相反觀點(diǎn),那我就反過(guò)來(lái)問(wèn)你。
換個(gè)角度來(lái)看,Anthropic Games幾天前發(fā)布了Mythos Preview 。他們甚至沒(méi)有公開(kāi)發(fā)布這款Mythos模型,因?yàn)樗麄冋f(shuō)它擁有如此強(qiáng)大的網(wǎng)絡(luò)攻擊能力,在確保所有零日漏洞都被修復(fù)之前,世界還沒(méi)有做好準(zhǔn)備。但他們表示,Mythos在所有主流操作系統(tǒng)和瀏覽器中都發(fā)現(xiàn)了數(shù)千個(gè)高危漏洞。他們甚至在OpenBSD中也發(fā)現(xiàn)了一個(gè)漏洞,而OpenBSD正是專(zhuān)門(mén)設(shè)計(jì)用來(lái)避免零日漏洞的操作系統(tǒng)。他們發(fā)現(xiàn)的這個(gè)漏洞已經(jīng)存在了27年。
因此,如果中國(guó)能夠獲得人工智能芯片,訓(xùn)練像 Claude Mythos 這樣具有網(wǎng)絡(luò)攻擊能力的模型,并利用更強(qiáng)大的計(jì)算能力運(yùn)行數(shù)百萬(wàn)個(gè)實(shí)例,這會(huì)構(gòu)成威脅嗎?
黃仁勛:首先,Mythos的訓(xùn)練所用的計(jì)算能力和計(jì)算量都相當(dāng)普通,但訓(xùn)練所用的卻是一家非常優(yōu)秀的公司。這種計(jì)算能力和計(jì)算類(lèi)型在中國(guó)非常普遍。所以你首先需要明白,芯片在中國(guó)是存在的。
他們生產(chǎn)了全球60%的主流芯片,甚至可能更多。對(duì)他們來(lái)說(shuō),這是一個(gè)非常龐大的產(chǎn)業(yè)。他們擁有一些世界上最頂尖的計(jì)算機(jī)科學(xué)家。眾所周知,所有這些人工智能實(shí)驗(yàn)室中的大多數(shù)人工智能研究人員都是中國(guó)人。他們擁有全球50%的人工智能研究人員。所以問(wèn)題是,考慮到他們已經(jīng)擁有的所有資源——他們擁有豐富的能源、大量的芯片、以及絕大多數(shù)的人工智能研究人員——如果你擔(dān)心他們,那么創(chuàng)造一個(gè)安全世界的最佳方法是什么?
將他們視為受害者,把他們變成敵人,可能并非最佳方案。他們是對(duì)手。我們希望美國(guó)獲勝。但我認(rèn)為,開(kāi)展對(duì)話和研究性對(duì)話或許是最穩(wěn)妥的做法。由于我們目前將中國(guó)視為對(duì)手的態(tài)度,這方面明顯缺失。我們的人工智能研究人員和他們的人工智能研究人員必須進(jìn)行真正的對(duì)話。我們必須努力就人工智能的用途達(dá)成共識(shí)。
至于查找軟件漏洞,這當(dāng)然是人工智能的職責(zé)所在。它會(huì)在很多軟件中發(fā)現(xiàn)漏洞嗎?當(dāng)然會(huì)。軟件漏洞數(shù)不勝數(shù)。人工智能軟件中也存在大量漏洞。這正是人工智能的職責(zé)所在,我很高興人工智能已經(jīng)發(fā)展到能夠幫助我們大幅提高生產(chǎn)力的水平。
網(wǎng)絡(luò)安全、人工智能網(wǎng)絡(luò)安全、人工智能安全、人工智能隱私和人工智能保障等領(lǐng)域的生態(tài)系統(tǒng)非常豐富,但卻常常被忽視。一個(gè)龐大的人工智能初創(chuàng)企業(yè)生態(tài)系統(tǒng)正在努力為我們創(chuàng)造這樣的未來(lái):一個(gè)功能強(qiáng)大的人工智能代理被成千上萬(wàn)個(gè)其他人工智能代理環(huán)繞,共同守護(hù)著它的安全。這樣的未來(lái)必將到來(lái)。
讓人工智能代理在無(wú)人監(jiān)管的情況下四處運(yùn)行,這簡(jiǎn)直是瘋了。我們非常清楚,這個(gè)生態(tài)系統(tǒng)需要蓬勃發(fā)展。事實(shí)證明,這個(gè)生態(tài)系統(tǒng)需要開(kāi)源。這個(gè)生態(tài)系統(tǒng)需要開(kāi)放的模型。他們需要開(kāi)放的技術(shù)棧,這樣所有的人工智能研究人員和優(yōu)秀的計(jì)算機(jī)科學(xué)家才能構(gòu)建強(qiáng)大且安全的AI系統(tǒng)。因此,我們必須確保開(kāi)源生態(tài)系統(tǒng)的活力。這一點(diǎn)不容忽視。很多開(kāi)源項(xiàng)目都來(lái)自中國(guó)。我們不應(yīng)該扼殺它。
關(guān)于中國(guó),我們當(dāng)然希望美國(guó)擁有盡可能多的計(jì)算能力。我們受限于能源,但我們已經(jīng)投入大量資源來(lái)解決這個(gè)問(wèn)題。我們絕不能讓能源成為國(guó)家發(fā)展的瓶頸。但我們也希望確保全世界的人工智能開(kāi)發(fā)者都基于美國(guó)的技術(shù)棧進(jìn)行開(kāi)發(fā),并將人工智能的貢獻(xiàn)和進(jìn)步——尤其是在開(kāi)源的情況下——貢獻(xiàn)給美國(guó)生態(tài)系統(tǒng)。如果建立兩個(gè)生態(tài)系統(tǒng)——一個(gè)是只能運(yùn)行在外國(guó)技術(shù)棧上的開(kāi)源生態(tài)系統(tǒng),另一個(gè)是運(yùn)行在美國(guó)技術(shù)棧上的封閉生態(tài)系統(tǒng)——那將是極其愚蠢的。我認(rèn)為這對(duì)美國(guó)來(lái)說(shuō)將是一個(gè)糟糕的結(jié)果。
Q:由于事情很多,我先簡(jiǎn)單概括一下。我認(rèn)為,回到黑客攻擊中提到的浮點(diǎn)運(yùn)算能力差距問(wèn)題,沒(méi)錯(cuò),他們的確擁有計(jì)算能力,但他們實(shí)際能夠生產(chǎn)的浮點(diǎn)運(yùn)算能力只有美國(guó)的十分之一。
那么,他們最終能否訓(xùn)練出像 Mythos 這樣的模型呢?答案是肯定的。但問(wèn)題在于,由于失敗案例更多,美國(guó)實(shí)驗(yàn)室能夠率先達(dá)到這種能力水平。因?yàn)?Anthropic 公司搶先一步,他們會(huì)說(shuō):“好吧,我們先保留一個(gè)月,讓所有美國(guó)公司都有機(jī)會(huì)使用。他們會(huì)修復(fù)所有漏洞,然后我們?cè)侔l(fā)布。”
此外,即便他們訓(xùn)練出了這樣的模型,大規(guī)模部署的能力也至關(guān)重要……如果一個(gè)網(wǎng)絡(luò)黑客擁有上百萬(wàn)個(gè)這樣的模型,那肯定比只有一千個(gè)要危險(xiǎn)得多。所以推理計(jì)算能力真的非常重要。事實(shí)上,他們擁有如此多優(yōu)秀的AI研究人員,這才是真正令人擔(dān)憂的地方,因?yàn)槭鞘裁醋屵@些工程師研究人員如此高效?答案是計(jì)算能力。
如果你和美國(guó)的任何一家人工智能實(shí)驗(yàn)室交談,他們都會(huì)說(shuō)瓶頸在于計(jì)算能力。無(wú)論是DeepSeek的創(chuàng)始人,還是Qwen的領(lǐng)導(dǎo)層,都說(shuō)過(guò)類(lèi)似的話。他們都認(rèn)為瓶頸在于計(jì)算能力。那么問(wèn)題來(lái)了,難道不應(yīng)該讓美國(guó)公司憑借更強(qiáng)大的計(jì)算能力率先達(dá)到Mythos級(jí)別,為我們的社會(huì)做好準(zhǔn)備,趕在中國(guó)之前,因?yàn)橹袊?guó)計(jì)算能力較弱,這樣做不是更好嗎?
黃仁勛:我們應(yīng)該永遠(yuǎn)爭(zhēng)第一,永遠(yuǎn)擁有更多。但要讓你描述的結(jié)果成真,就必須走極端。他們必須完全沒(méi)有計(jì)算能力。如果他們有一些計(jì)算能力,問(wèn)題在于需要多少?
中國(guó)的計(jì)算能力非常龐大。要知道,中國(guó)可是全球第二大計(jì)算市場(chǎng)。如果他們想整合計(jì)算資源,完全可以滿足需求。
而且,他們擁有的能源量簡(jiǎn)直驚人,不是嗎?人工智能本質(zhì)上就是一個(gè)并行計(jì)算問(wèn)題,不是嗎?既然能源是免費(fèi)的,為什么他們不能把芯片的數(shù)量增加4倍、10倍甚至更多呢?他們擁有如此多的能源。他們的數(shù)據(jù)中心空空蕩蕩,電力卻依然充足。你知道他們有“鬼城”,他們的數(shù)據(jù)中心也一樣空置。他們的基礎(chǔ)設(shè)施容量如此龐大。如果他們?cè)敢猓麄兺耆梢园迅嗟男酒衅饋?lái),哪怕是更落后工藝的芯片
他們的芯片制造能力位居世界前列。半導(dǎo)體行業(yè)都知道他們壟斷了主流芯片市場(chǎng)。他們的產(chǎn)能過(guò)剩。因此,認(rèn)為中國(guó)無(wú)法制造人工智能芯片的說(shuō)法完全是無(wú)稽之談。
當(dāng)然,如果你問(wèn)我,如果全世界完全沒(méi)有計(jì)算能力,美國(guó)會(huì)不會(huì)更領(lǐng)先?但這根本不可能。這并非現(xiàn)實(shí)。他們現(xiàn)在的計(jì)算能力已經(jīng)非常充足了。你所擔(dān)心的那個(gè)問(wèn)題,他們所需的計(jì)算能力閾值,他們?cè)缫堰_(dá)到,甚至超過(guò)了。
所以我認(rèn)為你誤解了人工智能的本質(zhì),它就像一個(gè)五層蛋糕,最底層是能源。能源充足時(shí),芯片就足夠了;芯片充足時(shí),能源就足夠了。例如,美國(guó)能源匱乏,這就是為什么英偉達(dá)必須不斷改進(jìn)我們的架構(gòu),并進(jìn)行這種極致的協(xié)同設(shè)計(jì),以便在我們出貨的芯片數(shù)量有限的情況下——因?yàn)槟茉垂?yīng)極其有限——實(shí)現(xiàn)每瓦吞吐量的驚人水平。
但如果你的瓦數(shù)完全充足,而且是免費(fèi)的,你又何必在意每瓦性能呢?你已經(jīng)綽綽有余了。你可以用舊芯片來(lái)做。所以7nm芯片本質(zhì)上就是Hopper。Hopper的能力……我必須告訴你,如今的模型大多都是基于Hopper算法訓(xùn)練的,也就是Hopper算法的生成。所以7nm芯片已經(jīng)足夠好了。充足的能源是中國(guó)的優(yōu)勢(shì)。
Q:但問(wèn)題在于,他們是否真的能夠生產(chǎn)出足夠的芯片。
黃仁勛:但他們的確做到了。證據(jù)是什么?華為剛剛經(jīng)歷了公司歷史上業(yè)績(jī)最好的一年。
Q:最先進(jìn)的HBM一定需要EUV?
黃仁勛:不對(duì)。完全不對(duì)。你可以把它們組合起來(lái),就像我們把它們和NVL72組合起來(lái)一樣。他們已經(jīng)展示了硅光子學(xué)技術(shù),可以將所有這些計(jì)算能力連接起來(lái),形成一臺(tái)巨型超級(jí)計(jì)算機(jī)。你的前提完全錯(cuò)誤。
事實(shí)上,他們的AI研發(fā)進(jìn)展順利。世界上最頂尖的AI研究人員,由于計(jì)算能力有限,反而創(chuàng)造出了極其智能的算法。別忘了,我剛才說(shuō)過(guò)摩爾定律每年大約推進(jìn)25%。然而,憑借卓越的計(jì)算機(jī)科學(xué),我們?nèi)匀豢梢詫⑺惴ㄐ阅芴嵘?0倍。我的意思是,卓越的計(jì)算機(jī)科學(xué)才是關(guān)鍵所在。
毫無(wú)疑問(wèn),MoE 是一項(xiàng)偉大的發(fā)明。毫無(wú)疑問(wèn),所有令人驚嘆的注意力機(jī)制都減少了計(jì)算量。我們必須承認(rèn),人工智能的大部分進(jìn)步都源于算法的進(jìn)步,而不僅僅是硬件的改進(jìn)。既然大部分進(jìn)步都來(lái)自算法、計(jì)算機(jī)科學(xué)和編程,那么他們龐大的人工智能研究人員隊(duì)伍難道不是他們最根本的優(yōu)勢(shì)嗎?我們都看到了這一點(diǎn)。DeepSeek 絕非無(wú)關(guān)緊要的進(jìn)步。如果 DeepSeek 先在華為平臺(tái)上發(fā)布,那對(duì)我們國(guó)家來(lái)說(shuō)將是災(zāi)難性的。
Q:為什么會(huì)這樣?因?yàn)槟壳跋?DeepSeek 這樣的模型,只要是開(kāi)源的,就可以在任何加速器上運(yùn)行。為什么將來(lái)情況會(huì)改變呢?
黃仁勛:假設(shè)并非如此。假設(shè)它是針對(duì)華為優(yōu)化的,假設(shè)它是針對(duì)他們的架構(gòu)優(yōu)化的。那將使我們處于劣勢(shì)。你描述的情況在我看來(lái)是好消息。一家公司開(kāi)發(fā)了一款軟件,開(kāi)發(fā)了一個(gè)人工智能模型,而它在美式技術(shù)棧上運(yùn)行效果最佳。我認(rèn)為這是好消息。但你卻把它設(shè)定為壞消息。現(xiàn)在我要告訴你壞消息:世界各地的人工智能模型都是在非美國(guó)硬件上開(kāi)發(fā)的,而它們?cè)诜敲绹?guó)硬件上運(yùn)行效果最佳。這對(duì)我們來(lái)說(shuō)是壞消息。
Q:我感覺(jué)并沒(méi)有證據(jù)表明存在如此巨大的差異,足以阻止你更換加速器。美國(guó)實(shí)驗(yàn)室正在所有云平臺(tái)、所有不同的加速器上運(yùn)行他們的模型。
黃仁勛:我就是證據(jù)。你拿一個(gè)針對(duì)英偉達(dá)顯卡優(yōu)化的模型,然后試圖在其他顯卡上運(yùn)行它,這是行不通的。
Q:但美國(guó)實(shí)驗(yàn)室確實(shí)會(huì)這樣做。
黃仁勛:它們的運(yùn)行效果并沒(méi)有更好。英偉達(dá)的成功就是最好的證明。人工智能模型是在我們的技術(shù)棧上創(chuàng)建的,在我們的技術(shù)棧上運(yùn)行效果也最好,這難道不合邏輯嗎?
Q:Anthropic 的模型可以在 GPU 上運(yùn)行,可以在 Trainium 上運(yùn)行,也可以在 TPU 上運(yùn)行。
黃仁勛:要改變現(xiàn)狀,需要付出很多努力。但看看全球南方國(guó)家,看看中東地區(qū)。如果所有人工智能模型在別人的技術(shù)棧上運(yùn)行效果最佳,那么你現(xiàn)在提出的“這對(duì)美國(guó)來(lái)說(shuō)是件好事”的說(shuō)法就太荒謬了。
Q:但我不太明白這個(gè)論點(diǎn)。假設(shè)中國(guó)公司率先開(kāi)發(fā)出下一代Mythos系統(tǒng)。他們率先發(fā)現(xiàn)了美國(guó)軟件的所有安全漏洞,但他們可以在英偉達(dá)硬件上運(yùn)行,然后把產(chǎn)品運(yùn)往全球南方國(guó)家。他們用英偉達(dá)硬件開(kāi)發(fā),這有什么好處呢?好吧,它的確能在英偉達(dá)硬件上運(yùn)行——
黃仁勛:這不好,這不好,我們不能讓它發(fā)生。
Q:你為什么認(rèn)為它(指代英偉達(dá)GPU)是完全可替代的,即使你不向他們供貨,華為也能完全替代?他們落后了,對(duì)吧?他們的芯片比你的差。
黃仁勛:完全是這樣……現(xiàn)在就有證據(jù)。他們的芯片產(chǎn)業(yè)規(guī)模龐大。
Q:你只要對(duì)比H200和華為910C的浮點(diǎn)運(yùn)算能力、帶寬或內(nèi)存容量就知道了,它們的性能大概只有前者的一半到三分之一。
黃仁勛:他們用量更多。他們用的量是原來(lái)的兩倍。
Q:你的論點(diǎn)似乎是,他們擁有巨大的能源,他們需要用芯片來(lái)填充這些能源。
黃仁勛:而且他們很擅長(zhǎng)制造業(yè)。
Q:我相信最終他們肯定能在生產(chǎn)能力上勝過(guò)所有人。但現(xiàn)在還有這關(guān)鍵的幾年。
黃仁勛:你所說(shuō)的關(guān)鍵年份是指哪一年?如果未來(lái)幾年至關(guān)重要,那么我們必須確保在這關(guān)鍵的幾年里,全世界所有的人工智能模型都建立在美國(guó)的技術(shù)棧之上。
人工智能產(chǎn)業(yè)有五個(gè)層面,每個(gè)層面都必須成功。而最需要成功的層面實(shí)際上是人工智能應(yīng)用。你為什么如此執(zhí)著于那個(gè)人工智能模型?那家公司?究竟是出于什么原因?
能源、芯片以及人工智能研究人員的生態(tài)系統(tǒng)使這一切成為可能。
Q:如果美國(guó)的計(jì)算能力存在瓶頸,那么向中國(guó)出口芯片又如何能使美國(guó)保持領(lǐng)先地位呢?
黃仁勛:我認(rèn)為美國(guó)理應(yīng)領(lǐng)先。美國(guó)的計(jì)算能力是世界其他任何地方的100倍。美國(guó)理應(yīng)領(lǐng)先。好吧。美國(guó)確實(shí)領(lǐng)先。
英偉達(dá)致力于研發(fā)最先進(jìn)的技術(shù)。我們確保美國(guó)實(shí)驗(yàn)室能夠第一時(shí)間獲悉這些技術(shù),并擁有優(yōu)先購(gòu)買(mǎi)權(quán)。如果他們資金不足,我們甚至?xí)顿Y扶持他們。美國(guó)理應(yīng)領(lǐng)先。我們希望竭盡所能確保美國(guó)保持領(lǐng)先地位。這一點(diǎn)您同意嗎?我們正在為此竭盡全力。
你認(rèn)為英偉達(dá)是一家美國(guó)公司?好的。首先,為什么我們不制定一個(gè)更平衡的監(jiān)管政策,讓英偉達(dá)能夠在全球范圍內(nèi)取得成功,而不是讓美國(guó)放棄全球市場(chǎng)?你為什么要讓美國(guó)放棄全球市場(chǎng)?
芯片產(chǎn)業(yè)是美國(guó)生態(tài)系統(tǒng)的一部分,是美國(guó)技術(shù)領(lǐng)先地位的一部分,也是人工智能生態(tài)系統(tǒng)的一部分,更是人工智能領(lǐng)先地位的一部分。為什么你們的政策和理念會(huì)導(dǎo)致美國(guó)放棄世界市場(chǎng)的大部分份額?
將人工智能與你剛才提到的任何東西相提并論都是荒謬的。
Q:所以關(guān)鍵在于,現(xiàn)在賣(mài)芯片對(duì)我們長(zhǎng)遠(yuǎn)發(fā)展有何幫助?特斯拉長(zhǎng)期以來(lái)一直向中國(guó)銷(xiāo)售性能卓越的電動(dòng)汽車(chē)。iPhone在中國(guó)也暢銷(xiāo),而且質(zhì)量極佳。特斯拉并沒(méi)有造成中國(guó)市場(chǎng)的壟斷。中國(guó)仍然會(huì)生產(chǎn)自己的電動(dòng)汽車(chē),并且占據(jù)主導(dǎo)地位。他們的智能手機(jī)也占據(jù)主導(dǎo)地位。
黃仁勛:今天我們開(kāi)始對(duì)話時(shí),您也承認(rèn)英偉達(dá)的處境非常特殊。您用了“護(hù)城河”這樣的詞。對(duì)我們公司而言,最重要的就是我們生態(tài)系統(tǒng)的豐富性,而這離不開(kāi)開(kāi)發(fā)者。全球50%的人工智能開(kāi)發(fā)者都在中國(guó)。美國(guó)不應(yīng)該放棄這塊寶地。
Q:但是我們?cè)诿绹?guó)有很多英偉達(dá)的開(kāi)發(fā)者,但這并不妨礙美國(guó)實(shí)驗(yàn)室未來(lái)使用其他加速器。事實(shí)上,他們現(xiàn)在就在使用其他加速器,這很好,也很棒。如果你向中國(guó)銷(xiāo)售英偉達(dá)芯片,我不明白為什么在中國(guó)就不能這樣做,就像谷歌可以使用TPU和英偉達(dá)芯片一樣。
黃仁勛:我們必須不斷創(chuàng)新,而且正如你可能知道的,我們的市場(chǎng)份額正在增長(zhǎng),而不是下降。那種認(rèn)為即使我們?cè)谥袊?guó)競(jìng)爭(zhēng),最終也會(huì)失去那個(gè)市場(chǎng)的想法……你不是在跟一個(gè)醒來(lái)就覺(jué)得自己是個(gè)失敗者的人說(shuō)話。那種失敗者的態(tài)度,那種失敗者的假設(shè),在我看來(lái)毫無(wú)道理。
我們不是汽車(chē)。我們不是汽車(chē)。我可以今天買(mǎi)這個(gè)牌子的車(chē),明天再買(mǎi)另一個(gè)牌子的車(chē),這很容易。但計(jì)算機(jī)領(lǐng)域并非如此。x86 架構(gòu)的存在是有原因的。ARM架構(gòu)如此根深蒂固也是有原因的。這些生態(tài)系統(tǒng)難以替代。這需要耗費(fèi)大量的時(shí)間和精力,而且大多數(shù)人都不愿意這樣做。因此,我們的職責(zé)是繼續(xù)培育這個(gè)生態(tài)系統(tǒng),不斷推進(jìn)技術(shù)發(fā)展,從而在市場(chǎng)競(jìng)爭(zhēng)中保持優(yōu)勢(shì)。
如果按照你描述的那種前提來(lái)劃分市場(chǎng),我根本無(wú)法接受。這完全說(shuō)不通。因?yàn)槲也徽J(rèn)為美國(guó)是失敗者,我們的行業(yè)也不是失敗者。這種失敗論調(diào),這種失敗心態(tài),在我看來(lái)毫無(wú)道理。
Q:但他們之所以從你這里購(gòu)買(mǎi)是有原因的。我們有來(lái)自中國(guó)公司創(chuàng)始人的引述,他們表示公司在計(jì)算能力方面遇到了瓶頸。
黃仁勛:因?yàn)槲覀兊男酒谩?偟膩?lái)說(shuō),我們的芯片更好。這一點(diǎn)毋庸置疑。如果沒(méi)有我們的芯片……您能承認(rèn)華為今年的業(yè)績(jī)創(chuàng)下紀(jì)錄嗎?您能承認(rèn)一大批芯片公司都上市了嗎?您能承認(rèn)嗎?
您是否也承認(rèn),我們過(guò)去在該市場(chǎng)占據(jù)了很大的份額,而現(xiàn)在份額已經(jīng)大幅下降?我們也可以承認(rèn),中國(guó)占據(jù)了全球科技產(chǎn)業(yè)約40%的份額。為了美國(guó)科技產(chǎn)業(yè)的利益而放棄這個(gè)市場(chǎng),是對(duì)我們國(guó)家的損害,是對(duì)我們國(guó)家安全的損害,也是對(duì)我們科技領(lǐng)導(dǎo)地位的損害。這一切僅僅是為了一家公司的利益。這在我看來(lái)毫無(wú)道理。
Q:我有點(diǎn)糊涂了。感覺(jué)你好像在說(shuō)兩件事。一是如果我們能參與競(jìng)爭(zhēng),我們的芯片性能會(huì)遠(yuǎn)勝華為,所以我們肯定能贏下這場(chǎng)與華為的競(jìng)爭(zhēng)。二是就算沒(méi)有我們,他們也會(huì)做同樣的事情。這兩件事怎么可能同時(shí)成立呢?
黃仁勛:這顯然是事實(shí)。如果沒(méi)有更好的選擇,你只能選擇唯一的選擇。這怎么會(huì)不合邏輯呢?這明明很合乎邏輯。
Q:他們想要英偉達(dá)芯片的原因是,英偉達(dá)芯片性能更好。
黃仁勛:是的
Q:更好的模型需要更多的計(jì)算資源。更多的計(jì)算資源意味著你可以訓(xùn)練出更好的模型。
黃仁勛:不,它就是更好。它更好,因?yàn)樗菀拙幊獭N覀儞碛懈玫纳鷳B(tài)系統(tǒng)。但無(wú)論“更好”指的是什么,無(wú)論“更好”指的是什么……當(dāng)然,我們會(huì)把計(jì)算資源輸送給他們。那又怎樣?事實(shí)是我們能從中受益。別忘了,我們能享受到美國(guó)技術(shù)領(lǐng)先地位帶來(lái)的好處。我們能享受到開(kāi)發(fā)者們?cè)诿绹?guó)技術(shù)棧上工作的益處。隨著這些人工智能模型擴(kuò)散到世界各地,我們也能享受到美國(guó)技術(shù)棧因此成為最佳選擇帶來(lái)的好處。我們可以繼續(xù)推進(jìn)和推廣美國(guó)技術(shù)。我認(rèn)為這是一件好事。這是美國(guó)技術(shù)領(lǐng)先地位中非常重要的一部分。
現(xiàn)在,你所倡導(dǎo)的政策導(dǎo)致美國(guó)電信行業(yè)基本上被排擠出了世界市場(chǎng),以至于我們甚至無(wú)法掌控自己的電信業(yè)務(wù)。我認(rèn)為這并不明智。這種做法有些目光短淺,而且導(dǎo)致了一些意想不到的后果,我現(xiàn)在正在向你描述這些后果,但你似乎很難理解。
Q:好的,我們先退一步。問(wèn)題的關(guān)鍵似乎在于,這里既有潛在的收益,也有潛在的成本。我們正在努力弄清楚的是,收益是否值得付出成本?我想讓你們意識(shí)到潛在的成本。計(jì)算是訓(xùn)練強(qiáng)大模型的輸入。強(qiáng)大的模型確實(shí)擁有強(qiáng)大的攻擊能力,例如網(wǎng)絡(luò)攻擊。美國(guó)公司率先達(dá)到 Mythos 級(jí)別的能力是一件好事,現(xiàn)在他們決定暫緩發(fā)布這些能力,以便美國(guó)公司和美國(guó)政府能夠在正式發(fā)布該級(jí)別能力之前,更好地保護(hù)他們的軟件。
如果中國(guó)擁有更強(qiáng)大的計(jì)算能力或更多的眾包計(jì)算資源,如果他們能夠更早地開(kāi)發(fā)出類(lèi)似 Mythos 那樣的計(jì)算模型并進(jìn)行廣泛部署,那將會(huì)非常糟糕。這種情況沒(méi)有發(fā)生的原因之一是,由于像英偉達(dá)這樣的美國(guó)公司,我們擁有了更強(qiáng)大的計(jì)算能力。這是將計(jì)算資源轉(zhuǎn)移到中國(guó)所要付出的代價(jià)。所以,我們暫且不談好處。您是否意識(shí)到這是一種潛在的代價(jià)?
黃仁勛:我還要告訴你,潛在的代價(jià)是,我們?cè)试S人工智能技術(shù)棧中最重要的一層——芯片層——拱手讓出整個(gè)市場(chǎng)——全球第二大市場(chǎng)——讓他們得以發(fā)展規(guī)模,建立自己的生態(tài)系統(tǒng),從而使未來(lái)的人工智能模型以與美國(guó)技術(shù)棧截然不同的方式進(jìn)行優(yōu)化。隨著人工智能在全球擴(kuò)散,他們的標(biāo)準(zhǔn)和技術(shù)棧將會(huì)超越我們,因?yàn)樗麄兊哪P褪情_(kāi)放的。
Q:我想我只是對(duì)英偉達(dá)的內(nèi)核工程師和CUDA工程師有足夠的信心,相信他們能夠進(jìn)行優(yōu)化——
黃仁勛:如你所知,人工智能不僅僅是內(nèi)核優(yōu)化。
中國(guó)是全球最大的開(kāi)源軟件貢獻(xiàn)國(guó)。這是事實(shí)。中國(guó)也是全球最大的開(kāi)放模型貢獻(xiàn)國(guó)。這是事實(shí)。如今,它建立在美國(guó)的技術(shù)棧之上,也就是英偉達(dá)的技術(shù)棧。這是事實(shí)。
人工智能技術(shù)棧的五個(gè)層面都至關(guān)重要。美國(guó)應(yīng)該力爭(zhēng)拿下所有五個(gè)層面。它們都不可或缺。當(dāng)然,最重要的層面是人工智能應(yīng)用層。這一層會(huì)滲透到社會(huì)各個(gè)角落,被應(yīng)用最為廣泛,也將從這場(chǎng)工業(yè)革命中獲益最多。但我的觀點(diǎn)是,每一層都必須成功。
如果我們嚇唬全國(guó)人民,讓他們覺(jué)得人工智能就像核彈一樣,讓每個(gè)人都憎恨人工智能、害怕人工智能,我不知道這對(duì)美國(guó)有什么好處。這只會(huì)害了美國(guó)。如果我們嚇得所有人都不敢從事軟件工程工作,因?yàn)槿斯ぶ悄軙?huì)扼殺所有軟件工程崗位——結(jié)果導(dǎo)致我們一個(gè)軟件工程師都沒(méi)有——那我們也是在害美國(guó)。
如果我們因?yàn)橛?jì)算機(jī)視覺(jué)完全免費(fèi),人工智能的工作能力不會(huì)比放射科醫(yī)生差,就嚇跑所有人,讓大家都不想當(dāng)放射科醫(yī)生,那我們就誤解了工作和任務(wù)之間的區(qū)別。放射科醫(yī)生的工作是照護(hù)病人,而任務(wù)是解讀掃描結(jié)果。如果我們對(duì)這一點(diǎn)理解如此深刻,嚇跑所有人去讀放射科,那么我們將面臨放射科醫(yī)生短缺和醫(yī)療資源匱乏的問(wèn)題。
所以我的意思是,當(dāng)你設(shè)定一個(gè)如此極端的前提,一切都從零到無(wú)窮大,最終只會(huì)嚇到人們,而這根本不是事實(shí)。生活并非如此。我們希望美國(guó)領(lǐng)先嗎?當(dāng)然希望。我們需要在各個(gè)層面都保持領(lǐng)先地位嗎?當(dāng)然需要。當(dāng)然需要。今天你談到Mythos,是因?yàn)镸ythos很重要。沒(méi)錯(cuò)。太好了。
但幾年后,我預(yù)言,當(dāng)我們想要推廣美國(guó)技術(shù)體系,當(dāng)我們希望美國(guó)技術(shù)走向世界——走向印度、走向中東、走向非洲、走向東南亞——當(dāng)我們的國(guó)家想要出口,因?yàn)槲覀兿胍隹谖覀兊募夹g(shù),我們想要出口我們的標(biāo)準(zhǔn)時(shí),我希望你我再次進(jìn)行同樣的對(duì)話。我會(huì)詳細(xì)地告訴你今天的對(duì)話,告訴你你的政策和你的設(shè)想是如何導(dǎo)致美國(guó)毫無(wú)理由地拱手讓出世界第二大市場(chǎng)。
我們不應(yīng)該放棄。如果輸了,那就輸了。但我們?yōu)槭裁匆艞壞兀楷F(xiàn)在沒(méi)人主張非此即彼。沒(méi)人主張非此即彼,也就是說(shuō)我們應(yīng)該一直把所有東西都運(yùn)到中國(guó)去。沒(méi)人主張那樣。我們應(yīng)該始終擁有最先進(jìn)的技術(shù)。我們應(yīng)該始終擁有最多的技術(shù),并且是第一。但我們也應(yīng)該努力在全球范圍內(nèi)競(jìng)爭(zhēng)并取得勝利。這兩件事可以同時(shí)進(jìn)行。這需要一些細(xì)致入微的思考,一些成熟的態(tài)度,而不是絕對(duì)的。世界本來(lái)就不是絕對(duì)的。
Q:因?yàn)槭艿礁鞣N限制(例如拿不到EUV光刻機(jī)),中國(guó)的芯片真的能出口到世界各地,從而確立行業(yè)標(biāo)準(zhǔn)嗎?
黃仁勛:那我們直接看事實(shí)吧?Blackwell的光刻技術(shù)真的比Hopper先進(jìn)50倍嗎?真的有50倍嗎?差遠(yuǎn)了。我一直在重復(fù)這句話:摩爾定律已經(jīng)失效了。從晶體管本身的性能來(lái)看,Hopper和Blackwell之間的差距大概是75%。兩者相隔三年,差距高達(dá)75%。Blackwell爾的性能是Hopper的50倍。
我的觀點(diǎn)是,架構(gòu)至關(guān)重要。計(jì)算機(jī)科學(xué)至關(guān)重要。半導(dǎo)體物理固然重要,但計(jì)算機(jī)科學(xué)才是重中之重。人工智能的影響很大程度上源于計(jì)算棧,這也是CUDA如此高效、如此受人喜愛(ài)的原因。它是一個(gè)生態(tài)系統(tǒng),一種計(jì)算架構(gòu),它提供了極大的靈活性,以至于如果你想徹底改變架構(gòu)——比如創(chuàng)建類(lèi)似MoE的架構(gòu)、類(lèi)似擴(kuò)散的架構(gòu)、或者創(chuàng)建解耦架構(gòu)——你都能做到。這很容易。
所以事實(shí)是,人工智能不僅關(guān)乎底層架構(gòu),也關(guān)乎上層技術(shù)棧。如果我們擁有針對(duì)自身技術(shù)棧和生態(tài)系統(tǒng)進(jìn)行優(yōu)化的架構(gòu)和軟件棧,那當(dāng)然是好事,因?yàn)槲覀兘裉煲婚_(kāi)始就討論了英偉達(dá)生態(tài)系統(tǒng)的豐富性。為什么人們總是喜歡先寫(xiě)CUDA?確實(shí)如此。中國(guó)的研究人員也是如此。
但如果我們被迫離開(kāi)中國(guó),首先,這是一個(gè)政策錯(cuò)誤。顯然,這會(huì)引發(fā)強(qiáng)烈反彈。這對(duì)美國(guó)來(lái)說(shuō)后果很?chē)?yán)重。它促進(jìn)了中國(guó)的芯片產(chǎn)業(yè)發(fā)展,加速了其人工智能生態(tài)系統(tǒng)的轉(zhuǎn)型升級(jí),迫使其人工智能生態(tài)系統(tǒng)專(zhuān)注于內(nèi)部架構(gòu)。現(xiàn)在亡羊補(bǔ)牢,為時(shí)未晚,但事已至此。
未來(lái)你會(huì)看到,他們顯然不會(huì)止步于于此。他們的制造工藝很出色,他們會(huì)繼續(xù)在現(xiàn)有及更先進(jìn)的工藝基礎(chǔ)上發(fā)展。先進(jìn)工藝的差距有10倍嗎?答案是否定的。架構(gòu)很重要,網(wǎng)絡(luò)也很重要。這就是英偉達(dá)收購(gòu)Mellanox的原因。網(wǎng)絡(luò)很重要,能源也很重要。所有這些都很重要。事情并不像你試圖簡(jiǎn)化的那樣簡(jiǎn)單。
為什么英偉達(dá)不生產(chǎn)多種不同的芯片架構(gòu)?
Q:我們之前討論過(guò)臺(tái)積電在內(nèi)存等方面的瓶頸問(wèn)題。
所以,如果我們身處這樣一個(gè)世界:你已經(jīng)占據(jù)了N3的大部分份額——而且在某個(gè)時(shí)候你會(huì)進(jìn)入N2時(shí)代,并占據(jù)N2的大部分份額——你是否認(rèn)為你可以回到N7時(shí)代,也就是利用舊工藝節(jié)點(diǎn)的剩余產(chǎn)能,然后說(shuō):“嘿,人工智能的需求如此巨大,而我們擴(kuò)展前沿技術(shù)的能力卻無(wú)法滿足,所以我們要制造一個(gè)Hopper或Ampere架構(gòu)的處理器,但要運(yùn)用我們目前掌握的所有數(shù)值計(jì)算知識(shí)以及你提到的所有其他改進(jìn)”?你認(rèn)為這種情況會(huì)在2030年之前發(fā)生嗎?
黃仁勛:沒(méi)必要。原因在于,每一代產(chǎn)品的架構(gòu)都不僅僅局限于晶體管的尺寸。它還涉及到大量的工程設(shè)計(jì)、封裝、堆疊、數(shù)值計(jì)算和系統(tǒng)架構(gòu)。
當(dāng)產(chǎn)能耗盡時(shí),想要輕易地回到之前的制程節(jié)點(diǎn)……那需要投入大量的研發(fā)資源,誰(shuí)也負(fù)擔(dān)不起。我們有能力向前發(fā)展,但我認(rèn)為我們負(fù)擔(dān)不起回頭路。現(xiàn)在,假設(shè)有一天,我們突然意識(shí)到:“我們?cè)僖矡o(wú)法擁有更多的產(chǎn)能了。”我會(huì)選擇回到7nm制程嗎?當(dāng)然會(huì)毫不猶豫地選擇它。
Q:我之前和人討論時(shí),有人問(wèn)過(guò)我一個(gè)問(wèn)題:為什么英偉達(dá)不同時(shí)開(kāi)展多個(gè)架構(gòu)完全不同的芯片項(xiàng)目?比如,可以開(kāi)發(fā)類(lèi)似Cerebras的晶圓級(jí)芯片,也可以開(kāi)發(fā)類(lèi)似Dojo 的大型封裝芯片,還可以開(kāi)發(fā)不使用 CUDA 的芯片。英偉達(dá)擁有足夠的資源和工程人才來(lái)并行開(kāi)發(fā)所有這些芯片。考慮到人工智能和架構(gòu)的未來(lái)發(fā)展方向難以預(yù)測(cè),為什么要把所有雞蛋都放在一個(gè)籃子里呢?
黃仁勛:哦,我們當(dāng)然可以。只是我們沒(méi)有更好的辦法。我們能做所有這些事情,但效果并不理想。我們?cè)谀M器里模擬了所有情況,結(jié)果證明更糟。所以我們不會(huì)這么做。我們現(xiàn)在做的正是我們想做的項(xiàng)目。如果工作負(fù)載發(fā)生巨大變化——我指的不是算法,而是工作負(fù)載本身,而這取決于市場(chǎng)格局——我們可能會(huì)考慮增加其他加速器。
例如,我們最近新增了Groq ,并且計(jì)劃將其整合到我們的 CUDA 生態(tài)系統(tǒng)中。我們現(xiàn)在這樣做是因?yàn)閠oken價(jià)值飆升,可以采用不同的定價(jià)策略。就在幾年前token要么是免費(fèi)的,要么價(jià)格非常低廉。但現(xiàn)在,我們的客戶群體各不相同,他們需要不同的解決方案。因?yàn)榭蛻羰杖牒芨摺缥覀兊能浖こ處煛绻夷転樗麄兲峁╉憫?yīng)速度更快的代幣,從而讓他們比現(xiàn)在更高效,我愿意為此付費(fèi)。
但這個(gè)市場(chǎng)是最近才出現(xiàn)的。所以我認(rèn)為我們現(xiàn)在有能力基于響應(yīng)時(shí)間,將同一個(gè)模型劃分成不同的細(xì)分市場(chǎng)。這就是我們決定擴(kuò)展帕累托前沿,并創(chuàng)建一個(gè)響應(yīng)時(shí)間更快、但吞吐量更低的推理細(xì)分市場(chǎng)的原因。在此之前,更高的吞吐量總是更好的。我們認(rèn)為,未來(lái)可能會(huì)出現(xiàn)平均售價(jià)(ASP)非常高的代幣,即使工廠的吞吐量較低,ASP 也能彌補(bǔ)這一點(diǎn)。
這就是我們這么做的原因。但除此之外,從架構(gòu)角度來(lái)看,如果我有更多資金,我會(huì)加大對(duì)英偉達(dá)架構(gòu)的投入。
Q:最后一個(gè)問(wèn)題。假設(shè)深度學(xué)習(xí)革命沒(méi)有發(fā)生,英偉達(dá)會(huì)做什么?
黃仁勛:加速計(jì)算,這和我們一直以來(lái)所做的一模一樣。我們公司的理念是摩爾定律將會(huì)……通用計(jì)算在很多方面都很出色,但對(duì)于很多計(jì)算任務(wù)來(lái)說(shuō),它并非理想之選。
因此,我們將一種名為GPU(CUDA)的架構(gòu)與CPU結(jié)合起來(lái),從而加速CPU的工作負(fù)載。不同的代碼內(nèi)核或算法可以卸載到GPU上執(zhí)行。這樣一來(lái),應(yīng)用程序的運(yùn)行速度就能提升100倍、200倍。這項(xiàng)技術(shù)有哪些應(yīng)用呢?顯然,它適用于工程、科學(xué)、物理、數(shù)據(jù)處理、計(jì)算機(jī)圖形學(xué)、圖像生成等各個(gè)領(lǐng)域。即使人工智能今天尚未出現(xiàn),英偉達(dá)的規(guī)模也會(huì)非常龐大。
原因相當(dāng)根本,那就是通用計(jì)算的擴(kuò)展能力已基本達(dá)到極限。而唯一的方法……或者說(shuō),實(shí)現(xiàn)這一目標(biāo)的方法之一,就是通過(guò)領(lǐng)域特定加速。我們最初關(guān)注的領(lǐng)域之一是計(jì)算機(jī)圖形學(xué),但還有許多其他領(lǐng)域。種類(lèi)繁多,包括粒子物理和流體動(dòng)力學(xué)、結(jié)構(gòu)化數(shù)據(jù)處理,以及各種各樣能夠從 CUDA 中受益的算法。
我們的使命是真正將加速計(jì)算帶給全世界,推進(jìn)通用計(jì)算無(wú)法勝任的應(yīng)用,并擴(kuò)展到足以幫助某些科學(xué)領(lǐng)域取得突破的水平。早期的一些應(yīng)用包括分子動(dòng)力學(xué)、用于能源勘探的地震數(shù)據(jù)處理、圖像處理等等,所有這些領(lǐng)域通用計(jì)算的效率都太低,無(wú)法勝任。
如果沒(méi)有人工智能,我會(huì)非常難過(guò)。但正因?yàn)槲覀冊(cè)谟?jì)算機(jī)領(lǐng)域取得了進(jìn)步,深度學(xué)習(xí)才得以普及。我們讓任何研究人員、任何科學(xué)家、任何學(xué)生,無(wú)論身處何地,都能使用個(gè)人電腦或GeForce顯卡,開(kāi)展令人驚嘆的科學(xué)研究。這一根本承諾從未改變,絲毫未變。
如果你看過(guò)GTC,就會(huì)發(fā)現(xiàn)它最初的部分完全與人工智能無(wú)關(guān)。無(wú)論是計(jì)算光刻、量子化學(xué),還是數(shù)據(jù)處理等等,都與人工智能無(wú)關(guān)。而且這些內(nèi)容仍然非常重要。我知道人工智能非常有趣,也很令人興奮,但還有很多人在做著與人工智能無(wú)關(guān)的重要工作,張量也不是唯一的計(jì)算方法。我們希望能夠幫助到所有人。
文 / 黃仁勛 美國(guó)工程院院士、NVIDIA創(chuàng)始人兼首席執(zhí)行官
來(lái)源:C114通信網(wǎng)
文章僅代表作者本人觀點(diǎn)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.