337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

到底什么是All-Reduce、All-to-All?

0
分享至

我們?cè)诳碅IGC大模型、算力集群相關(guān)文獻(xiàn)的時(shí)候,經(jīng)常會(huì)看到“ All-Reduce ”、“ All-to-All ”這樣的詞組。

大家知道它們是什么意思嗎?


故事還是要從英偉達(dá)說(shuō)起。

2014年,為了取代傳統(tǒng)的PCIe協(xié)議,英偉達(dá)推出了全新的NVLINK技術(shù),用于GPU和GPU之間的點(diǎn)對(duì)點(diǎn)高速互聯(lián)。

后來(lái),NVLINK技術(shù)不斷迭代。 2018年,為了實(shí)現(xiàn)8顆GPU之間的互連,英偉達(dá)又發(fā)布了NVSwitch 1.0。

在搗鼓GPU互連技術(shù)的過(guò)程中,英偉達(dá)還發(fā)明了一個(gè)名叫 NCCL(NVIDIA Collective Communications Library)的集合通信庫(kù)。

NCCL支持多種編程語(yǔ)言和網(wǎng)絡(luò),在算法層面提供了豐富的外部API,可以大幅提升通信網(wǎng)絡(luò)性能,也可以讓GPU之間的通信設(shè)計(jì)變得更簡(jiǎn)單。

在NCCL中,定義了兩種通信模式:

1、點(diǎn)對(duì)點(diǎn)通信(Point to point communication,P2P)

2、集合通信(Collective communication,CC)

點(diǎn)對(duì)點(diǎn)大家一看就懂,就是兩個(gè)點(diǎn)之間進(jìn)行通信。一個(gè)是Sender,一個(gè)是Receiver。

什么是集合通信呢?是指一組(多個(gè))節(jié)點(diǎn)內(nèi)進(jìn)行通信。在我們傳統(tǒng)通信里,就是點(diǎn)到多點(diǎn),多點(diǎn)到多點(diǎn),涉及到組網(wǎng)(網(wǎng)狀、星狀、環(huán)狀、mesh等)那種。

NCCL還定義了一些計(jì)算節(jié)點(diǎn)之間數(shù)據(jù)交換的基本操作模式,并將其命名為——“通信原語(yǔ)(也有寫作通信元語(yǔ)

這些通信原語(yǔ)包括:Broadcast、Scatter、Gather、All-Gather、Reduce、All-Reduce、Reduce-Scatter、All-to-All等。

沒(méi)錯(cuò),All-Reduce和All-to-All,就是其中之二。

這些通信原語(yǔ)是構(gòu)建復(fù)雜通信行為的“原子操作”。現(xiàn)在所有復(fù)雜的AI算力集群,內(nèi)部通信都是基于這些通信原語(yǔ)。它們極大地提升了并行計(jì)算的效率和便利性。

接下來(lái),我們就逐個(gè)解釋一下,這些通信原語(yǔ)的意思。

Broadcast(1對(duì)多的廣播

這個(gè)最簡(jiǎn)單。當(dāng)主節(jié)點(diǎn)執(zhí)行Broadcast操作時(shí),數(shù)據(jù)會(huì)從主節(jié)點(diǎn)發(fā)送至其他所有節(jié)點(diǎn)。


Broadcast是一個(gè)典型的分發(fā)、散播行為。在分布式機(jī)器學(xué)習(xí)中,Broadcast常用于網(wǎng)絡(luò)參數(shù)的初始化。

Scatter(1對(duì)多的發(fā)散)

Scatter也是一種分發(fā)、散播行為。它也是 將主節(jié)點(diǎn)的數(shù)據(jù)發(fā)送至其他所有節(jié)點(diǎn)。只不過(guò), Broadcast發(fā)送的是完整數(shù)據(jù),而 Scatter是將數(shù)據(jù)進(jìn)行切割后,再分發(fā),就像分生日蛋糕。


Gather(多對(duì)1的收集)

Gather,是將多個(gè)sender(發(fā)送節(jié)點(diǎn))上的數(shù)據(jù)收集到單個(gè)節(jié)點(diǎn)上,可以理解為反向的Scatter。


All-Gather(多對(duì)多的收集)

Gather是多個(gè)到一個(gè),All-Gather是多個(gè)到多個(gè)。

All-Gather是將多個(gè)sender(發(fā)送節(jié)點(diǎn))上的數(shù)據(jù)收集到多個(gè)節(jié)點(diǎn)上。它相當(dāng)于多個(gè)Gather操作。或者說(shuō),是一個(gè)Gather操作之后,跟著一個(gè)Broadcast操作。


Reduce(多對(duì)1的規(guī)約)

Reduce的英文意思是“減少、降低”。在集合通信里,它表示“規(guī)約”運(yùn)算,是一系列簡(jiǎn)單運(yùn)算操作(包括:SUM、MIN、MAX、PROD、LOR等)的統(tǒng)稱。

經(jīng)常用Excel表格的童鞋,對(duì)這些簡(jiǎn)單運(yùn)算應(yīng)該不陌生。例如SUM,就是求和。MIN,就是找出最小值。

其實(shí)說(shuō)白了,Reduce就是:輸入多個(gè)數(shù),執(zhí)行操作后,得到更少的數(shù)(例如1個(gè)數(shù))。

下面這個(gè),就是以ReduceSum(求和規(guī)約)為例:


All-Reduce(多對(duì)多的規(guī)約)

All-Reduce,這個(gè)是我們?cè)谖恼麻_(kāi)頭提到的,AI領(lǐng)域非常常見(jiàn)的一個(gè)詞組。

在大模型訓(xùn)練中,經(jīng)常會(huì)用到數(shù)據(jù)并行(DP)這個(gè)并行方式。里面就有AIl Reduce這個(gè)關(guān)鍵操作。

我們以All Reduce Sum(求和)為例:

首先,對(duì)所有節(jié)點(diǎn)進(jìn)行數(shù)據(jù)收集。然后,對(duì)數(shù)據(jù)進(jìn)行求和。再然后,把結(jié)果重新發(fā)回給所有節(jié)點(diǎn)。


在大模型訓(xùn)練中,Server GPU節(jié)點(diǎn)收集的數(shù)據(jù),就是各個(gè)Worker GPU節(jié)點(diǎn)計(jì)算得出的“梯度”。求和之后再發(fā)回的過(guò)程,是“更新梯度”。看不懂沒(méi)關(guān)系,以后小棗君會(huì)再介紹。

Reduce-Scatter(組合的規(guī)約與發(fā)散)

Reduce-Scatter稍微有點(diǎn)復(fù)雜、燒腦。

它是先歸約(Reduce),再分散(Scatter)。具體來(lái)說(shuō):

首先,在所有參與計(jì)算的GPU節(jié)點(diǎn)上,對(duì)位于相同位置或索引的數(shù)據(jù)塊執(zhí)行指定的規(guī)約運(yùn)算(例如求和SUM)。

接著,將規(guī)約后的完整結(jié)果按維度切分,并將不同的數(shù)據(jù)塊分發(fā)給各個(gè)節(jié)點(diǎn)。最終,每個(gè)節(jié)點(diǎn)只得到整個(gè)規(guī)約結(jié)果的一部分,而不是全部。


簡(jiǎn)單來(lái)說(shuō),它先對(duì)所有數(shù)據(jù)進(jìn)行“匯總計(jì)算”,然后再將計(jì)算好的結(jié)果“分散下發(fā)”。

All-to-All(多對(duì)多的全互連)

AIl-to-AII也是AI領(lǐng)域出現(xiàn)頻率很高的一個(gè)詞組。它是全交換操作,可以讓每個(gè)節(jié)點(diǎn)都獲取其他節(jié)點(diǎn)的值。

在使用All-to-All時(shí),每一個(gè)節(jié)點(diǎn)都會(huì)向任意一個(gè)節(jié)點(diǎn)發(fā)送消息,每一個(gè)節(jié)點(diǎn)也都會(huì)接收到任意一個(gè)節(jié)點(diǎn)的消息。每個(gè)節(jié)點(diǎn)的接收緩沖區(qū)和發(fā)送緩沖區(qū)都是一個(gè)分為若干個(gè)數(shù)據(jù)塊的數(shù)組。


All-to-All的具體操作是:將節(jié)點(diǎn)i的發(fā)送緩沖區(qū)中的第j塊數(shù)據(jù)發(fā)送給節(jié)點(diǎn)j。節(jié)點(diǎn)j將接收到的來(lái)自節(jié)點(diǎn)i的數(shù)據(jù)塊,放在自身接收緩沖區(qū)的第i塊位置。

All-to-All與All-Gather相比較,區(qū)別在于:All-Gather操作中,不同節(jié)點(diǎn)向某一節(jié)點(diǎn)收集到的數(shù)據(jù)是完全相同的。而在All-to-All中,不同的節(jié)點(diǎn)向某一節(jié)點(diǎn)收集到的數(shù)據(jù)是不同的。在每個(gè)節(jié)點(diǎn)的發(fā)送緩沖區(qū)中,為每個(gè)節(jié)點(diǎn)都單獨(dú)準(zhǔn)備了一塊數(shù)據(jù)。

上面這個(gè)圖,大家如果學(xué)過(guò)工程數(shù)學(xué)的話,就會(huì)發(fā)現(xiàn),它就是一個(gè)矩陣倒置。或者說(shuō),是Excel里的行列倒轉(zhuǎn)。

All-to-All的核心目標(biāo)是重分布。它不進(jìn)行聚合運(yùn)算,而是專注于在不同節(jié)點(diǎn)間重新分布數(shù)據(jù)塊。

以后小棗君會(huì)給大家介紹, All-to-All 操作在大模型訓(xùn)練中的混合并行策略里至關(guān)重要。例如, 當(dāng)需要從數(shù)據(jù)并行組切換到模型并行組時(shí),All-to-All可以高效地重組數(shù)據(jù)。

Ring-base collective(基于環(huán)的集合)

最后還要提一個(gè)有趣的結(jié)構(gòu)——環(huán)(Ring)。

Ring-base collective是將所有的通信節(jié)點(diǎn)通過(guò)首位相連形成一個(gè)單向環(huán),數(shù)據(jù)在環(huán)上依次傳輸。

傳輸方式有兩種,一種是一次性傳輸全部,還有一種,是對(duì)數(shù)據(jù)進(jìn)行切割,然后分別發(fā)送。


All-Reduce里有一種Ring All-Reduce(環(huán)形全規(guī)約)算法。它是通過(guò)組合Reduce-Scatter和All-Gather兩個(gè)操作來(lái)實(shí)現(xiàn)的。

Ring All-Reduce算法分為兩個(gè)階段:

第一階段,將N個(gè)worker分布在一個(gè)環(huán)上,并且把每個(gè)worker的數(shù)據(jù)分成N份。


對(duì)于第k個(gè)worker,這個(gè)worker會(huì)把第k份數(shù)據(jù)發(fā)給下一個(gè)worker,同時(shí)從前一個(gè)worker收到第k-1份數(shù)據(jù)。


然后,第k個(gè)worker會(huì)把收到的第k-1份數(shù)據(jù)和自己的第k-1份數(shù)據(jù)整合,再將整合的數(shù)據(jù)發(fā)送給下一個(gè)worker。


以此循環(huán)N次之后,每一個(gè)worker都會(huì)包含最終整合結(jié)果的一份。


第二階段,每個(gè)worker將整合好的部分發(fā)送給下一個(gè)worker。worker在收到數(shù)據(jù)之后,更新自身數(shù)據(jù)對(duì)應(yīng)的部分即可。

很顯然,這種環(huán)形算法可以解決傳統(tǒng)All-Reduce中Server節(jié)點(diǎn)的能力瓶頸問(wèn)題。

最后的話

好啦,以上就是常見(jiàn)通信原語(yǔ)的具體工作原理。

AI大模型訓(xùn)練推理任務(wù),是由海量的GPU共同完成的。而這些GPU之間的通信,就是基于上面這些通信原語(yǔ)模型。


下一期,小棗君會(huì)詳細(xì)介紹一下大模型訓(xùn)推任務(wù)中的并行計(jì)算方式,以及這些通信原語(yǔ)究竟是如何運(yùn)用于不同的并行計(jì)算方式中。

敬請(qǐng)關(guān)注!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
玄學(xué)提醒:如果一個(gè)人還在穿著10年前的衣服,只說(shuō)明3個(gè)問(wèn)題

玄學(xué)提醒:如果一個(gè)人還在穿著10年前的衣服,只說(shuō)明3個(gè)問(wèn)題

洞讀君
2026-03-04 14:30:12
蘋果用戶7年不換機(jī),電池崩了后ChatGPT給了個(gè)反常識(shí)解法

蘋果用戶7年不換機(jī),電池崩了后ChatGPT給了個(gè)反常識(shí)解法

硬核玩家2哈
2026-03-26 14:27:05
剛出爐的14個(gè)超好笑的笑話,都是高能爆笑笑話,看一次笑一天,絕對(duì)承包你的今日份的笑點(diǎn)

剛出爐的14個(gè)超好笑的笑話,都是高能爆笑笑話,看一次笑一天,絕對(duì)承包你的今日份的笑點(diǎn)

微法官
2026-03-28 00:02:12
兩性關(guān)系:不管你信不信,女性過(guò)了65歲后,基本都有這7個(gè)現(xiàn)狀

兩性關(guān)系:不管你信不信,女性過(guò)了65歲后,基本都有這7個(gè)現(xiàn)狀

王二哥老搞笑
2026-03-24 09:47:27
500美元顯卡干翻Claude:開(kāi)源ATLAS讓14B模型代碼能

500美元顯卡干翻Claude:開(kāi)源ATLAS讓14B模型代碼能

碼上閑敘
2026-03-27 10:33:15
一代神車,退場(chǎng)了

一代神車,退場(chǎng)了

鳳凰網(wǎng)財(cái)經(jīng)
2026-03-26 19:58:07
張雪峰告別結(jié)束!李陽(yáng)連夜趕來(lái),外媒輪番報(bào)道,花海長(zhǎng)街萬(wàn)人送別

張雪峰告別結(jié)束!李陽(yáng)連夜趕來(lái),外媒輪番報(bào)道,花海長(zhǎng)街萬(wàn)人送別

潮鹿逐夢(mèng)
2026-03-28 11:56:41
鉀是蘋果的8倍,建議中老年人,春天多吃這“高鉀菜”,精神好!

鉀是蘋果的8倍,建議中老年人,春天多吃這“高鉀菜”,精神好!

阿龍美食記
2026-03-26 15:22:03
德黑蘭街頭忽然空了:巴斯基帳篷被遺棄,民兵連夜跑了,為什么?

德黑蘭街頭忽然空了:巴斯基帳篷被遺棄,民兵連夜跑了,為什么?

老馬拉車莫少裝
2026-03-24 22:55:20
臺(tái)當(dāng)局偷偷改了規(guī)矩:若解放軍戰(zhàn)機(jī)飛臨臺(tái)島,臺(tái)灣民眾只有3分鐘

臺(tái)當(dāng)局偷偷改了規(guī)矩:若解放軍戰(zhàn)機(jī)飛臨臺(tái)島,臺(tái)灣民眾只有3分鐘

又是美好的日子
2026-03-26 20:26:28
淺色系穿搭!這個(gè)組合讓你在健身房瞬間吸引眼球!

淺色系穿搭!這個(gè)組合讓你在健身房瞬間吸引眼球!

獨(dú)角showing
2025-12-31 21:08:57
打替補(bǔ)無(wú)法發(fā)揮作用!湖人還是沒(méi)有解決好鋒線大將的使用問(wèn)題?

打替補(bǔ)無(wú)法發(fā)揮作用!湖人還是沒(méi)有解決好鋒線大將的使用問(wèn)題?

稻谷與小麥
2026-03-29 01:56:16
菲總統(tǒng)候選人莫雷諾:如果當(dāng)選,我會(huì)讓菲律賓成為下一個(gè)新加坡!

菲總統(tǒng)候選人莫雷諾:如果當(dāng)選,我會(huì)讓菲律賓成為下一個(gè)新加坡!

小丸說(shuō)故事
2026-03-17 14:23:29
張雪峰遺產(chǎn)紛爭(zhēng)的內(nèi)幕!

張雪峰遺產(chǎn)紛爭(zhēng)的內(nèi)幕!

八卦瘋叔
2026-03-26 11:05:04
恒大牽連,“江蘇最大工頭”被懸賞2500萬(wàn)

恒大牽連,“江蘇最大工頭”被懸賞2500萬(wàn)

料道new
2026-03-29 00:01:27
受賄1.08億余元,上海市奉賢區(qū)委原常委周龍華被判無(wú)期徒刑

受賄1.08億余元,上海市奉賢區(qū)委原常委周龍華被判無(wú)期徒刑

新京報(bào)
2026-03-27 17:12:02
45歲韓國(guó)男星去世,曾誤背吸毒罵名,生前賬號(hào)已清空

45歲韓國(guó)男星去世,曾誤背吸毒罵名,生前賬號(hào)已清空

洞鑒地理
2026-03-28 23:58:30
生死皆是命數(shù)!網(wǎng)友:注定你要活,就會(huì)用各種方式把你拉離危險(xiǎn)

生死皆是命數(shù)!網(wǎng)友:注定你要活,就會(huì)用各種方式把你拉離危險(xiǎn)

夜深愛(ài)雜談
2026-03-26 20:25:44
黑絲誘惑的性商教母,復(fù)出直播了!

黑絲誘惑的性商教母,復(fù)出直播了!

微微熱評(píng)
2026-03-27 00:57:03
生活中有哪些「看似便宜,實(shí)際弄壞很貴」的東西?我先說(shuō)5個(gè)!

生活中有哪些「看似便宜,實(shí)際弄壞很貴」的東西?我先說(shuō)5個(gè)!

Home范
2026-03-27 14:11:20
2026-03-29 02:39:00
鮮棗課堂 incentive-icons
鮮棗課堂
ICT知識(shí)科普。
1011文章數(shù) 1257關(guān)注度
往期回顧 全部

科技要聞

華為盤古大模型負(fù)責(zé)人王云鶴確認(rèn)離職

頭條要聞

伊朗議長(zhǎng):伊朗將加速以軍崩潰

頭條要聞

伊朗議長(zhǎng):伊朗將加速以軍崩潰

體育要聞

“我是全家最差勁的運(yùn)動(dòng)員”

娛樂(lè)要聞

陳牧馳陳冰官宣得子 曬一家三口握拳照

財(cái)經(jīng)要聞

臥底"科技與狠活"培訓(xùn):化工調(diào)味劑泛濫

汽車要聞

置換補(bǔ)貼價(jià)4.28萬(wàn)起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

教育
時(shí)尚
健康
旅游
家居

教育要聞

嚴(yán)絲合縫的教材閱讀法?????

和田曦薇一樣嫩嘟嘟,這3個(gè)變美技巧你一定不能錯(cuò)過(guò)!

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

旅游要聞

泰安市岱岳區(qū):賞梨花 看村晚 萬(wàn)畝梨園迎客來(lái)

家居要聞

曲線華爾茲 現(xiàn)代簡(jiǎn)約

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版