337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

WAIC機(jī)器人大咖圓桌:具身智能的下一個(gè)前沿是什么?

0
分享至

2025 WAIC雖已閉幕,但高價(jià)值的信息還有待分享。其中,由智元機(jī)器人主辦的「智啟具身論壇」上,多位重量級(jí)嘉賓進(jìn)行了一場(chǎng)圓桌對(duì)話,RoboX編譯整理了其中內(nèi)容,供大家參考:

嘉賓陣容:

羅劍嵐(主持人):智元機(jī)器人首席科學(xué)家/具身研究中心主任/上海創(chuàng)智學(xué)院副教授

Sergey Levine:Physical Intelligence(Pl)聯(lián)合創(chuàng)始人/UC Berkeley副教授

Stefan Schaal:Instrinsic (Alphabet)科學(xué)與AI事務(wù)負(fù)責(zé)人

蘇航:清華大學(xué)計(jì)算機(jī)系副研究員/IEEE TPAMI期刊編委

陳曦:亞馬遜應(yīng)用科學(xué)、前沿人工智能與機(jī)器人部門負(fù)責(zé)人

姚卯青:智元機(jī)器人合伙人/具身業(yè)務(wù)部總裁



背景:AI與機(jī)器人的本質(zhì)變化

羅劍嵐:目前,在機(jī)器人技術(shù)獲取大量進(jìn)展的同時(shí),我們也在試圖回答AI領(lǐng)域最深刻的問(wèn)題之一:為什么AI系統(tǒng)能在圍棋等項(xiàng)目中成為世界冠軍,卻不能做三歲小孩能做的事情?

機(jī)器人基礎(chǔ)模型的最新進(jìn)展來(lái)看,我認(rèn)為構(gòu)建一個(gè)計(jì)算大腦,能將計(jì)算轉(zhuǎn)化為物理能力,這也部分回答了這個(gè)問(wèn)題。

同時(shí),我們也看到了一個(gè)趨勢(shì):基礎(chǔ)研究與工業(yè)產(chǎn)品之間的差距正在顯著縮短。例如,谷歌的Gemini項(xiàng)目本質(zhì)上屬于基礎(chǔ)研究,但一旦開(kāi)發(fā)完成,它幾乎可以在第二天就上線,供全球數(shù)十億用戶使用。

那么,第一個(gè)問(wèn)題給Stefan和Sergey——

Stefan,你幾乎將畢生精力奉獻(xiàn)給了機(jī)器人技術(shù),從模仿學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、機(jī)器人運(yùn)動(dòng)到操作,我們?cè)S多人都是閱讀你們的論文長(zhǎng)大的。

Sergey,你于2016年在谷歌建立了第一個(gè)機(jī)器人數(shù)據(jù)采集場(chǎng),那是一個(gè)由七臺(tái)庫(kù)卡機(jī)器人組成的系統(tǒng)。

那么我的問(wèn)題是,在過(guò)去十年間,到底發(fā)生了什么改變,以至于這個(gè)領(lǐng)域受到了空前的關(guān)注度?這一次和你們職業(yè)生涯中看到的其它次有什么不同?

StefanSchaal計(jì)算機(jī)視覺(jué)算法在硬件上的應(yīng)用,是機(jī)器人技術(shù)能夠開(kāi)始感知和觀察周圍世界的起點(diǎn)之一。隨著深度學(xué)習(xí)革命興起,極大地提高了視覺(jué)處理的效率,這也要?dú)w功于二維攝像頭的進(jìn)步。

接著,深度學(xué)習(xí)逐漸應(yīng)用于基礎(chǔ)模型。與此同時(shí),它從一個(gè)被認(rèn)為無(wú)法在大規(guī)模系統(tǒng)中應(yīng)用的技術(shù),發(fā)展到現(xiàn)在已成為可計(jì)算、可實(shí)現(xiàn)的技術(shù)。



SergeyLevine是的,現(xiàn)在的一大變化是,學(xué)術(shù)界對(duì)「規(guī)?!挂约啊缚蓴U(kuò)展學(xué)習(xí)系統(tǒng)」的重要性有了更深刻的認(rèn)識(shí)。

過(guò)去,即使在計(jì)算機(jī)視覺(jué)領(lǐng)域,人們也并未完全認(rèn)識(shí)到規(guī)模和可擴(kuò)展學(xué)習(xí)的重要性。

而在機(jī)器人領(lǐng)域,數(shù)據(jù)難以獲取,實(shí)驗(yàn)難以開(kāi)展,特別是在實(shí)驗(yàn)室環(huán)境中,能擁有一臺(tái)機(jī)器人進(jìn)行研究就已經(jīng)很幸運(yùn)了。

這導(dǎo)致研究人員形成了一種思維模式,即他們必須在小規(guī)模上取得成果,而這種成果往往只是大規(guī)模應(yīng)用的「原型」,本質(zhì)上還是小規(guī)模方法。

在使用機(jī)器學(xué)習(xí)時(shí),很難擺脫這種小規(guī)模模式。如果你在小規(guī)模學(xué)習(xí)上取得成果,并試圖逐漸擴(kuò)大規(guī)模,往往會(huì)遇到問(wèn)題。

而在機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理等領(lǐng)域,我們已經(jīng)學(xué)到了寶貴的一課:大規(guī)模、簡(jiǎn)單且通用的學(xué)習(xí)系統(tǒng),能夠讓我們避開(kāi)許多將小規(guī)模學(xué)習(xí)應(yīng)用到現(xiàn)實(shí)世界時(shí)所面臨的復(fù)雜問(wèn)題。

因此,我認(rèn)為現(xiàn)在的不同之處在于,我們正在思考如何利用來(lái)自多個(gè)機(jī)器人的數(shù)據(jù),如何將這些方法應(yīng)用于不同環(huán)境、不同任務(wù),甚至不同機(jī)器人之間的遷移。我認(rèn)為,在機(jī)器人領(lǐng)域接受可擴(kuò)展學(xué)習(xí)的觀點(diǎn),是使這個(gè)時(shí)代與以往不同的關(guān)鍵因素之一。



從「單一任務(wù)」到「行為集合」

羅劍嵐:我們的科學(xué)研究方式已經(jīng)發(fā)生了根本變化,傳統(tǒng)的小規(guī)模實(shí)驗(yàn)室實(shí)驗(yàn)已不再適用,必須進(jìn)行大規(guī)模研究。那么,這對(duì)機(jī)器人技術(shù)意味著什么?

StefanSchaal:我們突然進(jìn)入了實(shí)證科學(xué)的世界,進(jìn)入了大數(shù)據(jù)時(shí)代。這是首次有機(jī)會(huì)真正將機(jī)器人技術(shù)擴(kuò)展到各個(gè)領(lǐng)域,甚至是更通用的領(lǐng)域。現(xiàn)在,機(jī)器人正在從學(xué)習(xí)「單一任務(wù)」發(fā)展到學(xué)習(xí)「一類任務(wù)」,甚至是完整行為集合。

真正的挑戰(zhàn),在于如何實(shí)現(xiàn)高性能,這是一個(gè)艱巨的任務(wù),也是我一直擔(dān)心的問(wèn)題。如果你想從90%的性能提升到99.9%的性能,可能需要徹底重新思考方法。

這種情況在某些領(lǐng)域已經(jīng)發(fā)生過(guò),也可能在我們身上發(fā)生——我們可能會(huì)在這個(gè)新的數(shù)據(jù)科學(xué)領(lǐng)域找到另一種方法來(lái)解決這個(gè)問(wèn)題,我還不知道答案,但這將非常令人興奮。

SergeyLevine我從大規(guī)模機(jī)器學(xué)習(xí)世界中學(xué)到了一個(gè)有趣教訓(xùn):與其構(gòu)建更復(fù)雜的系統(tǒng),有時(shí)我們應(yīng)該構(gòu)建更簡(jiǎn)單、可擴(kuò)展性更強(qiáng)的系統(tǒng)。

2010年代末到2020年代初的自然語(yǔ)言處理領(lǐng)域,就經(jīng)歷了這樣的變化。當(dāng)時(shí),每個(gè)自然語(yǔ)言處理任務(wù)都是獨(dú)立的領(lǐng)域。然而,最終大型語(yǔ)言模型的出現(xiàn),吸收了許多這些專門技術(shù)。

當(dāng)然,畢竟機(jī)器人與網(wǎng)絡(luò)代理不同,它是一個(gè)高度集成的學(xué)科。但我認(rèn)為,作為機(jī)器人專家,我們必須謹(jǐn)慎思考哪些系統(tǒng)構(gòu)建應(yīng)該簡(jiǎn)化,并通過(guò)大規(guī)模學(xué)習(xí)來(lái)解決。

機(jī)器人技術(shù)確實(shí)需要高度的魯棒性和可靠性,而這很難從更多相同類型的學(xué)習(xí)技術(shù)中獲得。我們也應(yīng)該非常謹(jǐn)慎地思考在哪里增加復(fù)雜性,在哪里強(qiáng)調(diào)簡(jiǎn)單性和規(guī)模。

「沒(méi)什么能比得上真實(shí)數(shù)據(jù)」

羅劍嵐:機(jī)器人技術(shù)需要什么樣的數(shù)據(jù)?數(shù)據(jù)的多樣性和質(zhì)量又該如何考量?

陳曦機(jī)器人技術(shù)與大語(yǔ)言模型、視覺(jué)技術(shù)的關(guān)鍵區(qū)別在于,我們最終需要解決一個(gè)物理系統(tǒng)的問(wèn)題。這意味著我們的數(shù)據(jù)也必須來(lái)自物理系統(tǒng)。當(dāng)然,你可以通過(guò)模擬、人類示范等方式收集一些代理數(shù)據(jù),但最終,沒(méi)有什么能比得上機(jī)器人在實(shí)際環(huán)境中操作并收集數(shù)據(jù)。

這一直是擴(kuò)展機(jī)器人技術(shù)的瓶頸之一,因?yàn)樗诤艽蟪潭壬鲜枪铝⒑退槠摹邪l(fā)項(xiàng)目分布在許多不同的學(xué)術(shù)實(shí)驗(yàn)室中,通常由計(jì)算機(jī)科學(xué)專業(yè)的學(xué)生構(gòu)建系統(tǒng),他們通常不是硬件工程師或?qū)<摇?/p>

然而,在最近這一波對(duì)人工智能和機(jī)器人技術(shù)的興趣和投資浪潮中,許多公司都愿意并有能力進(jìn)行大量投資,這使我們能夠獲得更多可用于運(yùn)行策略和收集數(shù)據(jù)的物理系統(tǒng)。

因此,我對(duì)這個(gè)問(wèn)題的簡(jiǎn)短回答是:你最終需要大量的物理機(jī)器人,以及來(lái)自這些物理機(jī)器人的數(shù)據(jù)。

蘇航:對(duì)于具身人工智能來(lái)說(shuō),我們有時(shí)也會(huì)使用一些模擬數(shù)據(jù),或者使用視頻數(shù)據(jù)來(lái)訓(xùn)練。但我相信,在未來(lái),真實(shí)數(shù)據(jù)將會(huì)變得非常重要,我認(rèn)為我們將會(huì)擁有大量真實(shí)數(shù)據(jù)。

我認(rèn)為,真正的瓶頸在于如何高效地收集數(shù)據(jù)。目前,遠(yuǎn)程操作數(shù)據(jù)的收集效率并不令人滿意。而「機(jī)器人自主收集數(shù)據(jù)的方法」可能會(huì)更加高效,這意味著我們可以擴(kuò)大數(shù)據(jù)收集規(guī)模。

因此,盡管目前自主收集數(shù)據(jù)的方法并不完美,但我相信,在不久的將來(lái),這將成為數(shù)據(jù)注入的一種可能性。只要我們有大量的真實(shí)機(jī)器人,就意味著可以擁有大量數(shù)據(jù)集。

那么,如何利用這些數(shù)據(jù)呢?對(duì)于終身學(xué)習(xí)來(lái)說(shuō),這意味著我們需要一個(gè)閉環(huán)的數(shù)據(jù)重用機(jī)制。這可能是未來(lái)數(shù)據(jù)利用的方向。



羅劍嵐:我們應(yīng)該如何獲取數(shù)據(jù)?真實(shí)數(shù)據(jù)、模擬器還是其他方式?你們?cè)趺纯矗?/p>

Sergey Levine:真實(shí)數(shù)據(jù)非常重要。如果我們看看其他領(lǐng)域,機(jī)器學(xué)習(xí)之所以能在這些領(lǐng)域取得成功,是因?yàn)槲覀兡軌蛴行У乩么笠?guī)模的真實(shí)世界數(shù)據(jù)集。

這并不意味著我們只應(yīng)使用真實(shí)數(shù)據(jù),但的確需要獲取大規(guī)模的機(jī)器人數(shù)據(jù)集,并利用它來(lái)學(xué)習(xí)對(duì)物理交互的通用理解。

一旦我們擁有了一個(gè)對(duì)真實(shí)世界中的物理交互有良好理解的模型,它就能更好地吸收其他來(lái)源的數(shù)據(jù),也就能在機(jī)器人技術(shù)上取得更大進(jìn)步。因此,我認(rèn)為模擬技術(shù)并不是推動(dòng)機(jī)器人技術(shù)發(fā)展的關(guān)鍵,相反,大規(guī)模真實(shí)世界數(shù)據(jù)集可能會(huì)推動(dòng)機(jī)器人理解各種其他類型數(shù)據(jù)的能力。

姚卯青:每種數(shù)據(jù)收集過(guò)程都有其自身的成本。例如,人力成本、存儲(chǔ)成本,數(shù)據(jù)量也與訓(xùn)練模型所需的計(jì)算量相關(guān)。因此,有時(shí)候某種方式收集數(shù)據(jù)可能更便宜,但存儲(chǔ)和消耗數(shù)據(jù)的成本卻更高。

此外,我認(rèn)為從長(zhǎng)遠(yuǎn)來(lái)看,為機(jī)器人技術(shù)收集數(shù)據(jù)花費(fèi)數(shù)百萬(wàn)、數(shù)十億甚至更多資金,我認(rèn)為這并非是不可承受的——Meta的超級(jí)智能實(shí)驗(yàn)室雇傭研究人員的成本就高達(dá)12億美元,這些資金完全可以輕松獲得數(shù)億條軌跡數(shù)據(jù)。

如果這是解鎖人工智能的密碼,我認(rèn)為任何科技巨頭或國(guó)家都不會(huì)猶豫投入這筆資金。最終,問(wèn)題不在于如何獲取數(shù)據(jù),而在于如何從不同應(yīng)用領(lǐng)域和行業(yè)中獲取最具代表性的數(shù)據(jù)。

我非常同意Stefan之前的觀點(diǎn),我們需要大量在現(xiàn)實(shí)世界中工作的ASI系統(tǒng),以獲取最有價(jià)值的數(shù)據(jù),甚至是那些邊緣案例和失敗案例,以幫助我們有效地迭代系統(tǒng)。

因此,當(dāng)我們有數(shù)百萬(wàn)臺(tái)機(jī)器人在現(xiàn)實(shí)世界中部署時(shí),我們的問(wèn)題將不再是如何以低成本獲取數(shù)據(jù),而是如何從數(shù)十億甚至數(shù)萬(wàn)億條軌跡中篩選出最有用的數(shù)據(jù),因?yàn)槲覀儫o(wú)法承擔(dān)存儲(chǔ)和計(jì)算所有數(shù)據(jù)的成本。



通用性 or 專業(yè)化?

羅劍嵐如果我們想構(gòu)建一個(gè)能夠像人類一樣在物理世界中感知、推理和行動(dòng)的機(jī)器,它就必須被放置在現(xiàn)實(shí)世界中,與環(huán)境互動(dòng),并生成大量的互動(dòng)數(shù)據(jù)。

最終,我們將擁有各種異構(gòu)數(shù)據(jù)。我們的問(wèn)題將不再是數(shù)據(jù)量的多少,而是如何處理這些數(shù)據(jù)。

Stefan,你提到過(guò),目前我們既需要性能也需要專業(yè)化。而Sergey則認(rèn)為,我們應(yīng)該將通用性作為首要考慮因素。我對(duì)你們兩位在通用性與專業(yè)化方面的觀點(diǎn)很感興趣。

SergeyLevine顯然,我們需要機(jī)器人能夠在特定的應(yīng)用領(lǐng)域中發(fā)揮作用,這就意味著至少要在一定程度上專門化。但我認(rèn)為,阻礙機(jī)器人在開(kāi)放世界環(huán)境中應(yīng)用的一個(gè)主要因素,是它們處理各種意外情況的能力。

這意味著,機(jī)器人需要具備通用能力。因?yàn)橥ㄓ媚芰Ρ举|(zhì)上能帶來(lái)魯棒性。

要想克服這一障礙,使機(jī)器人在現(xiàn)實(shí)世界環(huán)境中具備常識(shí),這將是一個(gè)巨大的進(jìn)步。一旦達(dá)到這一點(diǎn),我們就可以開(kāi)始在現(xiàn)實(shí)世界中部署機(jī)器人,讓它們積累經(jīng)驗(yàn),并變得越來(lái)越專業(yè)化。

StefanSchaal我認(rèn)為,關(guān)鍵在于你想要機(jī)器人做到什么任務(wù)、多快能夠做到?這些都是不同的路徑。通用性顯然是我們所有人都渴望的,但如果你更關(guān)注工業(yè)任務(wù),那么現(xiàn)在工業(yè)領(lǐng)域越來(lái)越傾向于高混合、低產(chǎn)量的生產(chǎn)模式,這意味著事情變化很快。

當(dāng)事情變化很快時(shí),人們不希望花費(fèi)半小時(shí)、一小時(shí)甚至幾天的時(shí)間來(lái)重新訓(xùn)練模型。因此,你需要快速概括和適應(yīng)基礎(chǔ)模型的方法。

我認(rèn)為,無(wú)論你選擇哪條路徑,都希望能產(chǎn)生數(shù)據(jù),這些數(shù)據(jù)可以用于下一個(gè)機(jī)器人,使其變得更好,更通用。這些只是不同的路徑,取決于你是想在兩年內(nèi)將機(jī)器人交付給客戶,還是還有更多的時(shí)間來(lái)實(shí)現(xiàn)這一目標(biāo)。

產(chǎn)學(xué)研之間的鴻溝

羅劍嵐:在機(jī)器人領(lǐng)域,學(xué)術(shù)界和產(chǎn)業(yè)界之間一直存在差距,這種差距在機(jī)器人領(lǐng)域尤為明顯。

通常在學(xué)術(shù)論文中,你做了一些研究,錄制了視頻上傳,然后就結(jié)束了,你不再關(guān)心之后會(huì)發(fā)生什么。因此,我想問(wèn)問(wèn)你們兩位都有在學(xué)術(shù)界和產(chǎn)業(yè)界都有工作經(jīng)驗(yàn)的嘉賓,如何才能縮短這種差距?

陳曦:首先,機(jī)器人應(yīng)該24小時(shí)不間斷工作——如果你的策略出了問(wèn)題,你就需要回去修復(fù)它。你要對(duì)你的策略、你的模型的質(zhì)量負(fù)責(zé),這樣你也可以體驗(yàn)到你的模型在各種長(zhǎng)尾情況下如何失敗,并研究如何改進(jìn)系統(tǒng)的通用性和魯棒性。

在機(jī)器人領(lǐng)域,仍然有大量的前沿研究需要完成,學(xué)術(shù)界仍然是培養(yǎng)人才和進(jìn)行前沿研究的最佳場(chǎng)所。但與此同時(shí),很多學(xué)術(shù)研究人員并不真正了解我們需要解決的實(shí)際問(wèn)題

因此,我認(rèn)為產(chǎn)業(yè)界有義務(wù)將一些問(wèn)題、一些動(dòng)機(jī)帶回學(xué)術(shù)研究。據(jù)我觀察,很多學(xué)術(shù)研究人員也有動(dòng)力去研究更接近現(xiàn)實(shí)世界的問(wèn)題。因此,我希望在未來(lái)幾年內(nèi),這一差距能夠逐漸縮小。

StefanSchaal要想從原型發(fā)展到真正能用的產(chǎn)品,你可以和合適的人一起努力實(shí)現(xiàn)這種技術(shù)轉(zhuǎn)移,也可以在選擇研究的問(wèn)題設(shè)置時(shí),就選擇一些對(duì)初始性能不太敏感的領(lǐng)域。因?yàn)椋?strong>并非所有領(lǐng)域都像汽車行業(yè)那樣,必須達(dá)到99.999%的完美才能工作,還有其他一些領(lǐng)域?qū)κ「訉捜荨?/strong>

谷歌的Everyday Robots項(xiàng)目中的垃圾分類就是一個(gè)很好的例子——這種工作只需達(dá)到90%以上的準(zhǔn)確率就可以了。

還有一些領(lǐng)域,你可以讓一個(gè)人在那里監(jiān)督幾個(gè)機(jī)器人,然后隨著時(shí)間的推移逐漸提高性能,因?yàn)檫@可能需要一些時(shí)間,并最終需要更多的數(shù)據(jù)。

最大難題:Manipulation

羅劍嵐:我們主要關(guān)注的是導(dǎo)航、移動(dòng)和操作。你們認(rèn)為這三個(gè)領(lǐng)域中,哪一個(gè)目前對(duì)我們來(lái)說(shuō)是最具挑戰(zhàn)性的?我們應(yīng)該如何解決它?

SergeyLevine我認(rèn)為操作是最難的,因?yàn)椴僮餍枰憷斫庖粋€(gè)非常多樣化和復(fù)雜的世界,并與它進(jìn)行物理交互。對(duì)于導(dǎo)航來(lái)說(shuō),我們需要理解一個(gè)復(fù)雜的世界,但我們與它的物理交互通常相對(duì)簡(jiǎn)單。

而對(duì)于移動(dòng)來(lái)說(shuō),雖然是物理交互,但相對(duì)簡(jiǎn)單,因?yàn)檎嬲皇┘恿Φ膶?duì)象只是機(jī)器人本身。

「操作」是真正將所有最困難的挑戰(zhàn)融合在一起的領(lǐng)域。我懷疑,如果我們能找到一個(gè)通用且廣泛適用的機(jī)器人操作解決方案,那么無(wú)論我們想出什么方法來(lái)做到這一點(diǎn),都將為我們解決其他問(wèn)題提供一個(gè)良好的開(kāi)端。

這并不是說(shuō)沒(méi)有人應(yīng)該研究導(dǎo)航或移動(dòng)問(wèn)題:將問(wèn)題領(lǐng)域隔離起來(lái),使其不那么復(fù)雜,不包含那么多困難因素,可以讓我們通過(guò)單獨(dú)解決一個(gè)挑戰(zhàn)來(lái)取得很大進(jìn)展。

StefanSchaal我同意這個(gè)觀點(diǎn)。一切有趣的事情最終都會(huì)融合在一起。因此,我們已經(jīng)對(duì)固定基座的機(jī)械臂進(jìn)行了操作研究。

但我認(rèn)為,我們離真正做好還差得很遠(yuǎn)。

單獨(dú)來(lái)看,移動(dòng)技術(shù)在近年來(lái)已經(jīng)變得相當(dāng)成熟和出色,而導(dǎo)航技術(shù)本身,雖然同時(shí)定位與地圖構(gòu)建(SLAM)已經(jīng)存在很長(zhǎng)時(shí)間了,但在隔離狀態(tài)下進(jìn)行導(dǎo)航,即在充滿感官輸入和不確定性的世界中進(jìn)行導(dǎo)航,就像自動(dòng)駕駛汽車必須解決的問(wèn)題一樣,顯然要困難得多。

但現(xiàn)在,你可以把所有這些技術(shù)融合在一起,應(yīng)用到人形機(jī)器人上,所有這些難題都融合在了一起,你不僅要維持移動(dòng)中的本體穩(wěn)定性,還要在移動(dòng)中進(jìn)行操作。

在這其中,操作仍然是最不成熟的領(lǐng)域。這就是事實(shí),我們必須在這方面取得進(jìn)步。

陳曦:我想提出一些不同的看法:雖然我同意「操作」是這三個(gè)領(lǐng)域中最不成熟的領(lǐng)域,但我認(rèn)為,將操作視為唯一的核心問(wèn)題并不完全正確。(這是對(duì)兩位嘉賓觀點(diǎn)的夸張概括)

因?yàn)?strong>我們有針對(duì)移動(dòng)和導(dǎo)航的很多解決方案,但它們并不共享與操作相同的方法論基礎(chǔ)。比如,我們使用SLAM來(lái)解決導(dǎo)航問(wèn)題,然后使用某種局部實(shí)時(shí)策略來(lái)解決局部移動(dòng)問(wèn)題,然后再用完全不同的方法來(lái)解決操作問(wèn)題。這并沒(méi)有建立起我們對(duì)所追求的物理世界的常識(shí)性理解。

因此,從某種意義上說(shuō),我們還有其他方法可以用來(lái)解決導(dǎo)航和移動(dòng)問(wèn)題。但我們還面臨著一個(gè)更根本的常識(shí)性理解問(wèn)題,這正是我們希望通過(guò)基礎(chǔ)模型來(lái)解決的。



未來(lái)3-5年的前沿方案

羅劍嵐:我認(rèn)為人們現(xiàn)在對(duì)解決機(jī)器人問(wèn)題的不同方法有不同的看法。有人說(shuō)應(yīng)該通過(guò)模擬來(lái)解決,有人說(shuō)應(yīng)該收集數(shù)十億條真實(shí)世界的數(shù)據(jù)軌跡,還有人相信模型的力量。

那么,未來(lái)三到五年內(nèi),機(jī)器人領(lǐng)域的前沿會(huì)是什么?

StefanSchaal我最想回到的一個(gè)話題是持續(xù)學(xué)習(xí)。我們已經(jīng)有了使用較小機(jī)器學(xué)習(xí)模型的持續(xù)學(xué)習(xí)方法,自適應(yīng)控制也是一種可以證明其有效性的方法。但如何將這個(gè)概念應(yīng)用到大型模型和大規(guī)模模型中呢?

我們的機(jī)器人大多數(shù)時(shí)候都在學(xué)習(xí)一些東西,然后執(zhí)行任務(wù)、評(píng)估效果,然后再開(kāi)始學(xué)習(xí)。我們?nèi)匀粨?dān)心如何不斷添加數(shù)據(jù)而不破壞系統(tǒng),不讓系統(tǒng)失控或做出糟糕的事情。

姚卯青:我同意這個(gè)觀點(diǎn)。我認(rèn)為下一個(gè)前沿可能是從反饋中學(xué)習(xí)。目前,我們的學(xué)習(xí)策略是先有硬件,然后訓(xùn)練策略。而在未來(lái),我們可能會(huì)先有一個(gè)策略,然后通過(guò)與環(huán)境交互來(lái)不斷對(duì)其改進(jìn),同時(shí)從反饋中學(xué)習(xí)。目前,我認(rèn)為對(duì)于強(qiáng)化學(xué)習(xí)來(lái)說(shuō),效率可能并不是非常理想。因此,如何最好地利用反饋將是下一個(gè)前沿。

SergeyLevine也許我可以補(bǔ)充一下。我認(rèn)為在接下來(lái)的幾年里,我們還沒(méi)有從根本上驗(yàn)證在具身智能領(lǐng)域中擴(kuò)展法則的所有假設(shè),問(wèn)題是我們還沒(méi)有足夠的數(shù)據(jù)量來(lái)與語(yǔ)言領(lǐng)域相媲美。

在接下來(lái)的幾年里,我們可能仍需要堅(jiān)持這種推斷,看看我們會(huì)達(dá)到什么瓶頸。

而且,與語(yǔ)言領(lǐng)域不同的是,機(jī)器人處理的是離散化的符號(hào)標(biāo)記或表示,但現(xiàn)實(shí)世界是連續(xù)的,更加復(fù)雜的,我們與世界有各種各樣的交互。我認(rèn)為這些都是我們想要征服的真實(shí)前沿。

陳曦:我認(rèn)為,越來(lái)越重要的問(wèn)題將是如何使用機(jī)器人自主收集的數(shù)據(jù),即使這些數(shù)據(jù)可能并不完美。

因?yàn)槲覀冋陂_(kāi)發(fā)能夠?qū)C(jī)器人帶出實(shí)驗(yàn)室,并進(jìn)入現(xiàn)實(shí)世界的技術(shù)。一旦某樣?xùn)|西變得有用,人們就會(huì)大量制造它,就像汽車行業(yè)的案例。

如果我們能有成千上萬(wàn)甚至數(shù)百萬(wàn)臺(tái)機(jī)器人時(shí),那么最重要的就是如何利用它們自然收集的經(jīng)驗(yàn)來(lái)改進(jìn)它們。這些經(jīng)驗(yàn)可能不如遠(yuǎn)程操作數(shù)據(jù)那么高質(zhì)量,我們也無(wú)法像控制模擬器那樣緊密地控制它們。但這將是這些系統(tǒng)獲取大量額外知識(shí)的重要來(lái)源,我們必須想辦法利用它們。

對(duì)青年人才的建議

羅劍嵐:今天在座的有很多學(xué)生和研究人員,其中很多人在過(guò)去兩年內(nèi)進(jìn)入了這個(gè)領(lǐng)域。你們對(duì)年輕研究人員和學(xué)生有什么建議?對(duì)于未來(lái)的前沿領(lǐng)域,你們最興奮的是什么?

陳曦:我最興奮的是看到更多機(jī)器人執(zhí)行有用的任務(wù)。

雖然我們沒(méi)有互聯(lián)網(wǎng)這樣的數(shù)據(jù)源,但我們有一個(gè)不同的機(jī)會(huì)——我們可以從一開(kāi)始就構(gòu)建對(duì)機(jī)器人預(yù)訓(xùn)練更有用的數(shù)據(jù)。

如果在座的學(xué)生和研究人員,嘗試用機(jī)器人解決大量有用的問(wèn)題,那么我們就能獲得非常有用和有趣的數(shù)據(jù)。我們有機(jī)會(huì)從頭開(kāi)始構(gòu)建一個(gè)非常有價(jià)值的數(shù)據(jù)集,而不需要(像互聯(lián)網(wǎng)數(shù)據(jù)那樣)從大量垃圾中篩選出有用的信息。

StefanSchaal我們?cè)噲D進(jìn)入物理人工智能領(lǐng)域。因此,我的建議是學(xué)習(xí)物理學(xué)、人工智能和機(jī)器學(xué)習(xí)。同時(shí),你還需要學(xué)習(xí)大數(shù)據(jù)科學(xué),因?yàn)楝F(xiàn)在這些都緊密相連。為了實(shí)現(xiàn)物理人工智能,我們需要具備所有這些領(lǐng)域知識(shí)的人才。

SergeyLevine我認(rèn)為在選擇研究課題時(shí),要仔細(xì)思考這個(gè)問(wèn)題是否僅僅是為了解決便利性問(wèn)題,還是有可能解決一些根本性問(wèn)題。

由于我們必須在一定程度上保持實(shí)用性,我們往往會(huì)陷入一些較小的思維模式中。例如,考慮如何解決實(shí)驗(yàn)室中只有一臺(tái)機(jī)器人、數(shù)據(jù)昂貴或計(jì)算昂貴時(shí)遇到的特定挑戰(zhàn)。

有些研究根本問(wèn)題的工作,最初看起來(lái)可能并不實(shí)用,但在長(zhǎng)期內(nèi),在規(guī)模更大、資源更多的情況下,它們可能會(huì)變得非常重要。

保羅·克里斯蒂亞諾關(guān)于基于人類偏好的深度強(qiáng)化學(xué)習(xí)的工作就是一個(gè)例子:當(dāng)這項(xiàng)工作完成時(shí),他通過(guò)在一個(gè)小型模擬跳躍器上實(shí)現(xiàn)后空翻來(lái)測(cè)試它,這看起來(lái)似乎讓深度強(qiáng)化學(xué)習(xí)變得更加不實(shí)用,因?yàn)樗枰说膮⑴c來(lái)提供偏好。但多年后,這成為了基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)的基礎(chǔ),現(xiàn)在我們經(jīng)常用它來(lái)微調(diào)大型語(yǔ)言模型。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
遲先生哭了,陳麗華追悼會(huì)現(xiàn)場(chǎng),兒子兒媳接待眾人,孫子罕見(jiàn)露面

遲先生哭了,陳麗華追悼會(huì)現(xiàn)場(chǎng),兒子兒媳接待眾人,孫子罕見(jiàn)露面

TVB的四小花
2026-04-10 16:39:06
腦梗最怕的三種維生素,不妨了解!

腦梗最怕的三種維生素,不妨了解!

藥師方健
2026-04-10 22:05:32
烏克蘭開(kāi)始收復(fù)失土,即將進(jìn)行大反攻?俄軍為何打不過(guò)烏軍?

烏克蘭開(kāi)始收復(fù)失土,即將進(jìn)行大反攻?俄軍為何打不過(guò)烏軍?

番外行
2026-04-02 08:52:59
醫(yī)生發(fā)現(xiàn):能活到80歲的糖尿病患者,大多在60歲,就不做這幾事了

醫(yī)生發(fā)現(xiàn):能活到80歲的糖尿病患者,大多在60歲,就不做這幾事了

健康之光
2026-04-10 20:20:09
湯姆·哈迪帶老婆海灘放風(fēng)!穿“毒液短褲”裸上身,身材明顯發(fā)福

湯姆·哈迪帶老婆海灘放風(fēng)!穿“毒液短褲”裸上身,身材明顯發(fā)福

星野娛樂(lè)天地
2026-04-09 21:35:10
南京一中剛剛傳來(lái)喜報(bào)!

南京一中剛剛傳來(lái)喜報(bào)!

南京擇校
2026-04-10 20:46:04
伊朗搶通遭美以襲擊鐵路橋 僅用三天修復(fù)通車

伊朗搶通遭美以襲擊鐵路橋 僅用三天修復(fù)通車

新華社
2026-04-10 21:50:23
CBA最新排名大調(diào)整,上海已經(jīng)無(wú)敵,廣東重大隱患,遼籃沒(méi)機(jī)會(huì)

CBA最新排名大調(diào)整,上海已經(jīng)無(wú)敵,廣東重大隱患,遼籃沒(méi)機(jī)會(huì)

宗介說(shuō)體育
2026-04-10 10:20:01
鄭麗文身邊女保鏢太吸睛!眼神凌厲,氣場(chǎng)全開(kāi),身高格外搶眼

鄭麗文身邊女保鏢太吸睛!眼神凌厲,氣場(chǎng)全開(kāi),身高格外搶眼

TVB的四小花
2026-04-09 17:17:13
北京足協(xié):對(duì)中青賽U10組涉假球兩隊(duì)主帥進(jìn)行市內(nèi)永久禁足處罰

北京足協(xié):對(duì)中青賽U10組涉假球兩隊(duì)主帥進(jìn)行市內(nèi)永久禁足處罰

懂球帝
2026-04-10 13:02:58
章若楠的臉,看著人畜無(wú)害,實(shí)際上承載的東西太重了。

章若楠的臉,看著人畜無(wú)害,實(shí)際上承載的東西太重了。

小光侃娛樂(lè)
2026-04-10 17:05:03
巴薩舊將談負(fù)馬競(jìng):少打一人不是問(wèn)題,問(wèn)題是我們?cè)诤?5個(gè)人較量

巴薩舊將談負(fù)馬競(jìng):少打一人不是問(wèn)題,問(wèn)題是我們?cè)诤?5個(gè)人較量

蘭亭墨未干
2026-04-10 17:06:04
蔚來(lái)ES9開(kāi)啟預(yù)售,電池租用方案預(yù)售價(jià)42 萬(wàn)元起

蔚來(lái)ES9開(kāi)啟預(yù)售,電池租用方案預(yù)售價(jià)42 萬(wàn)元起

北京商報(bào)
2026-04-09 21:57:09
李鎮(zhèn)浩腦溢血栽進(jìn)ICU:1周前剛被曝酒駕,7000萬(wàn)債務(wù)還沒(méi)還

李鎮(zhèn)浩腦溢血栽進(jìn)ICU:1周前剛被曝酒駕,7000萬(wàn)債務(wù)還沒(méi)還

追星雷達(dá)站
2026-04-09 15:31:02
2.4萬(wàn)億!30萬(wàn)家庭!爛尾2年恒大仍沒(méi)完,狂徒許家印終于自尋死路

2.4萬(wàn)億!30萬(wàn)家庭!爛尾2年恒大仍沒(méi)完,狂徒許家印終于自尋死路

歷史偉人錄
2026-04-10 18:07:28
11萬(wàn)里程換來(lái)的大牌護(hù)膚品是假貨,南航客服要求消費(fèi)者先刪貼

11萬(wàn)里程換來(lái)的大牌護(hù)膚品是假貨,南航客服要求消費(fèi)者先刪貼

DoNews
2026-04-09 14:09:33
妻子浪漫旅行最尷尬的夫妻,話少還裝甜蜜,沒(méi)李純馬頔自然

妻子浪漫旅行最尷尬的夫妻,話少還裝甜蜜,沒(méi)李純馬頔自然

一盅情懷
2026-04-10 17:02:09
三拒絕結(jié)果出爐!杜新枝熊磊喜迎勝利,法院駁回許敏全部訴求

三拒絕結(jié)果出爐!杜新枝熊磊喜迎勝利,法院駁回許敏全部訴求

蕭狡科普解說(shuō)
2026-04-10 17:51:36
大選倒計(jì)時(shí)民調(diào)不樂(lè)觀,特朗普喊話匈牙利選民:出門投票給歐爾班

大選倒計(jì)時(shí)民調(diào)不樂(lè)觀,特朗普喊話匈牙利選民:出門投票給歐爾班

狗子的愛(ài)好
2026-04-10 15:43:14
香蕉被點(diǎn)名!醫(yī)生提醒:高血糖患者常吃香蕉,很快或迎來(lái)這些后果

香蕉被點(diǎn)名!醫(yī)生提醒:高血糖患者常吃香蕉,很快或迎來(lái)這些后果

白話電影院
2026-04-07 20:07:56
2026-04-10 22:43:00
RoboX
RoboX
關(guān)注智能汽車、機(jī)器人在內(nèi)的具身智能前沿科技
237文章數(shù) 2關(guān)注度
往期回顧 全部

科技要聞

馬斯克狂發(fā)大火箭也養(yǎng)不起AI 年虧50億美元

頭條要聞

與內(nèi)塔尼亞胡通話后 特朗普改口了

頭條要聞

與內(nèi)塔尼亞胡通話后 特朗普改口了

體育要聞

17歲賺了一百萬(wàn)美元,25歲被CBA裁員

娛樂(lè)要聞

黃景瑜王玉雯否認(rèn)戀情!聚會(huì)細(xì)節(jié)被扒

財(cái)經(jīng)要聞

李強(qiáng)主持召開(kāi)經(jīng)濟(jì)形勢(shì)專家和企業(yè)家座談會(huì)

汽車要聞

搭載第二代刀片電池及閃充技術(shù) 騰勢(shì)N8L閃充版預(yù)售35萬(wàn)起

態(tài)度原創(chuàng)

健康
數(shù)碼
游戲
公開(kāi)課
軍事航空

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

數(shù)碼要聞

山靈SM1.3R流媒體數(shù)播解碼一體機(jī)開(kāi)售預(yù)約,售價(jià)8998

數(shù)毛社點(diǎn)評(píng)批評(píng)XSS!《紅色沙漠》畫面糊成渣

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:對(duì)美國(guó)與伊朗達(dá)成和平協(xié)議“非常樂(lè)觀”

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版