337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

讓機(jī)器人學(xué)會(huì)手往哪兒伸、怎么操作,東大團(tuán)隊(duì)給了新解法

0
分享至



本文的第一作者為東南大學(xué)碩士生莊啟源,合作者為徐赫洋、汪宜俊、趙欣陽、李洋洋。通訊作者為東南大學(xué)青年首席教授魏秀參,研究方向?yàn)橛?jì)算機(jī)視覺、機(jī)器學(xué)習(xí)與機(jī)器人。

在具身智能領(lǐng)域,可供性(affordance)預(yù)測(cè) —— 即讓機(jī)器人從視覺觀測(cè)中理解 "在哪里操作"(接觸點(diǎn))與 "如何操作"(動(dòng)作方向)—— 是實(shí)現(xiàn)精細(xì)化機(jī)器人操作的基礎(chǔ)之一。精細(xì)操作要求機(jī)器人不僅能定位到物體的可交互區(qū)域,更要掌握接觸后的準(zhǔn)確運(yùn)動(dòng)方向,例如判斷抽屜把手的精確拉動(dòng)方向完成開合。

當(dāng)前主流方法主要分為兩大范式:基于檢索的方法無需大量機(jī)器人數(shù)據(jù),卻受限于單一匹配的脆弱性與未見類別的覆蓋盲區(qū);基于訓(xùn)練的大規(guī)模模型雖能學(xué)習(xí)可遷移視覺模式,卻頻繁出現(xiàn)接觸點(diǎn)定位不準(zhǔn)、動(dòng)作方向預(yù)測(cè)錯(cuò)誤的問題,難以支撐精細(xì)操作所需的空間精度。

為突破這一瓶頸,東南大學(xué)魏秀參團(tuán)隊(duì)提出了 RAAP(檢索增強(qiáng)型可供性預(yù)測(cè))。RAAP 將 affordance 分解為靜態(tài)接觸點(diǎn)與動(dòng)態(tài)動(dòng)作方向兩個(gè)分量并針對(duì)二者設(shè)計(jì)互補(bǔ)推理機(jī)制:接觸點(diǎn)通過與 Top-1 檢索參考的稠密特征匹配可靠遷移;動(dòng)作方向則由全新的檢索增強(qiáng)對(duì)齊模型負(fù)責(zé),通過聚合多個(gè)參考樣本與雙權(quán)重注意力機(jī)制為精細(xì)操作提供可靠運(yùn)動(dòng)指引。整個(gè)框架每任務(wù)僅需數(shù)十個(gè)訓(xùn)練樣本,即可實(shí)現(xiàn)跨類別的零樣本精細(xì)機(jī)器人操作。

目前,該論文已被機(jī)器人領(lǐng)域頂級(jí)會(huì)議 IEEE International Conference on Robotics & Automation (ICRA 2026) 接收。



  • 論文標(biāo)題: RAAP: Retrieval-Augmented Affordance Prediction with Cross-Image Action Alignment
  • 論文鏈接:https://arxiv.org/abs/2603.29419
  • 項(xiàng)目主頁:https://github.com/SEU-VIPGroup/RAAP

RAAP:解耦靜態(tài)與動(dòng)態(tài)可供性的統(tǒng)一框架

RAAP 的核心設(shè)計(jì)思路是:靜態(tài)接觸點(diǎn)與動(dòng)態(tài)動(dòng)作方向雖同屬 affordance,但在預(yù)測(cè)難度和所需信息上有本質(zhì)區(qū)別,已有工作將二者作為可聯(lián)合遷移的屬性統(tǒng)一處理,往往顧此失彼。RAAP 明確將兩者解耦,分別采用最適合各自特性的推理機(jī)制。



檢索與靜態(tài) Affordance 遷移

RAAP 從 DROID 和 HOI4D 數(shù)據(jù)集構(gòu)建視覺 affordance 記憶庫(kù),存儲(chǔ)分割后的物體圖像、CLIP 特征、任務(wù)標(biāo)簽以及標(biāo)注的 2D 接觸點(diǎn)與歸一化動(dòng)作方向向量,供推理時(shí)檢索調(diào)用。給定查詢場(chǎng)景,RAAP 首先通過 CLIP 文本與圖像編碼器從記憶庫(kù)中檢索 Top-K 個(gè)語義和視覺上最相關(guān)的參考樣本。對(duì)于接觸點(diǎn)定位,系統(tǒng)取 Top-1 參考,基于 Stable Diffusion 稠密特征進(jìn)行像素級(jí)匹配,將參考接觸點(diǎn)遷移至查詢圖像的對(duì)應(yīng)位置。這一策略在前人工作中已得到充分驗(yàn)證。

動(dòng)態(tài) Affordance 預(yù)測(cè):檢索增強(qiáng)跨圖像動(dòng)作對(duì)齊

動(dòng)作方向的預(yù)測(cè)是 RAAP 的核心創(chuàng)新所在。不同于接觸點(diǎn)的幾何對(duì)應(yīng)性,動(dòng)作方向高度依賴任務(wù)語義與操作意圖,單一檢索樣本極易因匹配偏差引發(fā)全局性方向錯(cuò)誤。為此,RAAP 引入了一個(gè)檢索增強(qiáng)的跨圖像動(dòng)作對(duì)齊模塊,通過聚合 Top-K 個(gè)參考樣本的方向先驗(yàn)來降低預(yù)測(cè)歧義。

具體而言,查詢圖像與各參考圖像共享 SigLIP-2 骨干網(wǎng)絡(luò)提取 patch 級(jí)特征。對(duì)于每個(gè)參考樣本,其標(biāo)注的動(dòng)作向量經(jīng) FiLM 調(diào)制作用于視覺特征,使外觀與操作意圖聯(lián)合編碼;隨后多個(gè)參考特征拼接為統(tǒng)一的 Key-Value 矩陣,以查詢特征為 Query 經(jīng)跨注意力機(jī)制融合多參考方向線索,再通過 Transformer 編碼器回歸出預(yù)測(cè)動(dòng)作方向。

為應(yīng)對(duì)檢索樣本質(zhì)量參差不齊的問題,RAAP 進(jìn)一步設(shè)計(jì)了雙權(quán)重注意力機(jī)制:以檢索階段的 CLIP 余弦相似度作為外觀先驗(yàn)權(quán)重,以輕量門控網(wǎng)絡(luò)輸出的語義相關(guān)性作為補(bǔ)充權(quán)重,二者歸一化融合后對(duì)參考樣本加權(quán) —— 外觀權(quán)重拉近視覺相似者,語義門控權(quán)重抑制語義錯(cuò)位的噪聲參考,共同保障多參考聚合的質(zhì)量。



2D 到 3D 的 Affordance 提升與執(zhí)行

預(yù)測(cè)得到的 2D affordance 經(jīng)由相機(jī)內(nèi)參與深度點(diǎn)云提升至 3D 空間。抓取后,2D 動(dòng)作方向結(jié)合局部表面法向變換為 3D 位移向量,真實(shí)環(huán)境中采用笛卡爾阻抗控制執(zhí)行接觸后動(dòng)作,保證柔順安全的交互,最終支撐從接觸定位到運(yùn)動(dòng)執(zhí)行的全流程精細(xì)操作。

實(shí)驗(yàn)結(jié)果與分析

研究團(tuán)隊(duì)在 DROID 和 HOI4D 數(shù)據(jù)集以及真實(shí) Franka 機(jī)械臂平臺(tái)上進(jìn)行了全面評(píng)估,與 RAM(單參考檢索遷移框架)和 A0(大規(guī)模可供性預(yù)測(cè)模型)展開系統(tǒng)對(duì)比。



動(dòng)態(tài)可供性預(yù)測(cè)

以均值角誤差(MAE,越低越好)評(píng)估動(dòng)作方向預(yù)測(cè)精度。RAAP(K=3)以 32.55° 的整體平均誤差取得最優(yōu),相比其他方法降低超過 50%。優(yōu)勢(shì)在開 / 關(guān)類任務(wù)上尤為顯著 ——RAM 的單樣本遷移和 A0 在方向預(yù)測(cè)上均頻繁出現(xiàn)全局性偏差,而 RAAP 通過多參考聚合有效消解了方向歧義。值得注意的是,DROID 子集平均每任務(wù)僅約 18 個(gè)訓(xùn)練樣本,充分體現(xiàn)了 RAAP 在極低數(shù)據(jù)代價(jià)下的競(jìng)爭(zhēng)力。



消融實(shí)驗(yàn)證實(shí)了雙權(quán)重機(jī)制的必要性:去掉門控權(quán)重或相似度權(quán)重均導(dǎo)致明顯性能下降,退化為均勻加權(quán)同樣不及完整模型,說明兩種權(quán)重信號(hào)功能互補(bǔ)、缺一不可。檢索數(shù)量 K 的實(shí)驗(yàn)表明 K=3 為最優(yōu)選擇:過少時(shí)模型易受單次檢索錯(cuò)誤影響,過多時(shí)噪聲參考開始拖累精度。



真實(shí)世界機(jī)械臂實(shí)驗(yàn)

研究團(tuán)隊(duì)在 Franka Research 3 機(jī)械臂上測(cè)試了未見物體泛化(任務(wù)相同,物體實(shí)例不同)與跨類別泛化(訓(xùn)練于開 / 關(guān)微波爐,測(cè)試于開 / 關(guān)柜子等新類別)兩類場(chǎng)景,每任務(wù)隨機(jī)位置下進(jìn)行 20 次試驗(yàn)。所有模型僅在 DROID 和 HOI4D 子集上訓(xùn)練,不使用任何真實(shí)世界演示數(shù)據(jù)。

RAAP 在未見物體場(chǎng)景下于開 / 關(guān)抽屜任務(wù)上超過 RAM 達(dá) 15 至 25 個(gè)百分點(diǎn),在所有拾取任務(wù)中同樣取得最高成功率。跨類別場(chǎng)景中,RAAP 在關(guān)柜子任務(wù)上達(dá)到 100% 成功率,在其余任務(wù)上持續(xù)領(lǐng)先。



總結(jié)

RAAP 為精細(xì)機(jī)器人操作中的可供性泛化提供了一種將檢索與對(duì)齊學(xué)習(xí)統(tǒng)一的解耦框架。其核心貢獻(xiàn)在于:

  • 提出 RAAP,統(tǒng)一檢索與訓(xùn)練范式,在數(shù)據(jù)稀缺下實(shí)現(xiàn)泛化,每任務(wù)僅需少量訓(xùn)練樣本即可達(dá)到強(qiáng)性能,為精細(xì)操作場(chǎng)景下的低成本部署提供了可行路徑。
  • 設(shè)計(jì)檢索增強(qiáng)對(duì)齊模型,通過雙權(quán)重注意力聚合多個(gè)參考,同時(shí)對(duì)靜態(tài)與動(dòng)態(tài) affordance 采用互補(bǔ)機(jī)制。
  • 在 DROID、HOI4D 及真實(shí)平臺(tái)上的全面評(píng)估,證明 RAAP 在未見物體和跨類別泛化場(chǎng)景下均優(yōu)于基線,并在仿真與真實(shí)環(huán)境中驗(yàn)證了零樣本精細(xì)機(jī)器人操作能力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
萬科史詩級(jí)清算!9 大高管全軍覆沒,連退休 8 年的王石都跑不掉

萬科史詩級(jí)清算!9 大高管全軍覆沒,連退休 8 年的王石都跑不掉

宏哥談商道
2026-04-06 19:00:06
白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
歐洲足壇僅剩“獨(dú)苗”!拜仁與葡萄牙體育,誰能書寫三冠王奇跡?

歐洲足壇僅剩“獨(dú)苗”!拜仁與葡萄牙體育,誰能書寫三冠王奇跡?

田先生籃球
2026-04-08 15:45:12
不拆家還能下蛋,年輕人被一只母雞治好了精神內(nèi)耗

不拆家還能下蛋,年輕人被一只母雞治好了精神內(nèi)耗

酷玩實(shí)驗(yàn)室
2026-04-07 16:52:15
停火兩周!霍爾木茲海峽將重新開放,油價(jià)直線跳水!PC大跌400,ABS跌300,PP PE集體跳水!

停火兩周!霍爾木茲海峽將重新開放,油價(jià)直線跳水!PC大跌400,ABS跌300,PP PE集體跳水!

新浪財(cái)經(jīng)
2026-04-09 15:09:40
德國(guó)乒協(xié)發(fā)文炮轟國(guó)際乒聯(lián)!字字不提劉國(guó)梁,句句戳劉國(guó)梁心窩

德國(guó)乒協(xié)發(fā)文炮轟國(guó)際乒聯(lián)!字字不提劉國(guó)梁,句句戳劉國(guó)梁心窩

八斗小先生
2026-04-09 15:29:19
豐田接送,別克開道!大陸對(duì)鄭麗文的接待規(guī)格,說到做到

豐田接送,別克開道!大陸對(duì)鄭麗文的接待規(guī)格,說到做到

青輝
2026-04-08 16:32:15
漢密爾頓和金卡正式官宣戀情!外媒曬出兩人10年前舊照早有端倪

漢密爾頓和金卡正式官宣戀情!外媒曬出兩人10年前舊照早有端倪

Emily說個(gè)球
2026-04-07 19:06:06
被我國(guó)淘汰的交通工具,如今火遍東南亞,這么方便中國(guó)人為何不用

被我國(guó)淘汰的交通工具,如今火遍東南亞,這么方便中國(guó)人為何不用

浮光驚掠影
2026-04-09 09:46:16
以軍稱伊朗“圣城旅”特種作戰(zhàn)部隊(duì)指揮官身亡

以軍稱伊朗“圣城旅”特種作戰(zhàn)部隊(duì)指揮官身亡

新京報(bào)
2026-04-07 07:11:04
78年前的老報(bào)紙,以色列建國(guó)時(shí),人民日?qǐng)?bào)是這樣報(bào)道的

78年前的老報(bào)紙,以色列建國(guó)時(shí),人民日?qǐng)?bào)是這樣報(bào)道的

夢(mèng)在深巷aqa
2026-03-17 13:52:26
韓國(guó)電視臺(tái)報(bào)道:破防了!餐館里九成的泡菜,竟全是中國(guó)山東造的

韓國(guó)電視臺(tái)報(bào)道:破防了!餐館里九成的泡菜,竟全是中國(guó)山東造的

潮鹿逐夢(mèng)
2026-04-08 16:19:31
啥?韓國(guó)人為了吃地瓜條專門來中國(guó)?

啥?韓國(guó)人為了吃地瓜條專門來中國(guó)?

新民周刊
2026-04-08 14:10:40
美伊停火以色列狂飆:多線建“緩沖區(qū)”,戰(zhàn)略轉(zhuǎn)向半永久戰(zhàn)爭(zhēng)

美伊停火以色列狂飆:多線建“緩沖區(qū)”,戰(zhàn)略轉(zhuǎn)向半永久戰(zhàn)爭(zhēng)

金十?dāng)?shù)據(jù)
2026-04-09 14:52:16
3500億!鄭麗文獲勝,盧秀燕宴席,徹底劃清界限

3500億!鄭麗文獲勝,盧秀燕宴席,徹底劃清界限

可樂愛微笑
2026-03-07 00:47:11
楊麗萍“御用男舞伴”跳樓自殺,跳得決絕,和楊麗萍感情不一般

楊麗萍“御用男舞伴”跳樓自殺,跳得決絕,和楊麗萍感情不一般

風(fēng)月得自難尋
2026-04-03 07:30:33
貝克漢姆與羅納爾多球場(chǎng)重逢,大笑搭肩合影,網(wǎng)友:差點(diǎn)沒認(rèn)出胖羅

貝克漢姆與羅納爾多球場(chǎng)重逢,大笑搭肩合影,網(wǎng)友:差點(diǎn)沒認(rèn)出胖羅

喜歡歷史的阿繁
2026-04-09 15:19:27
為何女人偷情第一次私會(huì)就會(huì)發(fā)生關(guān)系同房呢?

為何女人偷情第一次私會(huì)就會(huì)發(fā)生關(guān)系同房呢?

思絮
2026-04-09 15:33:24
相當(dāng)炸裂 !女子孕期老公出軌超20人,離婚后孩子,被前夫家搶走

相當(dāng)炸裂 !女子孕期老公出軌超20人,離婚后孩子,被前夫家搶走

川渝視覺
2026-04-09 15:33:16
中聯(lián)部領(lǐng)導(dǎo)調(diào)整!他晉升副部

中聯(lián)部領(lǐng)導(dǎo)調(diào)整!他晉升副部

上觀新聞
2026-04-09 11:20:30
2026-04-09 16:15:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12719文章數(shù) 142621關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

白宮發(fā)言人:特朗普直接把伊朗停戰(zhàn)條款扔進(jìn)了垃圾桶

頭條要聞

白宮發(fā)言人:特朗普直接把伊朗停戰(zhàn)條款扔進(jìn)了垃圾桶

體育要聞

8萬人面前心臟驟停 現(xiàn)在他還站在球場(chǎng)上

娛樂要聞

金莎官宣結(jié)婚 與老公孫丞瀟相差18歲

財(cái)經(jīng)要聞

談判基礎(chǔ)已被破壞!霍爾木茲海峽關(guān)閉

汽車要聞

合資3.0革命性重構(gòu),文飛與神行者背水一戰(zhàn)

態(tài)度原創(chuàng)

教育
本地
手機(jī)
親子
公開課

教育要聞

一大早,南京一班主任連發(fā)三條信息:因天氣原因體育中考延期

本地新聞

建水Color Walk | 古城慢調(diào),掉進(jìn)春天的調(diào)色盤里

手機(jī)要聞

摩托羅拉Edge 70 Pro手機(jī)曝光:6500mAh電池配90W快充

親子要聞

誰能拒絕一只軟乎乎的小羊包啊

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版