337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

模仿學習如何賦能靈巧操作?這有一份「2021-2025」全景技術圖譜

0
分享至



作者團隊涵蓋天津大學、山東大學、KTH、ETH、MIT、南方科技大學、北京通用人工智能研究院和中科院自動化所等機構,在機器人學習、靈巧操作、多模態(tài)感知等方向具有持續(xù)研究積累。

靈巧操作(Dexterous Manipulation)要求機器人通過多指末端執(zhí)行器完成抓取、旋擰、插拔等精細任務,其核心挑戰(zhàn)在于高維動作空間、復雜接觸動力學與實時力控的耦合。傳統(tǒng)模型依賴方法難以泛化至未見過物體與場景,而純強化學習又面臨樣本效率低、獎勵設計難等瓶頸。

與強化學習通過試錯優(yōu)化獎勵信號不同,模仿學習(Imitation Learning, IL)通過直接從人類示范中捕獲細粒度協(xié)調行為,避免顯式建模復雜接觸動力學與設計稀疏獎勵函數(shù),為靈巧操作提供了一條數(shù)據(jù)驅動的新路徑。

然而,該領域研究長期分散于不同數(shù)據(jù)范式、算法框架與硬件平臺,缺乏系統(tǒng)性整合。近期,來自天津大學、山東大學、KTH、ETH、MIT、上海交通大學、南方科技大學、北京通用人工智能研究院和中科院自動化所的綜述論文《Dexterous Manipulation through Imitation Learning: A Survey》首次對這一方向進行了全景式梳理,涵蓋 2021–2025 年關鍵進展,旨在為研究人員提供模仿學習靈巧操作領域的全面視角。



  • 論文標題:Dexterous Manipulation Through Imitation Learning: A Survey
  • 論文鏈接:https://ieeexplore.ieee.org/document/11305224/

該綜述指出,模仿學習的核心價值在于避免顯式建模與大規(guī)模試錯,直接利用人類示范數(shù)據(jù)學習策略。但其有效應用依賴高質量數(shù)據(jù)、適配算法、可靠硬件與標準化評估的協(xié)同。

理論支撐

從認知科學到優(yōu)化理論的跨學科根基

模仿學習在靈巧操作中的有效性并非經驗巧合,而是植根于多層級理論體系。在認知層面,Bandura 的社會學習理論為「觀察 - 模仿」范式提供了行為學依據(jù),而靈長類鏡像神經元的發(fā)現(xiàn)則從神經機制上解釋了動作觀察與執(zhí)行的表征共享現(xiàn)象。

在控制層面,內部模型理論(internal model theory)與最優(yōu)反饋控制框架為策略的預測 - 校正閉環(huán)設計提供了數(shù)學工具,例如 DMP(Dynamic Movement Primitives)通過微分方程參數(shù)化運動基元,實現(xiàn)了對人類示范軌跡的緊湊表征與泛化生成。

在優(yōu)化層面,行為克隆的負對數(shù)似然目標、逆強化學習的特征計數(shù)匹配約束、以及對抗模仿的 Jensen-Shannon 散度最小化,均對應明確的統(tǒng)計學習理論保證,這為算法收斂性與樣本復雜度分析奠定了基礎。

數(shù)據(jù)資源

從遙操作到互聯(lián)網規(guī)模弱監(jiān)督

高質量示范數(shù)據(jù)是模仿學習的基礎。早期工作依賴遙操作或動作捕捉系統(tǒng),代表性數(shù)據(jù)集如 BridgeData V2、RH20T 提供 RGB-D 視覺、關節(jié)狀態(tài)、力 / 扭矩等多模態(tài)同步記錄。近年研究轉向更具可擴展性的范式:

  • 高保真幾何建模:ARCTIC 數(shù)據(jù)集通過手 - 物網格重建,實現(xiàn)復雜交互幾何的精確建模;
  • 雙手協(xié)同標注:OAKINK2 聚焦雙人操作,提供多視角 3D 姿態(tài)標注,支持對稱 / 非對稱任務學習;
  • 合成與增強技術:MimicGen 利用幾何 - 語義一致性約束從少量演示生成物理合理軌跡;RoboAgent 通過視頻語義擴展動作多樣性;
  • 弱監(jiān)督視頻學習:VideoDex、NIL 等方法嘗試從互聯(lián)網未標注操作視頻中提取策略,推動靈巧操作向無監(jiān)督學習演進。



主流靈巧操作數(shù)據(jù)集對比



模仿學習數(shù)據(jù)集質量評估規(guī)則

學習方法

行為克隆的演進與多模態(tài)融合

模仿學習范式持續(xù)多樣化,核心進展包括:

  • 行為克隆改進:Implicit Behavioral Cloning 通過能量模型捕獲多模態(tài)動作分布;Diffusion Policy 利用擴散模型生成高維連續(xù)動作,其迭代去噪機制可有效建模動作分布的多峰特性與時序依賴,在插拔、旋擰任務中展現(xiàn)優(yōu)越性能;
  • 對抗模仿魯棒性:GA-GAIL 引入任務目標引導判別器訓練,提升對噪聲 / 次優(yōu)示范的魯棒性;
  • 視頻驅動學習:按技術路線分為運動中心建模(DexMV)、合成視頻生成(Gen2Act)、表征學習(Ag2Manip)與任務定制架構(Bi-KVIL)四類,后者通過顯式建模雙手協(xié)調關系提升復雜環(huán)境復現(xiàn)能力;
  • 觸覺 - 視覺融合:新一代觸覺傳感器(GelSight、TacTip)提供高分辨率接觸信息,與視覺形成互補。觸覺信號可檢測視覺遮擋下的微滑移與接觸力變化,為策略提供冗余感知通道;ViTacFormer、KineDex 等工作實現(xiàn)跨模態(tài)特征融合,使策略在低光照或遮擋條件下仍能穩(wěn)定執(zhí)行。



模仿學習方法分類體系



不同模仿學習方法的比較



基于視頻的靈巧操作模仿學習方法分類

硬件平臺

從靈巧手到人形本體

目前,靈巧手的設計正從高成本、封閉式工業(yè)系統(tǒng)向低成本、開源化、模塊化方向演進。

Shadow Dexterous Hand 以 24 自由度和高精度力控,長期作為高保真遙操作的黃金標準;LEAP Hand 憑借簡易制造工藝與良好運動性能,已成為大規(guī)模模仿學習實驗的常用平臺;Linker Hand L20 采用連桿驅動設計,每個手指配備 4 個電機,工作空間與指尖力接近人類手,在高靈巧性工業(yè)應用與學術研究中廣泛使用;Allegro Hand 采用直接驅動,結構緊湊且響應迅速;BarrettHand 通過欠驅動實現(xiàn)自適應抓取,在工業(yè)場景中廣泛應用;而 DLR/HIT Hand II 等早期平臺則為多指力控與傳感集成提供了重要參考。這些硬件進步降低了研究門檻,也為算法與物理世界的緊密耦合創(chuàng)造條件。



三種末端執(zhí)行器在靈巧操作中的性能比較



代表性機器人手的關鍵特征

靈巧策略的部署效能高度依賴本體構型,除靈巧手外,整體硬件平臺同樣不可忽視。論文指出,高自由度人形平臺(如配備 Shadow Hand 的雙臂系統(tǒng))雖能復現(xiàn)精細手指運動,但其動作空間維度激增會加劇模仿學習的分布偏移風險;而輕量化本體(如 LEAP Hand+ 移動基座)通過結構簡化降低策略學習難度,卻可能犧牲復雜任務的執(zhí)行能力。

更關鍵的是,本體動力學特性(如關節(jié)摩擦、傳動遲滯、質量分布)會引入示范數(shù)據(jù)與實機執(zhí)行間的系統(tǒng)誤差,這要求策略設計必須考慮「感知 - 決策 - 執(zhí)行」鏈路的端到端魯棒性。近期工作如 Mobile ALOHA 通過 whole-body teleoperation 采集全身協(xié)同數(shù)據(jù),正是為了彌合「手部策略」與「全身運動」間的表征鴻溝。

靈巧操作操作系統(tǒng)

算法落地的工程接口

「操作系統(tǒng)」指支撐策略執(zhí)行的基礎軟件棧與任務調度框架。論文指出,分層模仿學習框架需通過高層任務分解與底層動作執(zhí)行的解耦,實現(xiàn)長時程任務的穩(wěn)定復現(xiàn);而遙操作數(shù)據(jù)采集系統(tǒng)則依賴 ROS-native 接口、多傳感器時間同步協(xié)議及低延遲通信中間件,確保示范軌跡的時空一致性。

此外,為解決跨平臺復現(xiàn)難題,綜述呼吁社區(qū)共建標準化部署環(huán)境,包括統(tǒng)一的仿真參數(shù)配置、硬件抽象層接口及評估指標注冊表,以降低「代碼可跑」與「結果可復現(xiàn)」之間的鴻溝。

評估協(xié)議

標準化 benchmark 的迫切需求

當前靈巧操作評估存在顯著瓶頸:多數(shù)研究在私有任務或特定平臺驗證,任務定義(如成功判定閾值)、評價指標(如軌跡誤差 / 任務完成率 / 能耗)、硬件依賴(如是否要求特定靈巧手型號)缺乏統(tǒng)一標準,難以實現(xiàn)跨方法、跨平臺的公平比較。

綜述呼吁社區(qū)共建標準化 benchmark,涵蓋插拔、旋擰、穿線、布料操作等典型任務,并引入物理可行性、能耗、失敗恢復率等綜合指標。



靈巧操作關鍵挑戰(zhàn)的重要性與解決難度矩陣

總結與展望

本綜述不僅提供技術地圖,更指出未來方向:算法需降低對特定硬件 / 環(huán)境的依賴,提升跨平臺遷移能力;評估體系亟需標準化以支持公平比較;研究重心正從單次短時任務轉向長期交互與多技能組合,要求系統(tǒng)具備分層規(guī)劃、在線適應與任務組合能力。

靈巧操作的價值在于賦能具身智能體完成復雜物理交互。從家庭服務到工業(yè)裝配,具備類人手部靈活性的機器人將拓展人工智能應用邊界。本綜述為此領域研究者提供了一幅清晰、系統(tǒng)且面向未來的全景圖譜。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
陜西神木“11·20”較大爆炸事故整改評估報告公布 多名公職人員受處分

陜西神木“11·20”較大爆炸事故整改評估報告公布 多名公職人員受處分

新京報
2026-04-07 17:06:31
廣東今日早報!再創(chuàng)CBA紀錄,新大外浮出水面,薩林杰休戰(zhàn)一周

廣東今日早報!再創(chuàng)CBA紀錄,新大外浮出水面,薩林杰休戰(zhàn)一周

林子說事
2026-04-07 17:14:17
放著有軟肋的火箭不打,挑森林狼給自己上強度,掘金真不識時務嗎

放著有軟肋的火箭不打,挑森林狼給自己上強度,掘金真不識時務嗎

兵哥籃球故事
2026-04-07 17:01:39
女生長的太漂亮是什么體驗?網友:母以子貴,父以女榮

女生長的太漂亮是什么體驗?網友:母以子貴,父以女榮

另子維愛讀史
2026-03-10 22:56:08
被上海大叔的打扮驚艷了!滿街都是“夾克+直筒褲”,時髦顯年輕

被上海大叔的打扮驚艷了!滿街都是“夾克+直筒褲”,時髦顯年輕

白宸侃片
2026-04-07 15:38:31
上海交大:每次起床后大量喝水的人,用不了多久,身體或有7變化

上海交大:每次起床后大量喝水的人,用不了多久,身體或有7變化

讀懂世界歷史
2025-11-23 11:18:04
澤連斯基:助力中國崛起的一大功臣

澤連斯基:助力中國崛起的一大功臣

賤議你讀史
2026-03-30 06:45:03
復活節(jié)的沉默:英國王室信仰天平的傾斜與文明退卻

復活節(jié)的沉默:英國王室信仰天平的傾斜與文明退卻

斌聞天下
2026-04-07 07:30:03
掘金18分逆轉開拓者,賽后楊瀚森的鏡頭引熱議!他獲得約基奇認可

掘金18分逆轉開拓者,賽后楊瀚森的鏡頭引熱議!他獲得約基奇認可

球場沒跑道
2026-04-07 12:28:54
伊朗正式回復調解方:未來幾天里不愿在巴基斯坦與美國官員會面

伊朗正式回復調解方:未來幾天里不愿在巴基斯坦與美國官員會面

財聯(lián)社
2026-04-04 02:04:15
美女美圖8982期

美女美圖8982期

情感大頭說說
2026-04-07 20:34:33
美媒:伊朗已經與美國達成停火方案,隨后便會簽署最終協(xié)議

美媒:伊朗已經與美國達成停火方案,隨后便會簽署最終協(xié)議

讓生活充滿溫暖
2026-04-06 19:09:49
孫儷的“上海小院”火了,院里種菜曬衣服養(yǎng)狗,滿滿都是煙火氣

孫儷的“上海小院”火了,院里種菜曬衣服養(yǎng)狗,滿滿都是煙火氣

趣文說娛
2026-04-06 21:37:13
新冠后遺癥的長期侵襲,無數(shù)人在不知不覺中深陷困境

新冠后遺癥的長期侵襲,無數(shù)人在不知不覺中深陷困境

律法刑道
2026-04-01 10:15:47
中國女排集訓照曝光!爬山苦練體能,吳夢潔低調,兩位老將缺席

中國女排集訓照曝光!爬山苦練體能,吳夢潔低調,兩位老將缺席

跑者排球視角
2026-04-07 16:38:23
妻子聚會被初戀拉進洗手間半小時,回家后問我吃醋嗎,我直接離婚

妻子聚會被初戀拉進洗手間半小時,回家后問我吃醋嗎,我直接離婚

千秋文化
2026-03-13 21:04:41
央行:中國3月末黃金儲備報7,438萬盎司,2月末為7422萬盎司,為連續(xù)第17個月增持黃金

央行:中國3月末黃金儲備報7,438萬盎司,2月末為7422萬盎司,為連續(xù)第17個月增持黃金

每日經濟新聞
2026-04-07 16:14:21
SOHO中國創(chuàng)始人潘石屹回國

SOHO中國創(chuàng)始人潘石屹回國

地產微資訊
2026-04-07 12:19:09
“唐僧”遲重瑞85歲妻子陳麗華去世!曝最后露面照,身家超百億

“唐僧”遲重瑞85歲妻子陳麗華去世!曝最后露面照,身家超百億

裕豐娛間說
2026-04-07 11:25:23
遲重瑞妻子陳麗華去世,溫馨全家福曝光,4個兒女都很優(yōu)秀

遲重瑞妻子陳麗華去世,溫馨全家福曝光,4個兒女都很優(yōu)秀

洲洲影視娛評
2026-04-07 16:14:25
2026-04-07 21:31:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12701文章數(shù) 142616關注度
往期回顧 全部

科技要聞

滿嘴謊言!OpenAI奧特曼黑料大起底

頭條要聞

美軍拯救飛行員差一點失敗 從40英里外用攝像頭對準他

頭條要聞

美軍拯救飛行員差一點失敗 從40英里外用攝像頭對準他

體育要聞

官宣簽約“AI球員”,這支球隊被罵慘了...

娛樂要聞

女首富陳麗華離世 被曝生前已分好遺產

財經要聞

10萬億財政轉移支付,被誰拿走了?

汽車要聞

不止是大 極狐首款MPV問道V9靜態(tài)體驗

態(tài)度原創(chuàng)

本地
健康
房產
旅游
手機

本地新聞

跟著歌聲游安徽,聽古村回響

干細胞抗衰4大誤區(qū),90%的人都中招

房產要聞

重磅!三亞擬出安居房新政!

旅游要聞

上游觀察|兩天春假,卻讓孩子擁抱了整個春天

手機要聞

傳聞蘋果闊折疊命名iPhone Ultra,曝國內同品類新機也考慮跟進

無障礙瀏覽 進入關懷版