![]()
本篇文章被 ICRA 2026 接收并獲得 IROS 2025 雙料 Workshop 最佳論文,第一作者張子哲(site: zizhe.io)是賓夕法尼亞大學機器人學碩士生,同時在 GRASP 實驗室擔任科研助理,導師為 Nadia Figueroa 教授,研究興趣涵蓋機器學習,安全控制以及人機交互。
![]()
- 論文標題:Viability-Preserving Passive Torque Control
- 論文鏈接:https://arxiv.org/abs/2510.03367
- 項目主頁:https://vpp-tc.github.io/webpage/
一、一句話總結
本文提出了VPP-TC(Viability-Preserving Passive Torque Control),一種基于可行性(viability)理論的被動力矩控制框架。該框架在關節位置 - 速度的增廣狀態空間中預計算安全集合,將可行性約束轉化為關節加速度(進而力矩)的仿射約束,通過二次規劃(QP)實時求解,確保機器人在無限時間范圍內始終處于安全集合內。相比基于控制屏障函數(CBF)的基線方法,VPP-TC 無需計算邊界函數的二階導數,控制回路頻率更高、軌跡更平滑、路徑更短。
![]()
圖 1:VPP-TC 控制框架示意圖。關節限位的力矩約束通過解析方法推導,自碰撞和外部碰撞約束通過數據驅動方法學習。
二、研究背景與動機
在物理人機交互(pHRI)場景中,機器人需要在與人類近距離協作時保持被動性(passivity)—— 即吸收的能量不少于釋放的能量,從而保證在外部擾動下的魯棒性和穩定性。經典的阻抗 / 導納控制框架、Port-Hamiltonian 方法以及基于動力系統(DS)的被動力矩控制器已被廣泛研究。
然而,這類被動控制器通常缺乏顯式的約束處理能力,無法保證在整個任務執行過程中的碰撞避免和關節限位滿足。先前工作 CPIC 利用控制屏障函數(CBF)框架和指數控制屏障函數(ECBF)來約束被動力矩控制器,但存在以下問題:
- 硬約束之間可能互相沖突,導致 QP 不可行;
- QP 框架易陷入死鎖和關節空間的局部最小值;
- ECBF 需要計算邊界函數的 Hessian 矩陣(二階導數),當邊界由神經網絡表示時,實時性難以保證。
正是這些局限性,促使作者提出了基于可行性理論(viability theory)的全新安全控制框架。
三、方法詳解
3.1 核心思想:從 CBF 到 Viability
VPP-TC 的核心創新在于:在關節位置 q 和關節速度 q?的增廣狀態空間中引入安全邊界,而非僅在關節位置空間中。在這個增廣空間中操作的好處是,安全約束可以直接推導為關節加速度 q?的仿射約束,再通過機器人動力學方程轉化為力矩約束 —— 整個過程無需計算邊界函數的二階導數。
可行性的定義(Definition 1)是:從可行集 V 中的任意初始狀態出發,存在一個控制序列(加速度序列),使得產生的無限長狀態序列始終在可行集內。這比單純的「可行」(feasible)更強 —— 一個可行狀態可能在未來的控制下離開可行集,但一個 viable 狀態保證能永遠留在安全集內。
![]()
圖 2:可行性(viability)概念。狀態 s1 既可行又 viable,而 s2 可行但不 viable—— 雖然當前滿足約束,但不存在一個控制序列能保證它永遠留在安全集內。
3.2 自碰撞避免約束(SCA)
作者保守地定義了自碰撞可行性(Definition 2):如果從當前狀態出發,以最大減速反向制動至完全停止的整條制動軌跡上都不發生自碰撞,則認為該狀態是自碰撞安全的。
為學習這個可行集,作者使用了一個基于 Transformer 的神經網絡分類器 Γ(q, q?)。訓練數據通過仿真生成:采樣 300 萬組 (q, q?) 狀態對,模擬制動過程并標注 —— 若制動軌跡無自碰撞則標為 viable,否則標為 non-viable。網絡采用標準 Transformer-Encoder 架構(前饋維度 128、2 個注意力頭、4 層堆疊),訓練 30 個 epoch,測試集準確率達 99.27%,召回率達 99.74%。
![]()
圖 3:自碰撞可行性數據生成。從狀態 (q?, q??) 出發執行制動直至靜止 (q?, 0):若整條軌跡無自碰撞,標記為 Safe;否則標記為 Self-Collide。
約束的實施通過 Taylor 展開將 ΔΓ(q, q?) ≥ 0 線性化為關于 q?的仿射約束,再通過動力學方程轉化為力矩約束。關鍵公式為:
g_se?M?1τ ≥ g_se?M?1(Cq? + G) ? b_s
其中 g_se 和 b_s 由邊界函數 Γ 對 q 和 q? 的一階梯度與時間步長計算得到。
3.3 外部障礙物碰撞避免約束(ECA)
對于外部碰撞,作者采用Bernstein 多項式表示的符號距離函數(SDF)編碼每個機器人連桿的幾何。定義可行性保持 SDF 為制動軌跡上的最小瞬時 SDF:
S_v (p, q?, q??) = min_{t∈[0,T_br]} S (p, q (t))
類似地,通過 Taylor 展開得到關于 q?的仿射約束,并轉化為力矩約束。值得注意的是,該約束通過 Δp 項隱式地納入了障礙物速度信息,因此 VPP-TC 天然具備處理動態障礙物的能力。
3.4 關節位置與速度限位約束
受 Del Prete (2018) 啟發,作者通過解析推導獲得關節加速度的上下界 q?_lb 和 q?_ub,取位置可行性約束、速度約束和硬件加速度限制的交集,再通過動力學方程轉化為力矩約束。
3.5 統一的 QP 控制框架
最終的控制框架將所有約束統一到一個二次規劃(QP)問題中:目標函數最小化實際力矩與名義被動控制器力矩的偏差,約束條件包括關節限位(始終激活)、自碰撞約束(靠近邊界時激活)、外部碰撞約束(靠近邊界時激活)和力矩硬件限制。外部碰撞約束通過松弛變量軟化以保證 QP 可行性。
![]()
圖 4:平面 3-DoF 示例。左:工作空間軌跡。右:在硬件限制 [?10, 10] rad/s2 下的可行加速度域。當外部碰撞約束激活時,允許的加速度域收縮。
四、實驗結果
4.1 仿真實驗
在 7 自由度 Franka Panda 機械臂上(PyBullet 仿真),作者設計了三組對比實驗:僅自碰撞避免(SCA)、僅外部碰撞避免(ECA)、以及全約束(ALL)。與基線 CPIC 的定量對比如下表:
![]()
表 1:CPIC 與 VPP-TC 在不同約束設置下的性能對比(5 次實驗平均值)
VPP-TC 在所有設置下都顯著優于 CPIC:控制頻率提升 1.4–2.4 倍,軌跡長度更短,軌跡抖動降低了一個數量級以上(特別是在 ECA 和 ALL 場景下)。
4.2 真機實驗
作者在 7-DoF Franka Panda 真機上驗證了三個場景:
- 自碰撞避免(SCA):未啟用 SCA 時,機械臂因自碰撞預警觸發 Reflex Mode 停止運動;啟用 SCA 后安全到達目標。更換 UMI 夾爪后重訓網絡,控制器仍有效。
- 外部碰撞避免(ECA):面對靜態和動態障礙物,機械臂在被外力推向障礙物時能抵抗運動并保持安全間距;動態障礙物接近時主動退避。在約 200Hz 的控制頻率下實現真正的全身碰撞避免。
- 綜合場景:遙操作按臺燈開關任務 —— 僅提供粗略目標位置,無預計算的避障軌跡。VPP-TC 同時處理外部碰撞(臺燈燈體)和自碰撞約束,安全完成任務。
![]()
圖 5:真機實驗。上排:自碰撞避免(a-c)。下排:外部碰撞避免(d-f)。軌跡疊加顯示約束激活后機械臂保持正向間距。
![]()
圖 6:遙操作任務 —— 僅提供粗略目標位置,VPP-TC 確保近燈安全并防止自碰撞,成功完成按燈開關任務。
五、技術亮點與討論
1. 無需二階導數。通過在 (q, q?) 增廣狀態空間中操作,安全約束被表達為關于加速度的仿射函數,僅需要邊界函數的一階梯度。這大幅降低了計算負擔,是實現高控制頻率的關鍵。
2. 統一框架處理多類約束。關節限位、自碰撞、外部碰撞三類約束在同一 QP 中統一處理,約束按需激活,框架簡潔優雅。
3. 天然支持動態障礙物。外部碰撞約束的 Taylor 展開中包含障礙物位移 Δp 項,隱式編碼了障礙物速度,無需額外處理即可應對動態環境。
4. 全身碰撞避免。得益于 Bernstein 多項式 SDF 的高效計算,VPP-TC 能考慮所有機器人連桿的幾何,而非像 CPIC 那樣僅考慮末端幾個連桿。
5. 被動性保證。論文在附錄中證明了即使在約束激活時,控制器輸出的力矩仍保持任務空間被動性 —— 約束反作用力要么被阻尼耗散,要么被約束反力吸收,不向環境注入凈能量。
未來方向:當前框架假設精確的動力學模型。作者計劃在未來工作中考慮有界的模型不確定性,設計在建模誤差下仍能保證可行性的魯棒控制器。
六、總結
VPP-TC 為被動力矩控制的安全性問題提供了一套優雅而高效的解決方案。它將可行性理論與數據驅動學習相結合,在增廣狀態空間中構建安全集合,并通過 QP 實時求解力矩約束。這一框架在 IROS 2025 兩個 Workshop 上分別獲得 Best Contribution Award 和 Best Student Paper Award,并被 ICRA 2026 錄用,充分體現了其學術價值和應用潛力。對于關注人機交互安全、力矩控制以及機器人安全保障的研究者而言,這是一篇值得深入研讀的工作。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.