網易首頁 > 網易號 > 正文申請入駐

AI定義本體 - 跨維基于Sim2Real具身智能引擎定義首款人形機器人

2024-12-17 12:55:36　來源: 有界UnKnown

北京舉報

分享至

經典機器人設計通常依賴機器人專家和機械工程師的經驗進行正向設計，并針對空間可達性、結構強度、重量分布、重復精度等特性進行有選擇性的優化。這個過程非常依賴設計師的經驗，并且迭代周期較長，需要開發出數個版本的實體硬件進行測試、迭代，導致研發成本較高。而且在應用場景及任務更加復雜時，經典設計的本體及末端執行器構型等在機器人任務執行成功率、執行效率、硬件成本等方面不能達到最優。

依賴AI技術，尤其是基于Sim2Real具身智能引擎，跨維智能開始嘗試是否能夠比經典方法更高效地探索廣泛的設計空間，最大化強度同時最小化材料使用的創新結構，能夠像AlphoGo之于人類經典棋譜一樣，突破思維定式，實現機器人本體的更優的設計。

在“AI定義本體”的機器人研發發展趨勢下，跨維在這方面進行了首次嘗試。近日，跨維智能首款AI定義的具身智能機器人W1即將全球發布。該機器人由跨維智能從電機開始全棧自研，包含基于AI的機械結構設計優化、控制系統開發、感知系統搭建以及具身智能大模型等各個模塊，機器人本體在技術協同性、整體穩定性等方面更具優勢，能更好、更精準、更快速地展現具身智能大腦的能力，賦予大腦一個“指哪打哪”的軀體，展現出更強勁的性能表現。

▍具身智能機器人最高效演化與訓練場

技術實現上，具身智能機器人W1首先得益于跨維自研DexVerse?引擎，這是全球少有的空間與具身智能模型訓練引擎，具備“三維數字資產生成-物理仿真-數據合成與標注計算-模型訓練-模型驗證”全鏈條自動化能力，是空間智能、具身智能、生成式AI的核心底座。

機器人想要實現靈巧操作，預先訓練具身智能模型是一條捷徑。DexVerse?引擎作為人形機器人及不同形態具身智能機器人的最佳設計與演化場，能以落地場景和靈巧操作技能為目標，通過設計強化學習獎懲函數，以可微仿真的方式優化機器人構型、運動學、動力學等參數，實現針對作業場景及技能的最佳機器人形態。

基于Sim2Real具身智能引擎，W1具身智能機器人就在本體設計上輕松實現了包含機器人任務執行目標、機器人構型及運動學和動力學參數空間、可微物理仿真引擎等幾個關鍵模塊。通過強化學習等方式，跨維智能還針對目標場景和機器人任務技能，在參數空間中進行離散加局部連續優化的方式，實現本體的更優設計；而且這種方式也能實現針對末端執行器以及機器人外觀形態等方面的更優設計。

在機器人優化方式上，基于Sim2Real具身智能引擎也可以采用模塊化設計加樹狀搜索的方式，降低學習成本，提升優化效率。這種方式能夠在Sim2Real具身智能訓練場中，跟機器人技能訓練統一目標，在一個框架體系下完成，實現本體設計與任務技能學習的統一。

目前，跨維基于DexVerse?引擎，形成了包括具身智能感知套件、RoPilot新一代機器人控制器、移動操作式復合機器人等一系列軟硬件產品，以AnyPick, AnyPlace, AnyInsert, AnySort, AnyScrew等通用技能，賦能智能制造、商業服務、家庭助理等業務板塊。

▍“大腦+小腦+感知”擦出最閃亮“本體”火花

具身智能機器人要想大批量落地，大腦、小腦和感知缺一不可。

在一個完整的具身智能機器人中，往往需要“大腦”負責智能規劃與決策、自然認知與人機交互、多模態感知與精確定位；“小腦”負責高精度自適應運動控制與身體感知與反饋；傳感器作為機器人“感知”物理世界的窗口，才能更好實現任務執行和落地。

跨維智能憑借強力的研發團隊，在具身智能機器人W1就做到了“大腦+小腦+感知”的融合，最完整大小腦團隊在W1機器人這個整體上迸發出創新的火花。

港中文（深圳）賈奎教授帶隊組成“最強大腦”

“大腦”是具身智能機器人的核心，由“認知-感知-規劃-控制”的具身智能分層模型中的前三個模塊組成。針對一個機器人靈巧操作任務，首先機器人“認知”模塊需要基于專用于具身任務的大語言模型/多模態大模型，（在認知層面）理解任務目標并拆解成機器人能夠執行的基礎技能與原動作。隨后“感知”模塊負責在三維物理世界中進行目標物識別、定位、姿態估計、操作點/姿態估計等；“規劃”模塊則在空間感知的基礎上，規劃出機器人用以完成目標任務的動作軌跡。

“認知-感知-規劃”作為一個有機的整體形成“大腦”，算法方式上既可以通過分層模型實現，在足量高質量數據下也可以端到端實現。

跨維擁有全球頂尖的“大腦”研發團隊，由具身智能、多模態大模型、3D生成式AI 、強化學習等方向權威專家組成。其中帶頭人賈奎教授是跨維智能創始人，香港中文大學（深圳）教授，全球Top2%頂尖科學家，廣東省“珠江人才計劃”創新創業團隊帶頭人，人工智能、具身智能、計算機視覺、機器學習等領域權威專家，發表頂級論文百余篇，獲CVPR19最佳論文候選，ICDP最佳論文獎，廣東省自然科學一等獎。

賈奎教授首創Fantasia3D, Grasp Proposal Networks, PCANet, DehazeNet等深度模型，曾研發出業界領先的深度三維物體檢測與姿態估計算法、深度三維物體表面重建算法、深度遷移與域適應學習算法，帶領團隊多次獲得物體抓取與姿態估計等領域權威競賽冠軍；擔任TIP, TMLR等頂刊副主編，ICCV/ICML/NeurIPS等AI頂會領域主席。目前帶隊跨維智能組成了具身智能機器人W1的“最強大腦”。

機器人專家、原三星首席工程師金毅博士帶隊“最靈小腦”

除了大腦，具身智能機器人還需要對周邊環境和本體狀態有全面的感知，并能夠根據反饋信息及時調整運動。由于周邊環境及任務的復雜性，具身智能機器人的運動需要高度的魯棒性、協調性和精確性。在這個過程中，機器人“小腦”就負責環境與本體的感知和自適應運動控制，能夠將環境及本體的各種傳感器信息和本體的狀態信息作為“小腦”的輸入，預測即將發生的狀況，并計算出當下機器人應該做出的反應。“小腦”隨即調整運動控制策略并控制機器人的各個關節做出合適的應對。

機器人領域資深專家、前三星電子首席工程師金毅博士作為CTO帶領跨維研發團隊，進一步加強跨維在機器人本體控制的協調性和靈活性，為跨維具身智能大腦在各個場景落地提供支撐。

金毅博士本科畢業于浙江大學，博士畢業于韓國科學技術院（KAIST），主要研究方向為機器人控制、運動規劃及機器人本體設計。后于三星電子生產技術研究所擔任首席工程師，帶領百人團隊，主導了多款機械臂、移動機器人和復合機器人的研發及量產，攻克了一系列世界級難題，在工業及服務機器人領域擁有二十年的豐富的研發、量產及管理經驗。目前支撐起了跨維智能W1的“最靈小腦”打造。

傳感器專家吳迪帶隊研發“慧雙眼”

傳感器是機器人感知物理世界的窗口，也是機器人邁向智能化的基礎。在機器人在智能化發展過程中，不斷對感知、交互、運動和控制等多個模塊提出更高要求，而傳感器在這些模塊中發揮著重要作用。

而視覺傳感器是機器人的“雙眼”，擁有視覺能使機器人更敏銳地獲取外界環境信息。為了讓機器人的感知能力接近人類的水平，關鍵在于充分發揮傳感器的感知潛力。跨維智能自研的全系列空間與具身智能傳感器，尤其是純視覺雙目結構的Kingfisher系列，能有效適配各類工作環境，無論是室外強光、高反光物品、透明/黑色物品等，均能獲取到精確的空間位置信息，交由機器人“大腦”進行與環境的交互。

這背后是資深傳感器專家吳迪帶隊研發的“最慧雙眼”。吳迪曾任騰訊高級算法工程師，研發機器人及視覺產品；作為華為高級算法工程師負責華為首款雙攝手機三維重建算法，并曾在霍尼韋爾等世界500強企業擔任高級工程師職位，具備豐富的視覺傳感器產品、三維重建算法等領域的實戰經驗，獲授權發明專利16件。

▍結語與未來

具身智能機器人的落地應用，是從研發到工程落地的系統性問題，從底層運動控制，到上層AI技術，到相互協調配合，都非常具有挑戰性，也是賈奎教授、金毅博士、吳迪等一直在探索的事業。

目前，跨維智能擁有全球頂尖的大腦團隊，在具身智能引擎、具身智能大模型上取得的成就有目共睹，結合小腦控制、本體研發、傳感器研發等方面的專長，尤其是基于“AI定義本體”的新理念，跨維通過自研的DexVerse?引擎，正以最高效、最低成本的方式打通具身智能機器人全鏈路，加快跨維具身智能機器人的整體研發與落地進程，并穩步邁向Physical AGI的實現。

基于Sim2Real具身智能引擎推出W1具身智能機器人是跨維探索和落地Physical AGI的又一步。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.