![]()
“目前機器人其實可以學習人的任何動作。”
前不久,在北京舉辦的2026人形機器人與具身智能標準化年會上,宇樹科技創始人王興興用“任何動作”,概括機器人的能力邊界。而要實現這一效果,需提前采集真人數據進行訓練。
在機器人的“成長”過程中,采集真人數據為何如此關鍵?海量數據又如何賦予機器以“人”的靈性?這些問題的答案,正隨著一座座數據采集訓練場的落地而逐漸清晰。
訓練場上:1250遍“手把手”陪練
春日的青島嶗山區,國家高端智能化家用電器創新中心里,正緊鑼密鼓地推進一項關鍵項目:機器人的真機數據采集與“崗前教育”。
今年1月,青島市人形機器人數據采集訓練場在此啟用。整層室內環形訓練場被錯落切割為廚房、商超、汽車制造等7個實景,每塊置景內均有1—2位真人“老師”,耐心地“手把手”教導31個名為夸父的機器“學生”。
均齡20出頭的年輕數采師頭戴VR設備,緊握手柄,耐心而小幅度地比劃著行走、蹲起、抓取等基礎動作。銀黑相間的“夸父”們則略顯生澀地同步扭動關節,嘗試完美復刻。
這里鮮有言語聲,偶爾,“咚”的一聲悶響會打斷這份安靜——新手老師動作過急,嘗試練習平穩行走的機器學生便笨拙栽倒。
這些動作并非隨性編排,而是遵循嚴格的工業標準。小組長劉文碩告訴記者,訓練流程一般是甲方提出需求,位于北京的研發部門將其拆解為具體動作步驟,最終“發包”至各地訓練場。
訓練師們領到的任務通常是10秒至2分鐘長的演示視頻,他們須在時限內高精度還原視頻動作,并重復單一任務至少1250遍,以便機器學生完美復刻。“動作不到位就是無效數據,直接作廢。”劉文碩說。
與沉默的機器學生為伴,每日枯燥地重復單一動作,“老師”秦小杰仍顯得興致勃勃,“一想到未來大街上的機器人都是自己親手教出來的,還是很有成就感的。”
然而,看似簡單的動作,卻屢屢讓滿身前沿科技的金屬身軀“翻車”,“比如拿個杯子,機器人的手掌有時會整個翻轉,非常別扭。”
靈巧手,在業內被認為決定著人形機器人的功能上限。秦小杰有時會握住“學生”這雙分布著數百個感應點的修長鐵手,感受相似形態下悄然生出的親密。
人類從具備抓握功能到熟練使用工具,走過了逾百萬年的漫長進化;而今,這一進化歷程則被壓縮至以月、年為單位的“商業催熟”中。
靈巧手并非唯一的關卡。卡住人形機器人商業化步伐的,更多的是一顆能獨立決策、應對未知的聰慧“大腦”。
因此,海量訓練的深層目標,是賦予機器人舉一反三的“泛化能力”。“數據能夠幫助機器人學習環境變化規律和自身行為策略。”山東大學控制科學與工程學院教授王元哲解釋。
“結構化的數據集被喂給大模型后,將迭代出更智慧的機器‘大腦’。”青島市人形機器人數據采集訓練場總經理李彥杰進一步介紹,目前,業界突破主要聚焦兩個方向:負責決策感知的“大腦”與負責運動控制的“小腦”。
沿循這兩個方向,業界分化出不同研發重心:一派專注硬件動作表現,被稱作“本體派”;另一派致力于提升其智商,即“AI派”。
巧婦難為無米之炊,受限于數據短缺,AI派遲遲未能迎來自己的革命性進化。正如王興興所言,“誰能把機器人用的大模型做出來,誰就是全世界最厲害的AI和機器人公司。”
公共空間中:讓數據走出“孤島”
對高質量數據的渴求,已成為行業的共同訴求。盡管自家機器人已在簡單動態場景中表現出一定的自主心智,松延動力負責人仍表示:“當前產業的最大瓶頸,在于缺乏高質量的真實場景數據集。任何實質性突破都依賴于此,但行業尚未形成規模化積累。”
大型訓練場的出現,恰恰是為了實現“規模化的積累”。山東大學控制學院機器人工程系副主任張國騰說,“這是把數據采集從‘手工作坊’升級為更標準化的‘數據工程’。”
當下,不同品牌、構型的機器人,僅遵循各自軟硬件體系,數據質量參差不齊,未形成通用的數據語言,各家形同小小“孤島”,直接制約著行業發展效率。
公共訓練場的價值在于,它為各類機構提供了一個可以互動、達成通約的平臺性空間,從而避免重復建設,并最終走出“各自為戰”的封閉敘事。“我們已經開源了部分數據集,期待能激發更多創新。”李彥杰說。
即便訓練失敗,在此亦有價值——失敗能暴露傳感噪聲、接觸動力學、控制飽和、軟硬件延遲等真實問題,往往更有含金量。
進入2025年后,各地對于建設訓練場的熱情逐步迸發。去年1月,上海浦東新區率先落子,建成全國首個異構人形機器人訓練場;北京、合肥、無錫等地步伐緊跟。在山東,除青島外,濟南平陰縣于去年12月亦宣布啟用面積達4000平方米的訓練場。
“我們的核心目標之一,是實現產業場景的落地。”李彥杰表示,青島這座訓練場定位清晰,即面向具有本土特色的海洋、康養、新零售等產業開展實訓,精準服務一線需求。
當市場尚就“人形”是否必要爭論不休時,部分“夸父”機器人已悄然現身服裝、汽配等場景中,開啟了進廠“打工”生涯。
實驗室里:在仿真中“窮盡可能”
為了讓機器人“耳聰目明”,在山東大學創新大廈內,另一條技術路徑正在探索中:構建于仿真世界的推演訓練。
這里同樣孕育著激動人心的成果。7層的機器人中心實驗室孵化出了“優寶特”這一山東名片;5層的視覺感知與智能系統實驗室則與宇樹科技成立了人形機器人聯合實驗室,攻關雙足機器人關鍵技術。
“企業提供機器人作為硬件平臺,我們就在其中刷程序,調優軟件性能。”張國騰認為,高校受限于資金,難以購買昂貴的算力和硬件,企業恰好可以提供這些重資產,以換取智力支持。
更重要的是,在行業通用標準尚未確立的當下,哪家機器人能夠作為高兼容的“底座”支撐更多軟件開發,誰就可能在未來的標準之爭中占得先機。
與訓練場不同,實驗室里少有完整的機器人,取而代之的是拆得七零八落的零部件。來自機器人工程、電子信息、物理等專業的碩博學生埋首仿真軟件,一遍遍修改參數、切換視角、調試細節,以使模擬空間無限逼近物理現實。
“現有的人形機器人,空間理解能力比較差,這是很大一塊短板。”張國騰舉例,面對一張低矮的桌子,小貓小狗都知道低頭穿過,機器人卻會將其視為整塊障礙物而選擇繞行。
仿真訓練的本質,是一種“窮盡可能性”的探索。機器人工程專業大三學生趙凱濤解釋:“我們會在仿真環境里創建任何可能出現的地形,讓機器人一遍遍試錯,摔倒就懲罰,成功就獎勵。”
憑借這套虛擬的獎懲機制,仿真世界中成百上千個機器人正日復一日“變聰明”,這常讓整個實驗室興奮不已。
那么,實景與仿真訓練,孰優孰劣?
張國騰認為,兩者并無高下之分。仿真訓練更靈活、方便、低成本,但虛擬環境與現實世界始終存在鴻溝。實景數據則是縮窄這道鴻溝的最佳標尺。
一個更務實的策略是:仿真用于快速篩選方向,少量高質量的真機數據,則用于最終的校準與驗證。
“最希望具身智能大模型從‘讀萬卷書’過渡到‘行萬里路’。”對未來,張國騰不免暢想,在充沛數據的支持下,擁有聰明“腦袋”的機器人,終將走出實驗室,與人類一同前行萬里。
來源:大眾新聞
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.