2026年,大語言模型和視頻生成大模型都在瘋狂燒token,而具身機(jī)器人行業(yè)卻正在經(jīng)歷“無token可燒”的局面。大模型能像人一樣讀書,而具身智能要去真實(shí)的世界里摸爬滾打才能獲取數(shù)據(jù)——數(shù)據(jù)的匱乏成為了卡住全行業(yè)的瓶頸。
4月16日,智元機(jī)器人旗下覓蜂科技發(fā)布一站式物理 AI 數(shù)據(jù)服務(wù)平臺,希望能讓數(shù)據(jù)像水電一樣即取即用。
“GPT5用了100萬億tokens的訓(xùn)練語料。1token約等于0.75個英語單詞,如果一個正常人一分鐘能說150個詞,這個語料級就等于一個人要說100億個小時才能說完。”覓蜂科技董事長兼 CEO 姚卯青說,“但具身智能不一樣。今天,全世界的高質(zhì)量數(shù)據(jù)匯聚在一起,可能也只有50萬小時的規(guī)模。”
數(shù)據(jù)資源匱乏且擴(kuò)容緩慢,是因?yàn)榫呱碇悄芩枰挠?xùn)練數(shù)據(jù),比大預(yù)言模型需要的訓(xùn)練語料要難獲得的多。在三維的開放世界,行業(yè)各家公司已經(jīng)嘗試了通過真機(jī)遙操或仿真數(shù)據(jù)等等各種方式去積累數(shù)據(jù),但仍然難以擺脫高成本和增速慢的問題。
現(xiàn)在,最前沿的采集方式是“無本體采集”。
無本體采集(Object-free/Body-less Data Collection)是指在具身智能訓(xùn)練中,直接利用人類操作(手戴傳感器夾爪)或輕量化設(shè)備記錄動作,而非依賴昂貴的實(shí)體機(jī)器人本體進(jìn)行遙控操作。它通過人手抓取、移動等方式記錄高質(zhì)量、多模態(tài)的動作數(shù)據(jù),具有成本低、采集效率高、場景泛化性強(qiáng)等優(yōu)勢。
發(fā)布會上,覓蜂推出了 MEgo 系列無本體數(shù)據(jù)采集硬件及 MEgo Engine 數(shù)據(jù)治理引擎。MEgo 系列包含采集夾爪、頭戴式采集設(shè)備等,設(shè)備具備超 300° 全景感知與亞毫秒級數(shù)據(jù)同步能力,支持在工廠、商超、家庭等全場景隨時隨地輕量化采集。
這款名為 MEgo Gripper 的夾爪全通道支持1080P 60fps,軌跡重建的精度可以達(dá)到一毫米,確保拿起一張紙的力度都可以被還原,“讓客戶拿到數(shù)據(jù)就能直接落地”,以及亞毫秒級無線時間同步。這個設(shè)備只有480g的重量,支持電池快換快拆,擺脫了電線,方便人“走到哪采到哪”。
![]()
MEgo Gripper
另一款頭戴式采集設(shè)備MEgo View融合了頭部超過300度的視野,以及兩個附著在手腕上的局部相機(jī),既可以兼顧超廣域的環(huán)境,也可以做到腕部和手部操作細(xì)節(jié)的捕捉。它搭載7個高清攝像頭,車規(guī)級九軸IMU(慣性測量單元),可以輸出RGB圖片、IMU,還有位姿、音頻在內(nèi)的全感官數(shù)據(jù)。
![]()
MEgo View
與夾爪設(shè)備一樣,頭戴式采集設(shè)備同樣采用無線設(shè)計(jì),支持電池快換,并能實(shí)現(xiàn)亞毫秒級無線時間同步。
輕量化的硬件,帶來了數(shù)據(jù)采集門檻的降低。在發(fā)布會后的采訪環(huán)節(jié),姚卯青告訴包括36氪在內(nèi)的媒體,他認(rèn)為未來理想的采集者工作模式可能會類似于“美團(tuán)騎手”——“大家可以兼職來做,但同時也要經(jīng)過驛站的培訓(xùn)才能上崗。”
在軟件上,MEgo系列解決方案背后有一套MEgo Engine 數(shù)據(jù)治理引擎,用來處理所有MEgo設(shè)備采集到的數(shù)據(jù),包括數(shù)據(jù)的預(yù)處理、提取、評估等等,而且可以評估在機(jī)器人上的表現(xiàn),實(shí)現(xiàn)一站式數(shù)據(jù)的多種標(biāo)注。
姚卯青表示,覓蜂已經(jīng)實(shí)現(xiàn)了真機(jī)遙操、無本體采集、仿真數(shù)據(jù)全范式覆蓋,旨在“讓高質(zhì)量數(shù)據(jù)像水電一樣即取即用。”該公司計(jì)劃在 2026 年實(shí)現(xiàn)千萬小時級數(shù)據(jù)產(chǎn)能,2030 年達(dá)成百億小時級數(shù)據(jù)產(chǎn)能。
作為智元機(jī)器人旗下企業(yè),覓蜂的定位卻是面向其他機(jī)器人公司的To B數(shù)據(jù)服務(wù)平臺。在活動后的采訪環(huán)節(jié),有媒體向姚卯青提問:“說服說服智元的競爭對手去買你們的數(shù)據(jù)?”
姚卯青回復(fù)說,“覓蜂作為一家獨(dú)立的數(shù)據(jù)服務(wù)平臺,所有的用戶數(shù)據(jù)交易都有嚴(yán)格協(xié)議。數(shù)據(jù)的交易模式分為‘使用權(quán)’和‘所有權(quán)’兩種,過去大部分用戶都是選擇了購買使用權(quán)而不是所有權(quán),對于極個別選擇購買所有權(quán)的客戶,我們會進(jìn)行嚴(yán)格的資產(chǎn)轉(zhuǎn)移,在本地銷毀數(shù)據(jù)。”
“智元并不是需要所有數(shù)據(jù),它也沒法獲取覓蜂的數(shù)據(jù)。”姚卯青說,“智元現(xiàn)在向覓蜂獲取數(shù)據(jù)的唯一途徑,就是市場化下訂單。智元不存在免費(fèi)從覓蜂獲取數(shù)據(jù)的途徑。”
在發(fā)布會上,覓蜂宣布與京東云、百度云、阿里云、獵聘及貴州大數(shù)據(jù)集團(tuán)等多家企業(yè)舉行戰(zhàn)略簽約,各方將在數(shù)據(jù)生態(tài)、場景協(xié)同、算力支撐等領(lǐng)域展開深度合作。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.