文|王毓嬋
編輯|楊軒
當一家機器人公司決定做AI大模型平臺和開放生態,它會給行業帶來什么?
上個月,智元剛剛跨過“機器人量產下線一萬臺”的門檻。4月17日,這家由前華為“天才少年”彭志輝與前華為副總裁鄧泰華共同創立的機器人公司在合作伙伴大會上,花了大量的時間和篇幅介紹軟件上的新產品。相較之下,硬件的篇幅反倒很少。
智元推出了六大AI模型、七大生產力解決方案,并首次公開AIMA(AI Machine Architecture)全棧生態技術體系。這些軟件產品將與硬件機器人一起,組成智元“一體三智”的架構。
所謂“一體三智”,“一體”指的是機器人本體;"三智"則包括:運動智能(基礎智能,承擔物理載體的執行器功能);交互智能(高階智能,為情緒價值入口);作業智能(高階智能,提供勞動生產力)。
“智元并不僅僅只是一家機器人公司,更是一家具身智能公司。如果沒有跟本體深度耦合的智能,機器人只是一個工具,并不是真正的具身智能。”彭志輝說。
如何讓機器人不止會按照寫好的程序跳舞、翻跟頭,而是在工業、商業和家庭環境里自主承擔工作,關鍵的變量就在于機器人大腦。現在,智元希望做這個“孵化機器人大腦”的平臺。
![]()
智元聯合創始人、總裁兼CTO彭志輝
一口氣推出六款AI模型,智元要做“開放生態”
智元創始人、董事長兼CEO鄧泰華宣布,智元將于今年推出的六款AI模型,覆蓋“一體三智”中的運動智能、交互智能和作業智能。
運動智能方面,將推出兩大基座模型:支持感控融合的全身運控基座模型(通過環境感知實現自適應運動控制),以及生成式運控基座模型(以多模態交互實時生成任意動作,無需預編排)。
交互智能方面,在已規模應用的WITA大模型基礎上,三季度將發布行業首個端到端具身多模態交互大模型WITA Omni 1.0。該模型保留對話情感、語境、音調、環境等信息,實現自然擬人的情感交互表達,支持中途插話、打斷、糾正。
作業智能投入最大、算法人才密度最高。智元近期已發布融合大小腦的GO-2模型、動作世界模型GE-2、開源數據集AGIBOT WORLD 2026、仿真平臺Genie Sim 3.0及Genie Studio 2.0。第三季度,還將推出GO-3模型,融合ViLLA架構和世界模型架構,具備了規劃推演能力,也具備復雜任務的推理執行能力,數據規模達GO-2的數十至百倍。
鄧泰華向臺下的產業界合作伙伴們展示了一張圖——具身智能發展的XYZ曲線。
![]()
具身智能發展的XYZ曲線
X曲線(2022年至2025年)為開發嘗鮮期,完成從原型到規模量產的跨越。2023年首款人形機器人發布,完成技術可行性驗證;2025年實現5000臺量產,機器人從"展品"變成"商品",機器人能“動"起來了。
Y曲線(2026年至2030年)為部署成長期。2026年3月智元機器人萬臺下線,交互智能與作業智能規模化落地,機器人生產力持續逼近人類水平。
Z曲線(2030年及以后)為部署普及期,具身智能涌現時刻到來——機器人在制造、物流、服務等重點領域的生產力全面超越人類,學習效率和進化速度極度領先,群體智能開始涌現。
按照智元的規劃,公司三年走過 X 曲線,實現首個十億營收;五年走過 Y 曲線,完成萬臺部署,實現百億營收;八年迎來 Z 曲線,與全球生態伙伴共創,實現規模化從 1 到 N 推廣。這個規劃被稱為“358宏圖計劃”,而2026年作為Y曲線的開端,被稱為"部署態元年"。
總裁兼CTO彭志輝說,智元判斷2026年為突破點,是因為“有三個要素在今年同時成立”——大模型的突破;機器人的本體和數據飛輪。
首先,在大模型方面,模型已經讓機器人開始能夠看懂世界、理解世界。更重要的是這些模型不再是孤立的算法,而是形成了開源的生態,整個加速了機器人技術的迭代。
其次,在機器人本體方面,機器人已經實現了大規模量產,并可以實現7×24小時的穩定運行。
最后,在數據飛輪方面,彭志輝說:“數據飛輪部署的機器人越多,飛輪轉得越快,采集的數據也越多,模型的訓練能力也就越強。這個飛輪一旦轉起來,就將產生指數級的網絡效應,智元的判斷是2026年飛輪也會開始加速轉動。”
基于這樣的判斷,智元接下來的思路是——本體量產、模型迭代、開源數據,開放生態平臺。彭志輝稱之為“一條最難,但是也最有復利的路徑”。
缺少數據的行業,和重復造輪子的競爭對手
機器人公司在2026年嘗試與競爭對手一起走向開放,某種程度上也是資源缺失導致的必然。
2026年,大語言模型和視頻生成大模型都在瘋狂燒Token,而具身機器人行業卻正在經歷“無Token可燒”的局面。大模型能像人一樣讀書,而具身智能要去真實的世界里摸爬滾打才能獲取數據——數據的匱乏成為了卡住全行業的瓶頸。
在合作伙伴大會舉辦的前一天,智元機器人旗下覓蜂科技先發布了一個“一站式物理 AI 數據服務平臺”,它的定位是面向其他機器人公司的To B數據服務平臺。
“誰是AI時代最大的Token消費者?不是聊天軟件,不是代碼助手,也不是圖片視頻生成器——而是具身智能體。”彭志輝說,“具身智能體的任務空間橫跨數字世界與整個物理世界,一個在物理世界中持續運行的機器人,每時每刻都在消耗Token。”
機器人已經量產了,大模型也已經造出來了,現在還差“數據飛輪”。
“GPT5用了100萬億tokens的訓練語料。1token約等于0.75個英語單詞,如果一個正常人一分鐘能說150個詞,這個語料級就等于一個人要說100億個小時才能說完。”覓蜂科技董事長兼 CEO 姚卯青說,“但具身智能不一樣。今天,全世界的高質量數據匯聚在一起,可能也只有50萬小時的規模。”
在大會后的采訪環節,彭志輝再次對包括智能涌現在內的媒體談起“數據荒”的問題。
“具身智能的數據缺口還是比較大,現在對行業來說是很大的瓶頸。而且它采集要求高,因為你要在物理世界產生真實的接觸,統計摩擦力、重力等等各種數據。”彭志輝說,“所以我們一直在推出數據采集的產品和商業方案,同時積極建設各種開放的數據生態。”
而且,行業至今仍然沒有形成標準化,這導致了重復造輪子的問題。
彭志輝的另一個身份,是工信部人形機器人與具身智能標準化技術委員會副主任委員。“國內有上層引導,我也參與標準建設,(希望)大家能合心齊力推動發展。”彭志輝說,智元一方面會繼續擴大本體部署,讓更多機器人進入真實的工作流去采集這個數據,另外也希望能吸引更多的第三方開發者去共建。
開放生態,是為了共同解決數據荒,也是為了形成“標準”,避免行業內的公司各自悶頭重復造輪子。
“開源的東西多了,才容易形成生態。參與生態的人多了,才能形成一個‘事實標準’,這也是我們推進標準化的一條路徑。”彭志輝說。
根據海外權威機構及國務院發展研究中心的數據,到2050年左右,具身智能產業將達到5萬億美元的規模。10年之后的2035年,僅中國具身智能產業就將到1萬億人民幣的規模。
類比汽車產業,目前全球汽車保有量約為16億輛,對應的市場規模接近5萬億美元。也就是說,具身智能將在25年之間“再造一個汽車產業”。
面對如此龐大而又遙遠的一個蛋糕,這個正在數據瓶頸上掙扎的行業還遠未到談論競爭的時候。
“我們所有伙伴合作都不要求排他,不獨占,不要求二選一,全部面向整個產業開放。如果在智元體系能力基礎上,別家跑出來了,推動了產業發展,我們也是歡迎的。產業成功了,生產力進步了,我們每個人都是受益者。”鄧泰華說。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.