![]()
文 | 周天
周天財經(jīng) 原創(chuàng)出品
2025年12月31日,成都跨年夜。
一款名為「愛湫」的小型人形機器人在成都高新區(qū)首次公開亮相。它展示了另一種驚艷表現(xiàn)——用投影在面部呈現(xiàn)出細(xì)膩的表情變化,用語言打破人機隔閡,用帶有情緒起伏的語調(diào)、動作回應(yīng)問候。
這是全球首款主打情感交互的雙足人形機器人。
研發(fā)它的四川具身人形機器人科技有限公司(以下簡稱「四川具身科技」),成立僅一年半。在這個被北上杭深頭部企業(yè)牢牢把控的賽道上,這家來自成都,成立于2024年9月的初創(chuàng)公司,趟出了一條幾乎無人走過的路。
「我們必須承認(rèn),追趕頭部企業(yè)做同質(zhì)化產(chǎn)品,對我們來說沒有出路。」四川具身科技CEO兼CTO馮振宇坦言。
這位電子科技大學(xué)博士出身的創(chuàng)業(yè)者,在2024年5月,代表電子科大,填補四川省在人形機器人領(lǐng)域的空白。彼時,整個西南地區(qū)正兒八經(jīng)在做人形機器人的企業(yè),用一只手就能數(shù)得過來。
一年多時間里,四川具身科技先后推出了天行者一號、天行者二號兩款全尺寸人形機器人平臺。產(chǎn)品迭代速度不慢,技術(shù)成熟度也在肉眼可見地提升,初步看齊中國機器人創(chuàng)業(yè)軍團第一梯隊。
![]()
就在勢頭看起來不錯的時候,公司做出了一個讓外界有些意外的決定:戰(zhàn)略重心從全尺寸人形轉(zhuǎn)向小型情感交互機器人。
01 一個「技術(shù)及格,但不夠優(yōu)秀」的行業(yè)現(xiàn)實
要理解這次戰(zhàn)略轉(zhuǎn)型,首先要談?wù)勅诵螜C器人行業(yè)在2024到2025年間經(jīng)歷的微妙變化。
2024年,行業(yè)內(nèi)的普遍共識是:人形機器人真正落地,至少還需要五年。云深處創(chuàng)始人朱秋國教授甚至在多個場合表示,這個過程可能是十年。那時候各界都有耐心,創(chuàng)業(yè)者也有足夠的時間打磨技術(shù)。
但2025年,風(fēng)向突變。馮振宇回憶,「突然大家都等不及了。股東、資本市場、地方,都希望看到能盡快干活的機器人,整個行業(yè)都想快速看到成果。」
然而,技術(shù)的進(jìn)步并不以各方急切期盼為轉(zhuǎn)移。
馮振宇用了一個形象的比喻:「從全行業(yè)看,人形機器人距離真正能干活,技術(shù)只是剛剛及格,打60分,但還打不到85分。」精細(xì)化操作還不夠精準(zhǔn),復(fù)雜任務(wù)理解還不夠智能,長時間運行還會發(fā)熱、關(guān)節(jié)損耗——這些問題需要時間解決,而不是靠燒錢就能快速邁進(jìn)。
一臺人形機器人要像汽車一樣穩(wěn)定可靠,能跑幾十萬公里不出問題,汽車工業(yè)花了一百年,那對于機器人來說,怎么也得幾年的迭代優(yōu)化。馮振宇言辭懇切:「我們做技術(shù)出身,很清楚這個客觀限制是沒法大干快上的。」
但觸及技術(shù)極限之時,往往也暗藏著突破口。當(dāng)全尺寸人形機器人還在為「能不能穩(wěn)定干活」較勁時,小型人形機器人卻展現(xiàn)出更快落地的可能性。
![]()
稍小一點人形不需要考慮高精度操作、復(fù)雜任務(wù)理解、高負(fù)重等難題。它的使用場景更聚焦——導(dǎo)覽、陪伴、表演、教育,這些場景對技術(shù)的容錯度更高,而對產(chǎn)品的交互屬性提出了更高要求。
更重要的是,小人形可以做得很便宜。當(dāng)價格降到十萬以下甚至五萬左右時,對于養(yǎng)老機構(gòu)、學(xué)校、展廳、商業(yè)空間來說,這就是一個非常容易算清回報周期的投資。「按8萬塊錢一年的成本,乘以三年的設(shè)備使用周期,很容易就能覆蓋成本。」馮振宇這樣算了一筆賬。
02 在同質(zhì)化中尋找藍(lán)海
確定了小人形賽道后,下一個問題是:做什么樣的小人形?
2025年,市面上的小人形產(chǎn)品已經(jīng)不少:宇樹、眾擎、魔法原子、松延動力,甚至智元也推出了小人形產(chǎn)品線。不管是宇樹的小人形,還是眾擎、魔法原子,基本上都還是在蹦蹦跳跳的階段。形態(tài)上有些區(qū)別,但外行人分辨不出來。
如果四川具身科技也去做一款專攻跳舞的小人形,結(jié)局幾乎可以預(yù)見:成立時間比別人晚,發(fā)展資源不如別人多,最終只能在紅海里掙扎。
這就必須找到一個市場潛力巨大、還沒那么擁擠的細(xì)分賽道。團隊的目光最終落在了「情感交互」上。
「現(xiàn)在很多大廠做蹦蹦跳跳的產(chǎn)品賣得很好,但還沒有往產(chǎn)品的后半段——人機交互特性這塊發(fā)力。」馮振宇解釋,「提升機器人對人的理解能力,以及機器人自己的表達(dá)能力,這個方向幾乎是空白的。」
這是一個「從需求出發(fā)反推產(chǎn)品」的邏輯。當(dāng)大多數(shù)團隊還在用研發(fā)思維慣性往前跑時,四川具身科技選擇先問一個問題:用戶到底需要什么?
答案并不復(fù)雜:對于陪伴場景來說,用戶需要的并非一個會炫技的機器,而是一個能理解自己情緒、給出恰當(dāng)回應(yīng)的「伙伴」。
![]()
這個判斷的背后,還有一個關(guān)于城市基因的思考。
「我們公司在成都,成都這個城市最大的特色是什么?大家提起成都就覺得是個好玩的地方,有很多情緒價值的地方。」馮振宇說,「我們想把城市特色融入產(chǎn)品,喜歡成都的人很多,帶有成都基因的產(chǎn)品,就要把文化意蘊凸顯出來。」
這就是為什么「愛湫」采用了西南特有保護物種龍蜥作為設(shè)計原型——一個帶有鮮明地域文化符號的形象,而不是千篇一律的科幻機甲風(fēng)格。在遠(yuǎn)處初看大致輪廓,又有點像兒時記憶里的鐵臂阿童木,喚起一波回憶殺,有一種夢想走進(jìn)現(xiàn)實的感覺。
03 「全球首創(chuàng)」背后的技術(shù)攻關(guān)
確定方向后,真正的挑戰(zhàn)才剛剛開始。
要打造一款情感交互機器人,臉就變得重要了,首先要解決一個基礎(chǔ)問題:它用什么臉?
目前人形機器人的面部表達(dá)方案主要有兩種:一是LED屏幕,簡單直接,但「太像手機或平板放在頭上」,缺乏立體感和親和力;二是仿真硅膠皮膚,效果逼真,但成本驚人——一個仿生面部的成本,便宜的20-30萬,貴的兩三百萬。
對于設(shè)定價格帶在十萬以下的產(chǎn)品來說,這兩條路都走不通。
四川具身科技選擇了第三條路:3D超短焦投影。
這項技術(shù)此前主要應(yīng)用于汽車擋風(fēng)玻璃的虛擬投影,從未被用在雙足人形機器人上。團隊的想法是:在機器人頭部內(nèi)置一套微型投影系統(tǒng),配合定制化的異形曲率面罩設(shè)計,以突破傳統(tǒng)平面顯示的局限,帶來具備縱深感的真實交互體驗。
![]()
聽起來簡單,做起來全是困難。
首先是亮度問題:室外環(huán)境下投影夠不夠亮?顏色對比度能不能跟電子屏比?其次是空間問題:如何在直徑只有20厘米的頭部空間里,塞進(jìn)光機、散熱系統(tǒng)和控制系統(tǒng)?
再次是畸變問題:投影到異形曲面上就像照哈哈鏡,如何做校正?最后還有震動問題:機器人走路時,投影畫面會不會晃?
這些問題,團隊花了近一年時間逐一攻克。最終呈現(xiàn)的效果是:無論從正面還是側(cè)面看,都能感受到一個三維卡通形象「走進(jìn)了現(xiàn)實」。愛湫也成為第一款基于投影面部交互的雙足人形機器人。
![]()
面部只是第一步。更核心的挑戰(zhàn)在于:如何讓機器人「讀懂」人的情緒,并做出恰當(dāng)?shù)幕貞?yīng)?
團隊開發(fā)了一套名為「情感驅(qū)動引擎」的系統(tǒng)。它將用戶的表情按照中國傳統(tǒng)的「七情」(喜、怒、哀、樂、憂、懼、思)分為七大類,針對每一類設(shè)計了十幾種回應(yīng)表情。同時,通過攝像頭和算法識別交互對象的面部表情變化,判斷對方的情緒狀態(tài),再生成相匹配的語言和肢體回應(yīng)。
這套系統(tǒng)的底層技術(shù)叫做ELA(Emotion-Language-Action)模型——這是四川具身自研的「情感-語言-動作」融合模型,同樣是全球首創(chuàng)。
「以前的機器人用行為樹編程,你高興的時候就手舞足蹈,生氣的時候就抱抱自己。我們是用數(shù)據(jù)驅(qū)動,讓機器人學(xué)習(xí)人類在不同情感狀態(tài)下的肢體動作,用端到端的方式生成回應(yīng)。」馮振宇這樣告訴周天財經(jīng)。
第三個核心技術(shù)是智能語音系統(tǒng)。這是與騰訊聯(lián)合開發(fā)的成果。
現(xiàn)有的人形機器人大多只是簡單地放一個麥克風(fēng)和揚聲器,降噪靠設(shè)備自帶的基礎(chǔ)功能。但在真實的交互場景中——比如養(yǎng)老院的公共活動區(qū)、嘈雜的展會現(xiàn)場——這種簡單配置幾乎無法正常工作。
愛湫搭載的智能語音系統(tǒng)包含四個核心能力:360°環(huán)形麥克風(fēng)陣列、深度降噪、聲紋識別和聲場定位。
「比如愛湫在客廳沙發(fā)上坐著,你進(jìn)門喊一聲'愛湫',它能判斷你在它的哪個方位,然后轉(zhuǎn)身面向你。這是聲場定位的作用。」馮振宇舉例,「如果家里有爺爺奶奶、爸爸媽媽和兩個小孩,每個人跟它說話,它通過聲紋識別知道是誰在說話,然后根據(jù)之前的交流記錄,給出個性化的回應(yīng)。」這會是國內(nèi)首次將完整的智能語音交互系統(tǒng)集成到人形機器人產(chǎn)品上。
04 一個「千億級空白市場」的想象空間
「我們在研發(fā)過程中接待過很多訪客,特別是50歲以上的人。不管是領(lǐng)導(dǎo)還是投資人,大家都開玩笑說不指望孩子陪自己。」馮振宇說,「有一個能陪著聊天、幫忙拎東西、提醒吃藥的機器人伙伴,大家是愿意買單的,也愿意容忍它一定程度上的不完美。」
![]()
團隊將目標(biāo)市場分為兩個階段:
第一階段主攻B端場景,如營業(yè)廳、養(yǎng)老機構(gòu)及學(xué)校等。這些場景有明確的導(dǎo)引導(dǎo)覽需求,空間相對結(jié)構(gòu)化,對機器人的功能要求聚焦,商業(yè)模式容易閉環(huán)。
第二階段瞄準(zhǔn)C端家庭——通過產(chǎn)品迭代和成本下降,最終走進(jìn)千家萬戶。
「我們對愛湫的定位是'非接觸式陪伴'的第一階段。」馮振宇解釋,「現(xiàn)在技術(shù)條件下,讓機器人幫你干復(fù)雜的家務(wù)還有難度,但陪你聊天、給你導(dǎo)覽、提醒你吃藥、幫你拿簡單的物品,這些完全沒問題。隨著技術(shù)成熟,未來它可以變成真正的生活助手。」
更重要的是,陪伴過程中積累的記憶和情感連接是可以延續(xù)的。
假設(shè)你和愛湫相處了三年,三年間的所有對話、互動記錄,都會合規(guī)合法保存在系統(tǒng)里。未來產(chǎn)品升級時,只需要替換本體硬件,這段「感情」還在。它不會因為換了一個殼,就變成一個陌生人。
這個設(shè)計在深層次包含著一個關(guān)于「情緒消費」的洞察。近年來,Labubu等潮玩產(chǎn)品的爆火證明,消費者越來越愿意為情緒價值買單。這些產(chǎn)品沒有實用功能,不會動,也不會說話,但人們就是喜歡,就是愿意花錢。
![]()
「人形機器人的優(yōu)勢在于,不止能提供情緒價值,以后還能幫人干活。」馮振宇說,「這是一個可以承載長期價值的產(chǎn)品形態(tài)。」
「我們想做一款能走進(jìn)家庭、走進(jìn)個人生活、甚至走進(jìn)個人情感世界的人形機器人。」馮振宇有清晰的戰(zhàn)略路線圖,「這不是過渡形態(tài),這就是終局思考,我們現(xiàn)在做的所有事情,都是從這個終局反推出來的。」
如今,隨著具身智能時代的到來,全省上下正在凝聚一個新的共識——四川必須抓住機會,培育出自己的行業(yè)領(lǐng)軍者。為此,四川具身科技已立下「保五爭四」的全國排位目標(biāo),試圖在激烈的行業(yè)競爭中為四川占據(jù)一席之地。
數(shù)據(jù)顯示,目前四川省內(nèi)人形機器人賽道呈現(xiàn)「成都、綿陽雙核驅(qū)動」的稀缺格局。這種「稀缺性」帶來的不僅是機遇,更是沉甸甸的責(zé)任。在外界看來,在更有力的挑戰(zhàn)者出現(xiàn)之前,四川具身科技已然成為成都乃至四川在該賽道上的「扛旗者」,肩負(fù)著代表區(qū)域產(chǎn)業(yè)高度的使命。
「有上海同行建議我們不用自己做,直接買機器人貼牌就行,意思是四川只需要開放市場,他們掙錢,我就要個名頭就行了。」馮振宇說,「但我們從上到下都不愿意接受這個結(jié)果。至少在現(xiàn)階段,行業(yè)還在起步期,我們要盡一切努力迎頭趕上。盡管資源有限,但我們的戰(zhàn)略相對聚焦,我們希望能做出差異化的東西來破局。我們還是很努力的,一直在緊追不舍,我們一定要做出成果來。」
馮振宇擲地有聲:「我們在這里成家了,要待到老,就不能短期主義。」
*本文如有提及上市公司,僅作為研究交流用途,不構(gòu)成推薦股票或相關(guān)金融產(chǎn)品的建議。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.