網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

當(dāng)人形機器人學(xué)會「讀懂」情緒：四川具身科技的差異化突圍

2026-01-07 17:50:46　來源: 周天財經(jīng)

上海舉報

分享至

文 | 周天

周天財經(jīng) 原創(chuàng)出品

2025年12月31日，成都跨年夜。

一款名為「愛湫」的小型人形機器人在成都高新區(qū)首次公開亮相。它展示了另一種驚艷表現(xiàn)——用投影在面部呈現(xiàn)出細(xì)膩的表情變化，用語言打破人機隔閡，用帶有情緒起伏的語調(diào)、動作回應(yīng)問候。

這是全球首款主打情感交互的雙足人形機器人。

研發(fā)它的四川具身人形機器人科技有限公司（以下簡稱「四川具身科技」），成立僅一年半。在這個被北上杭深頭部企業(yè)牢牢把控的賽道上，這家來自成都，成立于2024年9月的初創(chuàng)公司，趟出了一條幾乎無人走過的路。

「我們必須承認(rèn)，追趕頭部企業(yè)做同質(zhì)化產(chǎn)品，對我們來說沒有出路。」四川具身科技CEO兼CTO馮振宇坦言。

這位電子科技大學(xué)博士出身的創(chuàng)業(yè)者，在2024年5月，代表電子科大，填補四川省在人形機器人領(lǐng)域的空白。彼時，整個西南地區(qū)正兒八經(jīng)在做人形機器人的企業(yè)，用一只手就能數(shù)得過來。

一年多時間里，四川具身科技先后推出了天行者一號、天行者二號兩款全尺寸人形機器人平臺。產(chǎn)品迭代速度不慢，技術(shù)成熟度也在肉眼可見地提升，初步看齊中國機器人創(chuàng)業(yè)軍團第一梯隊。

就在勢頭看起來不錯的時候，公司做出了一個讓外界有些意外的決定：戰(zhàn)略重心從全尺寸人形轉(zhuǎn)向小型情感交互機器人。

01 一個「技術(shù)及格，但不夠優(yōu)秀」的行業(yè)現(xiàn)實

要理解這次戰(zhàn)略轉(zhuǎn)型，首先要談?wù)勅诵螜C器人行業(yè)在2024到2025年間經(jīng)歷的微妙變化。

2024年，行業(yè)內(nèi)的普遍共識是：人形機器人真正落地，至少還需要五年。云深處創(chuàng)始人朱秋國教授甚至在多個場合表示，這個過程可能是十年。那時候各界都有耐心，創(chuàng)業(yè)者也有足夠的時間打磨技術(shù)。

但2025年，風(fēng)向突變。馮振宇回憶，「突然大家都等不及了。股東、資本市場、地方，都希望看到能盡快干活的機器人，整個行業(yè)都想快速看到成果。」

然而，技術(shù)的進(jìn)步并不以各方急切期盼為轉(zhuǎn)移。

馮振宇用了一個形象的比喻：「從全行業(yè)看，人形機器人距離真正能干活，技術(shù)只是剛剛及格，打60分，但還打不到85分。」精細(xì)化操作還不夠精準(zhǔn)，復(fù)雜任務(wù)理解還不夠智能，長時間運行還會發(fā)熱、關(guān)節(jié)損耗——這些問題需要時間解決，而不是靠燒錢就能快速邁進(jìn)。

一臺人形機器人要像汽車一樣穩(wěn)定可靠，能跑幾十萬公里不出問題，汽車工業(yè)花了一百年，那對于機器人來說，怎么也得幾年的迭代優(yōu)化。馮振宇言辭懇切：「我們做技術(shù)出身，很清楚這個客觀限制是沒法大干快上的。」

但觸及技術(shù)極限之時，往往也暗藏著突破口。當(dāng)全尺寸人形機器人還在為「能不能穩(wěn)定干活」較勁時，小型人形機器人卻展現(xiàn)出更快落地的可能性。

稍小一點人形不需要考慮高精度操作、復(fù)雜任務(wù)理解、高負(fù)重等難題。它的使用場景更聚焦——導(dǎo)覽、陪伴、表演、教育，這些場景對技術(shù)的容錯度更高，而對產(chǎn)品的交互屬性提出了更高要求。

更重要的是，小人形可以做得很便宜。當(dāng)價格降到十萬以下甚至五萬左右時，對于養(yǎng)老機構(gòu)、學(xué)校、展廳、商業(yè)空間來說，這就是一個非常容易算清回報周期的投資。「按8萬塊錢一年的成本，乘以三年的設(shè)備使用周期，很容易就能覆蓋成本。」馮振宇這樣算了一筆賬。

02 在同質(zhì)化中尋找藍(lán)海

確定了小人形賽道后，下一個問題是：做什么樣的小人形？

2025年，市面上的小人形產(chǎn)品已經(jīng)不少：宇樹、眾擎、魔法原子、松延動力，甚至智元也推出了小人形產(chǎn)品線。不管是宇樹的小人形，還是眾擎、魔法原子，基本上都還是在蹦蹦跳跳的階段。形態(tài)上有些區(qū)別，但外行人分辨不出來。

如果四川具身科技也去做一款專攻跳舞的小人形，結(jié)局幾乎可以預(yù)見：成立時間比別人晚，發(fā)展資源不如別人多，最終只能在紅海里掙扎。

這就必須找到一個市場潛力巨大、還沒那么擁擠的細(xì)分賽道。團隊的目光最終落在了「情感交互」上。

「現(xiàn)在很多大廠做蹦蹦跳跳的產(chǎn)品賣得很好，但還沒有往產(chǎn)品的后半段——人機交互特性這塊發(fā)力。」馮振宇解釋，「提升機器人對人的理解能力，以及機器人自己的表達(dá)能力，這個方向幾乎是空白的。」

這是一個「從需求出發(fā)反推產(chǎn)品」的邏輯。當(dāng)大多數(shù)團隊還在用研發(fā)思維慣性往前跑時，四川具身科技選擇先問一個問題：用戶到底需要什么？

答案并不復(fù)雜：對于陪伴場景來說，用戶需要的并非一個會炫技的機器，而是一個能理解自己情緒、給出恰當(dāng)回應(yīng)的「伙伴」。

這個判斷的背后，還有一個關(guān)于城市基因的思考。

「我們公司在成都，成都這個城市最大的特色是什么？大家提起成都就覺得是個好玩的地方，有很多情緒價值的地方。」馮振宇說，「我們想把城市特色融入產(chǎn)品，喜歡成都的人很多，帶有成都基因的產(chǎn)品，就要把文化意蘊凸顯出來。」

這就是為什么「愛湫」采用了西南特有保護物種龍蜥作為設(shè)計原型——一個帶有鮮明地域文化符號的形象，而不是千篇一律的科幻機甲風(fēng)格。在遠(yuǎn)處初看大致輪廓，又有點像兒時記憶里的鐵臂阿童木，喚起一波回憶殺，有一種夢想走進(jìn)現(xiàn)實的感覺。

03 「全球首創(chuàng)」背后的技術(shù)攻關(guān)

確定方向后，真正的挑戰(zhàn)才剛剛開始。

要打造一款情感交互機器人，臉就變得重要了，首先要解決一個基礎(chǔ)問題：它用什么臉？

目前人形機器人的面部表達(dá)方案主要有兩種：一是LED屏幕，簡單直接，但「太像手機或平板放在頭上」，缺乏立體感和親和力；二是仿真硅膠皮膚，效果逼真，但成本驚人——一個仿生面部的成本，便宜的20-30萬，貴的兩三百萬。

對于設(shè)定價格帶在十萬以下的產(chǎn)品來說，這兩條路都走不通。

四川具身科技選擇了第三條路：3D超短焦投影。

這項技術(shù)此前主要應(yīng)用于汽車擋風(fēng)玻璃的虛擬投影，從未被用在雙足人形機器人上。團隊的想法是：在機器人頭部內(nèi)置一套微型投影系統(tǒng)，配合定制化的異形曲率面罩設(shè)計，以突破傳統(tǒng)平面顯示的局限，帶來具備縱深感的真實交互體驗。

聽起來簡單，做起來全是困難。

首先是亮度問題：室外環(huán)境下投影夠不夠亮？顏色對比度能不能跟電子屏比？其次是空間問題：如何在直徑只有20厘米的頭部空間里，塞進(jìn)光機、散熱系統(tǒng)和控制系統(tǒng)？

再次是畸變問題：投影到異形曲面上就像照哈哈鏡，如何做校正？最后還有震動問題：機器人走路時，投影畫面會不會晃？

這些問題，團隊花了近一年時間逐一攻克。最終呈現(xiàn)的效果是：無論從正面還是側(cè)面看，都能感受到一個三維卡通形象「走進(jìn)了現(xiàn)實」。愛湫也成為第一款基于投影面部交互的雙足人形機器人。

面部只是第一步。更核心的挑戰(zhàn)在于：如何讓機器人「讀懂」人的情緒，并做出恰當(dāng)?shù)幕貞?yīng)？

團隊開發(fā)了一套名為「情感驅(qū)動引擎」的系統(tǒng)。它將用戶的表情按照中國傳統(tǒng)的「七情」（喜、怒、哀、樂、憂、懼、思）分為七大類，針對每一類設(shè)計了十幾種回應(yīng)表情。同時，通過攝像頭和算法識別交互對象的面部表情變化，判斷對方的情緒狀態(tài)，再生成相匹配的語言和肢體回應(yīng)。

這套系統(tǒng)的底層技術(shù)叫做ELA（Emotion-Language-Action）模型——這是四川具身自研的「情感-語言-動作」融合模型，同樣是全球首創(chuàng)。

「以前的機器人用行為樹編程，你高興的時候就手舞足蹈，生氣的時候就抱抱自己。我們是用數(shù)據(jù)驅(qū)動，讓機器人學(xué)習(xí)人類在不同情感狀態(tài)下的肢體動作，用端到端的方式生成回應(yīng)。」馮振宇這樣告訴周天財經(jīng)。

第三個核心技術(shù)是智能語音系統(tǒng)。這是與騰訊聯(lián)合開發(fā)的成果。

現(xiàn)有的人形機器人大多只是簡單地放一個麥克風(fēng)和揚聲器，降噪靠設(shè)備自帶的基礎(chǔ)功能。但在真實的交互場景中——比如養(yǎng)老院的公共活動區(qū)、嘈雜的展會現(xiàn)場——這種簡單配置幾乎無法正常工作。

愛湫搭載的智能語音系統(tǒng)包含四個核心能力：360°環(huán)形麥克風(fēng)陣列、深度降噪、聲紋識別和聲場定位。

「比如愛湫在客廳沙發(fā)上坐著，你進(jìn)門喊一聲'愛湫'，它能判斷你在它的哪個方位，然后轉(zhuǎn)身面向你。這是聲場定位的作用。」馮振宇舉例，「如果家里有爺爺奶奶、爸爸媽媽和兩個小孩，每個人跟它說話，它通過聲紋識別知道是誰在說話，然后根據(jù)之前的交流記錄，給出個性化的回應(yīng)。」這會是國內(nèi)首次將完整的智能語音交互系統(tǒng)集成到人形機器人產(chǎn)品上。

04 一個「千億級空白市場」的想象空間

「我們在研發(fā)過程中接待過很多訪客，特別是50歲以上的人。不管是領(lǐng)導(dǎo)還是投資人，大家都開玩笑說不指望孩子陪自己。」馮振宇說，「有一個能陪著聊天、幫忙拎東西、提醒吃藥的機器人伙伴，大家是愿意買單的，也愿意容忍它一定程度上的不完美。」

團隊將目標(biāo)市場分為兩個階段：

第一階段主攻B端場景，如營業(yè)廳、養(yǎng)老機構(gòu)及學(xué)校等。這些場景有明確的導(dǎo)引導(dǎo)覽需求，空間相對結(jié)構(gòu)化，對機器人的功能要求聚焦，商業(yè)模式容易閉環(huán)。

第二階段瞄準(zhǔn)C端家庭——通過產(chǎn)品迭代和成本下降，最終走進(jìn)千家萬戶。

「我們對愛湫的定位是'非接觸式陪伴'的第一階段。」馮振宇解釋，「現(xiàn)在技術(shù)條件下，讓機器人幫你干復(fù)雜的家務(wù)還有難度，但陪你聊天、給你導(dǎo)覽、提醒你吃藥、幫你拿簡單的物品，這些完全沒問題。隨著技術(shù)成熟，未來它可以變成真正的生活助手。」

更重要的是，陪伴過程中積累的記憶和情感連接是可以延續(xù)的。

假設(shè)你和愛湫相處了三年，三年間的所有對話、互動記錄，都會合規(guī)合法保存在系統(tǒng)里。未來產(chǎn)品升級時，只需要替換本體硬件，這段「感情」還在。它不會因為換了一個殼，就變成一個陌生人。

這個設(shè)計在深層次包含著一個關(guān)于「情緒消費」的洞察。近年來，Labubu等潮玩產(chǎn)品的爆火證明，消費者越來越愿意為情緒價值買單。這些產(chǎn)品沒有實用功能，不會動，也不會說話，但人們就是喜歡，就是愿意花錢。

「人形機器人的優(yōu)勢在于，不止能提供情緒價值，以后還能幫人干活。」馮振宇說，「這是一個可以承載長期價值的產(chǎn)品形態(tài)。」

「我們想做一款能走進(jìn)家庭、走進(jìn)個人生活、甚至走進(jìn)個人情感世界的人形機器人。」馮振宇有清晰的戰(zhàn)略路線圖，「這不是過渡形態(tài)，這就是終局思考，我們現(xiàn)在做的所有事情，都是從這個終局反推出來的。」

如今，隨著具身智能時代的到來，全省上下正在凝聚一個新的共識——四川必須抓住機會，培育出自己的行業(yè)領(lǐng)軍者。為此，四川具身科技已立下「保五爭四」的全國排位目標(biāo)，試圖在激烈的行業(yè)競爭中為四川占據(jù)一席之地。

數(shù)據(jù)顯示，目前四川省內(nèi)人形機器人賽道呈現(xiàn)「成都、綿陽雙核驅(qū)動」的稀缺格局。這種「稀缺性」帶來的不僅是機遇，更是沉甸甸的責(zé)任。在外界看來，在更有力的挑戰(zhàn)者出現(xiàn)之前，四川具身科技已然成為成都乃至四川在該賽道上的「扛旗者」，肩負(fù)著代表區(qū)域產(chǎn)業(yè)高度的使命。

「有上海同行建議我們不用自己做，直接買機器人貼牌就行，意思是四川只需要開放市場，他們掙錢，我就要個名頭就行了。」馮振宇說，「但我們從上到下都不愿意接受這個結(jié)果。至少在現(xiàn)階段，行業(yè)還在起步期，我們要盡一切努力迎頭趕上。盡管資源有限，但我們的戰(zhàn)略相對聚焦，我們希望能做出差異化的東西來破局。我們還是很努力的，一直在緊追不舍，我們一定要做出成果來。」

馮振宇擲地有聲：「我們在這里成家了，要待到老，就不能短期主義。」

*本文如有提及上市公司，僅作為研究交流用途，不構(gòu)成推薦股票或相關(guān)金融產(chǎn)品的建議。

聲明：個人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.