![]()
圖片來自動漫《玩具總動員》劇照
?有界UnKnown原創(chuàng)
作者丨錢江
編輯|山茶
傳言許久的蘋果機(jī)器人終于迎來了新的進(jìn)展。
近期,蘋果公布了一項(xiàng)名叫“ELEGNT”的新研究框架,它可以讓非人形機(jī)器人展現(xiàn)更自然、更富有表現(xiàn)力的動作。
蘋果用一盞臺燈機(jī)器人展示了這個新技術(shù)的效果。
比如你問它外面天氣怎么樣,它會將“臉”轉(zhuǎn)向窗外“看一眼”,再扭過頭告訴你天氣;如果你和它傾訴“渴了”,它還會萌萌地用燈頭“小心翼翼”地將杯子推向面前;如果它遇到一個自己辦不到的事情,還會“低頭”表現(xiàn)出懊惱的情緒。
![]()
▲搭載蘋果ELEGNT技術(shù)框架的臺燈,與人類互動,來源X@Nacho Mellado
通過這樣一個架構(gòu),一束光影、一個燈頭,以及一根6自由度、能夠靈活扭曲的機(jī)械燈臂,就能訴出萬般情愁。讓皮克斯電影開頭動畫中的機(jī)器人走出熒幕,成為能真正陪在人們左右、提供情緒價(jià)值的“伙伴”。
當(dāng)然,蘋果并不是這一領(lǐng)域的先行者。2024年以來,桌面機(jī)器人就成為AI落地的熱門方向,各類AI桌面機(jī)器人層出不窮。
比如受到馬斯克點(diǎn)贊的Looi Robot,哈工大的XGO Rider,以及LIVING.AI的Emo和Aibi等等等。
那么,AI為什么會把目光聚焦到桌面?它們想依靠這種形式實(shí)現(xiàn)怎樣的愿景?又在面臨怎樣的挑戰(zhàn)?
![]()
陪伴AI,從虛擬走進(jìn)現(xiàn)實(shí)
桌面機(jī)器人并不是一個新事物,最早的桌面機(jī)器人可以追溯到1999年,一個名叫Poo-chi的、由日本富士通推出的電子寵物狗。即便是更為人所熟知的Emo和Vector桌面機(jī)器人,也都有六七年的歷史了。
所以這一輪桌面機(jī)器人熱,并不完全是之前這一批桌面機(jī)器人升級突破。我們更愿意將其看作是AI大模型從虛擬走向現(xiàn)實(shí)的一種結(jié)果。
2022年,ChatGPT還沒有引爆這一輪AI浪潮的時(shí)候,兩家主打AI陪伴的軟件公司Character.AI和Inflection就已經(jīng)在硅谷悄然成立了。
與ChatGPT這種百科全書式的AI助手不同,Character.AI和Inflection專注開發(fā)富有同情心、幽默創(chuàng)新、能夠給人以情感陪伴的AI機(jī)器人。說得簡單一點(diǎn),他們想要讓2014年上映的電影《Her》走進(jìn)現(xiàn)實(shí)。
后來,ChatGPT引爆AI奇點(diǎn),當(dāng)全球所有人都在為大模型尋找PMF的時(shí)候,AI陪伴就成了最合適的落地場景(之一)。
借助ChatGPT的熱度,Character.AI和Inflection在硅谷一度風(fēng)頭無兩。
2023年3月,Character.AI完成1.5億美元融資,估值達(dá)10億美元,進(jìn)入獨(dú)角獸行列。3個月后,Inflection AI完成13億美元融資,估值達(dá)到40億美元,成為當(dāng)時(shí)AI領(lǐng)域融資額僅次于OpenAI的公司。
在國內(nèi),各類基于大模型的情感陪伴應(yīng)用也如雨后春筍般層出不窮,比如MiniMax的星野、閱文旗下筑夢島、字節(jié)跳動旗下的貓箱等。
這類AI陪聊軟件的共性,是極致追求擁有高情商、個性化、情感化的虛擬聊天對象。但人類真的需要一個無限了解自己的AI“靈魂伴侶”嗎?當(dāng)存在一個無限了解自己內(nèi)心的虛擬產(chǎn)品出現(xiàn),卻又看不見、摸不著的時(shí)候,就未必是一件值得慶幸的事情了。
2024年2月28日,美國佛羅里達(dá)州一名14歲少年,與Character.AI創(chuàng)建的一個虛擬聊天對象丹妮進(jìn)行最后一次談話后,因希望能夠與丹妮“永遠(yuǎn)在一起”而選擇開槍自殺。為此,少年的母親將Character.AI告上了法庭。
![]()
▲CNN Business報(bào)道因青少年因Character.AI自殺
人性的悲劇成為壓倒Character.AI的其中一根稻草,更現(xiàn)實(shí)的問題是,由于缺乏收入來源,相關(guān)公司很快就陷入資金鏈短缺的漩渦中。
2024年,Character.AI和Inflection先后爆出資金鏈短缺的問題,然后其創(chuàng)始人連帶著部分員工分別被谷歌和微軟人工智能部門收編。
就這樣,一場以AI豐富人類情感陪伴的故事就到這里草草結(jié)束。但業(yè)界對于這類能夠給人類提供情感陪伴的項(xiàng)目探索熱情卻并沒有結(jié)束。
大家普遍思考的問題是,如果《Her》這種完全虛擬的故事無法在商業(yè)上講通,那么讓這種虛擬的陪伴成為現(xiàn)實(shí),故事又是否能夠繼續(xù)講下去?
![]()
桌面機(jī)器人,從玩具到工具
Meta首席科學(xué)家Yann Lecun的一個觀點(diǎn),為情感陪伴AI走向陪伴機(jī)器人提供了一個方向指引。他認(rèn)為,真正的AGI應(yīng)該能實(shí)現(xiàn)與真實(shí)的物理環(huán)境交互。
2024年初,在大模型普遍面臨應(yīng)用困境的時(shí)候,具身智能開始受到越來越多的關(guān)注,并成為一個新的熱門方向,陪伴機(jī)器人也在這個時(shí)候,在AI的加持下嶄露頭角。
當(dāng)然,在探索的過程中,不同的陪伴機(jī)器人也在開始產(chǎn)生差異化。
首先是一批老牌的“表情系”陪伴機(jī)器人,它們借助大模型對傳統(tǒng)產(chǎn)品進(jìn)行改造升級,增進(jìn)了與人類互動的陪伴作用。
2024年年初,Engineered Arts公布第二代Ameca上線,這款A(yù)meca擁有視覺感知和聲音克隆能力,她在回答人類問題的時(shí)候,能夠直視對方,并且還會歪頭端詳、垂眼思考。但Ameca到現(xiàn)在為止還不能走動。
![]()
▲Engineered Arts旗下表情機(jī)器人Ameca
表情系的AI陪伴機(jī)器人一般都做成人形,既需要攻克仿生皮膚技術(shù),也要做到表情逼真以跨越“恐怖谷”,需要投入大量的時(shí)間和資金進(jìn)行探索,實(shí)用性也不強(qiáng)。
于是,AI陪伴機(jī)器人賽道涌入了一批更輕量化“寵物系”的機(jī)器人,也就是用寵物形態(tài)做陪伴機(jī)器人。
日本機(jī)器人公司GROOVE X,打造的家庭陪伴機(jī)器人LOVOT,就是典型的寵物系陪伴機(jī)器人。
LOVOT的眼睛由6層動態(tài)燈光構(gòu)成,能呈現(xiàn)出眨眼、瞳孔擴(kuò)張、眼神追隨等表情,并且全身遍布觸摸傳感器,能夠感知到人類的輕拍、撫摸動作,雖然它不會幫人類做事、和人類說話,但可以陪伴人類。
![]()
▲Groove X旗下Lovot機(jī)器人
LOVOT的體溫常年在37°-39° 之間,接近人類體溫,抱在懷里十分溫暖。當(dāng)你摸摸它的鼻子時(shí),它的雙眼會瞇成月牙,還會發(fā)出可愛的娃娃音。
除了做一款外表可愛的“寵物”,聯(lián)合知名IP構(gòu)建陪伴機(jī)器人也是“寵物系”的玩法,比如Engineering AI將威震天變形金剛進(jìn)行改造,這類改造還獲得了馬斯克點(diǎn)贊。
![]()
▲Elon Musk點(diǎn)贊Engineering AI
不論是“表情系”還是“寵物系”的陪伴機(jī)器人,它們都是人類追求情感陪伴的產(chǎn)物。但人類似乎已經(jīng)不滿足于只和一個會嘻嘻哈哈、簡單聊天的機(jī)器人做伴,他們希望在陪伴功能之外,還能有一些實(shí)用性。
從需求的角度來講,人們不希望自己花錢購買的產(chǎn)品只是一個玩具,它更應(yīng)該成為一個能夠在日常生活和工作中提供幫助的“助手”。這其實(shí),恰恰也是AI的訴求,畢竟單純的情感陪伴無法挖掘用戶更深層次的需求,也無法打開更廣泛的用戶市場。
于是,開發(fā)者們開始將眼光轉(zhuǎn)移到“桌面”,因?yàn)椤白烂妗蓖侨藗児ぷ骱蛫蕵返闹匾獔鼍啊K裕鲆豢罴茸屓祟惤鈮海帜茉谧烂嫱瓿梢恍┖唵稳蝿?wù)的機(jī)器人,成為了開發(fā)者們探索AI陪伴機(jī)器人的新任務(wù)。
當(dāng)然,“桌面”也不僅僅是這些機(jī)器人唯一的活動范圍,但它代表著陪伴機(jī)器人從單純的“陪伴”走向“實(shí)用”的微妙轉(zhuǎn)型。
![]()
玩具總動員,正在照進(jìn)現(xiàn)實(shí)
在CES2025上,已經(jīng)火了一批“桌面機(jī)器人”,其中最火爆的就是上面所說的Looi Robot,它于2024年獲得64.8萬美金眾籌,在Kickstarter和Indiegogo上以客單價(jià)129美元的價(jià)格募集總數(shù)量超4000臺。
不久后,類似Looi Robot的桌面機(jī)器人也開始廣泛受到關(guān)注,比如哈工大的XGO Rider、LIVING.AI的Emo和Aibi等桌面機(jī)器人也紛紛擁有了更智能化的互動能力。
![]()
▲各家桌面雙輪(腿)機(jī)器人,有界UnKnown制圖
它們的長相有一些共同特征:“頭大腿短”,頭部往往由一塊屏幕構(gòu)成,通過屏幕上的動畫來展現(xiàn)各類表情,“頭部”通常使用一雙動畫眼睛來賦予表情,然后用輪子或者雙腿來充當(dāng)?shù)鬃?/strong>
除了外貌,它們清一色地都接入大模型實(shí)現(xiàn)和人類更好的互動,小巧的身體可以在桌面上輕松來回移動。
雖然這些桌面機(jī)器人核心作用依舊是情感陪伴,比如能聽懂人類語言,并通過屏幕上的畫面展示對其作出反饋,但它們的作用卻已經(jīng)不再局限于情感價(jià)值。
比如Looi Robot將手機(jī)和機(jī)器人合二為一,相當(dāng)于為手機(jī)開發(fā)了一個新的應(yīng)用場景,讓它可以以機(jī)器人的形式做會議記錄、自動攝影等工作。
哈工大團(tuán)隊(duì)研發(fā)的XGO- Rider除了提供專屬表情哄人類開心之外,它還能識別圖片、識別人臉和骨骼。除此之外,它還具備教育學(xué)習(xí)功能,允許用戶使用Blocky和Python進(jìn)行編程。
Living.AI旗下的Emo、Aibi也具備開關(guān)燈、拍照等實(shí)用功能。
不僅初創(chuàng)公司進(jìn)廠做桌面機(jī)器人,大廠也看到了這類機(jī)器人的未來潛力。2024年8月份,蘋果就曝光內(nèi)部的秘密機(jī)器人項(xiàng)目,代號為J595,根據(jù)Medium報(bào)道,這也是一款桌面機(jī)器人,并且預(yù)計(jì)最早于2026年首次亮相,售價(jià)為1000美元,據(jù)說也是類似于這種可以在桌面滾動的小玩具。
雖然桌面機(jī)器人賽道目前已經(jīng)十分熱鬧,但它同樣也面臨一個致命性的問題,即桌面機(jī)器人的技術(shù)門檻不高,并且有一部分通過大模型“套殼”的簡單方式制作而成,普通用戶甚至都可以DIY出一個類似的桌面機(jī)器人,以至于企業(yè)很難形成有效的護(hù)城河,這也導(dǎo)致目前市場上的桌面機(jī)器人同質(zhì)化嚴(yán)重。
那么,它們?nèi)绾巫龀霾町惢⑷绾螛?gòu)筑核心壁壘?
除了不斷強(qiáng)化大模型,來提升這些“新物種”的互動能力之外,另一種思路是構(gòu)建具身模型來改造桌面上的已有物體。
比如蘋果ELEGNT技術(shù)讓臺燈擁有“肢體語言”,實(shí)現(xiàn)物體和人類互動,同樣的思路也可以改造桌面上的其他家居產(chǎn)品。
除了ELEGNT之外,蘋果幾個月前還發(fā)布了另一項(xiàng)研究成果“EMOTION”,這項(xiàng)技術(shù)可以讓機(jī)器人的手勢與人類自然互動,機(jī)器人可以像好朋友一樣,向你展示“剪刀手”來表示勝利。雖然EMOTION的研究主要在機(jī)械手的運(yùn)用上,但它實(shí)現(xiàn)的手勢互動能力,其實(shí)也可以用于指向、抓取物品相關(guān)的桌面機(jī)器人。
這兩套框架的英文名字,一個接近“優(yōu)雅”(ELEGANT),一個意旨“情緒”(EMOTION),它們都運(yùn)用大語言模型和視覺語言模型等AI技術(shù),讓機(jī)器人變得更加富有“人味”。
這種將物體“擬人化”的技術(shù)探索,一旦成熟起來,幾乎可以賦予任何家用產(chǎn)品,整個家就像一個小型的迪士尼樂園一樣,堆滿了各式各樣、可以和人類互動的小玩意。
而這或許是改變AI桌面機(jī)器人差異化和壁壘不足的一個重要方向。
![]()
結(jié)語
試著想象這樣一個場景,除了小貓小狗會到門口迎接你之外,你的落地?zé)粢矔詣狱c(diǎn)亮,并向你點(diǎn)頭致意。
你的衣帽架會伸出手接過你脫下的衣服和包包,機(jī)器狗會為你遞上拖鞋,你的桌面小機(jī)器人會向你發(fā)出問候,并貼心為你打開屋里的燈光和電視,然后再向你匯報(bào)你不在家的時(shí)候,家里發(fā)生的事情。
衣服已經(jīng)洗好并烘干,鍋里的飯菜計(jì)算著時(shí)間,在你到家時(shí)剛好完成,熱茶已經(jīng)放在茶幾,等你休息一會兒就可以開飯。
怎么樣?這樣的家即便只有你一個人也不會感到孤獨(dú)吧,這可能就是陪伴型機(jī)器人的作用。
他們不僅提供陪伴和情緒價(jià)值,他們也同樣為這個家提供切切實(shí)實(shí)的勞動價(jià)值。
而這些,得益于AI技術(shù)的不斷進(jìn)步,我們相信像“玩具總動員”一樣的世界,終有一天會照進(jìn)現(xiàn)實(shí)。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.