今天,AI+消費(fèi)機(jī)器人公司「靈宇宙」宣布,已于近期完成2億元的Pre-A輪融資。
這輪融資的投資方,包括上海國際集團(tuán)旗下的國方創(chuàng)新、國泰海通、廣發(fā)信德、滴滴出行、拉卡拉旗下考拉基金、潤建股份等頭部金融機(jī)構(gòu)和上市公司,以及老股東超額追投。
靈宇宙是我從去年開始就一直關(guān)注的公司。
當(dāng)時靈宇宙CEO顧嘉唯,一位曾打造過百度BaiduEye、爆款繪本閱讀機(jī)器人Luka等產(chǎn)品的資深從業(yè)者,他希望為全球家庭及個人用戶打造新的“伙伴型”AI機(jī)器人。
在打造機(jī)器人的同時,他還在迭代新一代的硬件OS,希望讓萬物在AI的加持下充滿“靈性”。
今年1月,靈宇宙的第一款產(chǎn)品,為3~12歲AI世代原住民打造的隨身AI終端——“小方機(jī)”亮相CES后,立刻引起各方關(guān)注。
*小方機(jī)使用展示
之后的一段時間,這款通過拍攝、理解、交流等方式,為新新人類提供即時學(xué)習(xí)和情感陪伴的小方機(jī),銷量在各電商平臺名列前矛。
今年618期間“靈宇宙小方機(jī)”正式上市,就登頂618 AI玩具及玩具總榜雙榜第一。
今年的“雙十一購物節(jié)”,“小方機(jī)”在各類平臺上的銷售總額同比618增長超過230%。
![]()
*用戶使用小方機(jī)
但就在靈宇宙業(yè)績飆升的同期,各種AI硬件也在不斷出現(xiàn)。面對各種和小方機(jī)面孔相似的AI產(chǎn)品,顧嘉唯認(rèn)為,靈宇宙的技術(shù)厚度和產(chǎn)品人機(jī)交互體驗(yàn),讓小方機(jī)的用戶體驗(yàn)脫穎而出。
他告訴我,靈宇宙基于過去在Luka時期積累的高質(zhì)量數(shù)據(jù),再加上一套能夠精準(zhǔn)分拆任務(wù)的Multi-Agent架構(gòu),讓小方機(jī)接到任務(wù)后可以精準(zhǔn)并迅速地理解、響應(yīng)用戶需求。
![]()
在用技術(shù)能力提升產(chǎn)品直觀體驗(yàn)的基礎(chǔ)上,顧嘉唯對小方機(jī)里的軟件功能進(jìn)行了精心設(shè)計(jì)。
比如,小方機(jī)里為每位AI原住民配備了專屬超級伴學(xué)團(tuán)隊(duì)(包括達(dá)爾文、愛因斯坦、曹文老師等),通過角色演繹、互動故事、輕游戲等形式,激發(fā)他們探索世界的熱情。
小方機(jī)里的內(nèi)容具備互動性和趣味性,背后也離不開靈宇宙的多模態(tài)AI空間交互技術(shù)和“關(guān)系算法”。它們,一起幫助小方機(jī)持續(xù)沉淀用戶的探索軌跡、興趣偏好、記憶序列與成長數(shù)據(jù),讓孩子們能和經(jīng)小方機(jī)呈現(xiàn)出的世界互動,和小方機(jī)里的內(nèi)容一起成長。
有了能滿足用戶體驗(yàn)的技術(shù)和兼具趣味與個性化的產(chǎn)品功能,年輕一代的孩子們,會愿意在這里持續(xù)探索世界。
![]()
這種精心設(shè)計(jì)的產(chǎn)品,背后藏著顧嘉唯打造整個智能家庭生態(tài)的圖景。他希望,通過消費(fèi)級硬件先進(jìn)入家庭場景,實(shí)現(xiàn)大規(guī)模“鋪量”,從而持續(xù)回收來自真實(shí)世界的、寶貴的人機(jī)交互數(shù)據(jù)。
這些多個場景的真實(shí)數(shù)據(jù),將形成一個越滾越快、讓對手難以逾越的“數(shù)據(jù)飛輪”,類比特斯拉銷售FSD套件收集數(shù)據(jù)的“南坡路徑”,驅(qū)動LingOS與背后AI大腦迭代。然后,讓“萬物有靈,人機(jī)共生”的家庭智能生態(tài)成為可能。
這是他一直以來的目標(biāo)。
![]()
以下是本輪融資完成時,我與顧嘉唯的最新交流。
半年內(nèi)銷量增長230%的小方機(jī)
Q:距離第一次見面剛好過去一年。很好奇靈宇宙這一年的進(jìn)展,產(chǎn)品和商業(yè)化都有哪些重要突破?
顧嘉唯:過去一年,我們的產(chǎn)品在 CES 第一次亮相,接著就進(jìn)入了快速商業(yè)化的階段。618期間,小方機(jī)正式上線,立刻成為京東AI玩具榜的第一。后來我們在天貓上架小方機(jī),雙11過后統(tǒng)計(jì),相比618的銷售增長達(dá)到了230%。
![]()
商業(yè)化的進(jìn)展非常重要,核心是,它非常有利于我們的數(shù)據(jù)閉環(huán)規(guī)劃,這是驅(qū)動LingOS迭代和進(jìn)步的關(guān)鍵。另外在產(chǎn)品功能上,我們保持著半個月一更新的速度,現(xiàn)在功能也非常豐富。
整體來說,過去一年最大的價值我自己之前說過的很多東西做到了這個產(chǎn)品里。大家終于看明白,哦,原來你做的這件事就是下一個兒童手表呀。這市場可大了去了,是一年20億元凈利潤的業(yè)務(wù)板塊。
Q:小方機(jī)是這波AI硬件里比較早發(fā)布的產(chǎn)品,但其實(shí)這一年里有很多類似的產(chǎn)品出現(xiàn)。你怎么看這種現(xiàn)象?
顧嘉唯:說實(shí)話,我沒有太在意大家是不是在做差不多的事情。我上一次創(chuàng)業(yè)做的繪本閱讀機(jī)器人Luka,全球賣了近千萬臺,也有很多同類。但整體我認(rèn)為跑得快、體驗(yàn)好才是最重要的。
現(xiàn)在很多AI硬件都做得很薄,交互就是聊幾句就結(jié)束了,對用戶來說完全沒有吸引力。但今天靈宇宙的小方機(jī),首先在體驗(yàn)和交互上,橫向?qū)Ρ纫呀?jīng)非常成熟了。比如,它不僅可以精準(zhǔn)快速地意圖識別、回應(yīng),還內(nèi)置海量持續(xù)OTA可升級的功能,例如最近上架的“魔法相機(jī)”,能讓萬物活起來。
另外,我們在硬件設(shè)計(jì)上也有很多堅(jiān)持和創(chuàng)新。就拿屏幕來說,雖然我們需要高清的屏幕,但還是選擇了能保護(hù)視力的類紙屏。既要護(hù)眼、又要高清,還要低功耗,本來是不可能三角,我們還是通過供應(yīng)鏈上的努力解決了,也構(gòu)建了軟硬件連調(diào)的技術(shù)壁壘。
等于不管是軟件還是硬件層面,小方機(jī)認(rèn)真做了很多有新意的設(shè)計(jì),現(xiàn)在整體是一個功能相對完備,兼具實(shí)用性和趣味性的產(chǎn)品,和市場上的其他產(chǎn)品有巨大代差。
我想,只要使用過的用戶都會懂。但是我還是會跟團(tuán)隊(duì)說,iPhone頭兩代軟件體驗(yàn)也沒有做到讓所有人都滿意,甚至是當(dāng)時體驗(yàn)過的人都覺得差強(qiáng)人意,但是只要方向?qū)α耍3指咚俚浖强梢圆粩嘟桓冻龀A(yù)期的體驗(yàn),刷新用戶市場的口碑和新認(rèn)知的。
Q:現(xiàn)在小方機(jī)里用戶反饋?zhàn)詈玫墓δ苁牵?/strong>
顧嘉唯:我們產(chǎn)品迭代非常快,功能非常多,現(xiàn)在甚至在嘗試簡化,希望聚焦把產(chǎn)品功能和用戶的Journey搭起來,帶著用戶一步步用起來。
現(xiàn)在小方機(jī)里有幾個Aha moment。
首先是各種和角色打Facetime,這個和大家在Facebook里打視頻電話類似,結(jié)合空間4D的感知交互+角色引擎,這樣就能融合人的第一視角和環(huán)境。第二是讓各種物體動起來,讓用戶有這個世界"活過來"、栩栩如生的體驗(yàn),比如“魔法相機(jī)”就用了這個技術(shù),這個功能上架后用戶粘性和活躍度都特別高。
功能的核心價值,就是把用戶的使用體驗(yàn)做到了極致,還由此沉淀出了社區(qū),以瀑布流形式呈現(xiàn)內(nèi)容,衍生出了各種各樣的玩法。
現(xiàn)在我們可以把你身邊各種東西,平面的、立體的、虛擬的、實(shí)物的都變成“活靈活現(xiàn)的存在”。萬物可以“開口說話”,AI可以“開眼理解”,世界可以“活靈活現(xiàn)”,也可以像真實(shí)事物一樣發(fā)生行為,孩子們用的時候會有一種沉浸式的感覺。未來“刷空間”會成為一種新的時尚,這里的空間是虛實(shí)融合的,甚至是分不清真實(shí)還是模擬的世界。
我自己叫它“萬物有靈”。一是開口,二是行動,讓所有物體看起來像真實(shí)發(fā)生在孩子們身邊的事物一樣。
之后,我們還會把對家長有價值的功能和對孩子有樂趣的功能拉通。這樣做家長會更好地了解孩子的興趣愛好,會和孩子一起成長。
Q:現(xiàn)在新一代的AI硬件都會講求新的個性化和交互體驗(yàn),做好這些需要技術(shù)基礎(chǔ)。靈宇宙是怎么做的?
顧嘉唯:我們做了非常多的技術(shù)創(chuàng)新和優(yōu)化,其中最關(guān)鍵的一點(diǎn)是數(shù)據(jù)。做 Luka 的時候,我們積累了非常多繪本的數(shù)據(jù)集,算是全球最大規(guī)模之一的繪本內(nèi)容。
![]()
*Luka繪本閱讀機(jī)器人
繪本很好的一點(diǎn)是:它是人類知識和信息的濃縮。
我們做 Luka 的“通用講讀”時,就不是走老路——圖像識別、調(diào)音頻、OCR 轉(zhuǎn) TTS 這一套,而是直接上了遷移式學(xué)習(xí),做成“通用泛化講讀”。這樣做的好處是,把圖像都結(jié)構(gòu)化一遍之后,就能讓所有內(nèi)容"活過來"。
現(xiàn)在我們在這些繪本內(nèi)容上做了一層結(jié)構(gòu)化訓(xùn)練。任何一本繪本、百科書、教材,它都能理解里面的內(nèi)容、關(guān)系,然后用一個視頻生成的 Lora 模型——核心是視頻生成的可控性和物理引擎的理解——就能主動推理成“會動的畫面”。
也就是,我們做了一個基于物件、動作、行為、環(huán)境的空間交互行為大模型,產(chǎn)品可以基于自己看到的內(nèi)容推理,實(shí)時生成視頻。比如孩子問了一個這道題怎么做的問題,小方機(jī)就可以把這些東西演出來,同時也推理出來,而不是直接給你答案。
有了這些技術(shù)基礎(chǔ),我們的產(chǎn)品只要打磨好,就能迅速鋪量。小方機(jī)在雙十一的排行榜上好幾個第一,618也是第一,這些都是過去積累下的產(chǎn)品技術(shù)結(jié)果創(chuàng)造的商業(yè)價值。
這種思路給了產(chǎn)品很多功能上的創(chuàng)新體驗(yàn)。比如我們可以和很多老師合作,做出獨(dú)有的、專有的內(nèi)容。我們也可以讓孩子和他日常最喜歡的玩具/寵物/各種角色/甚至他的阿貝貝互動。
在故事機(jī)那個時代,我們是繪本內(nèi)容里做真實(shí)場景數(shù)據(jù)閉環(huán)做最多的公司。現(xiàn)在時代給了一個窗口期,讓我們基于之前的積累,能做新的事情。
AI時代的步步高,阿爾法世代的社交貨幣
Q:聽起來小方機(jī)背后有很多技術(shù)打磨。如果總結(jié)一下,你覺得哪些是最重要的?對產(chǎn)品功能影響最深的?
顧嘉唯:在這些功能背后,關(guān)系算法和空間AI交互是我們的技術(shù)核心。
抖音時代,內(nèi)容是通過推薦算法出現(xiàn)。現(xiàn)在我們做了一套“關(guān)系算法”,讓產(chǎn)品與用戶有伙伴關(guān)系式的記憶,所以各種小方機(jī)里的IP、內(nèi)容會主動和用戶打電話、發(fā)自己的朋友圈,建立情感依賴和信任。這種價值厚度,是很多產(chǎn)品都沒辦法比擬的。
還有空間AI交互。它能讓用戶在各種地點(diǎn),把物理世界變成可操作的界面,現(xiàn)在能實(shí)現(xiàn)拍攝后讓東西動起來,之后還可以更深一步交互。
這種就是萬物有靈的體現(xiàn),也是公司的理念:World as prompt,World as interface。
![]()
Q:所以你會說,小方機(jī)是阿爾法世代的“抖音/小紅書”?
顧嘉唯:沒錯。孩子們會擁有屬于自己的新時代內(nèi)容,比如AI朋友圈,里面有真人,也會有AI,但確實(shí)是圍繞孩子"關(guān)系"的朋友圈。
舉個例子,孩子去植物園,可能就會有"人"在小方機(jī)里發(fā)一條達(dá)爾文小時候去植物園的故事朋友圈。再比如,孩子拍了一張圖片,可能會想和曹老師討論里面的知識,也可能會請"3D繪畫喵"幫忙生成一張畫。所以,一切內(nèi)容和形式都是圍繞著他們的生活定制的。
而且,我們有關(guān)系算法、有記憶,這些角色會隨著孩子成長也一起成長,就和在小方機(jī)里“養(yǎng)崽”一樣,也就是把內(nèi)容變成主動的、個性化的模式。目前我們最關(guān)注的事情之一,就是用戶產(chǎn)生的人均AI互動內(nèi)容。現(xiàn)在這個數(shù)據(jù)的增長速度非常快,都是AI和用戶共同創(chuàng)作出來的內(nèi)容。
這些設(shè)計(jì)對家長也有好處,家長會提前發(fā)現(xiàn)孩子的興趣愛好。他會知道孩子對什么東西感興趣,從一個啟發(fā)式的小興趣點(diǎn)的開始發(fā)掘,可以慢慢變成孩子真的擅長的事情。
Q:和現(xiàn)在的抖音相比,它最大的區(qū)別是?
顧嘉唯:張一鳴當(dāng)年做的推薦算法,所有內(nèi)容都在云端通過算法連接給用戶。內(nèi)容通過用戶的點(diǎn)擊、停留時長分發(fā)。
但我們今天有AI,有個性化生成,真的能做到完全的千人萬面。每個人看到當(dāng)下的內(nèi)容,就是基于當(dāng)下的內(nèi)容生成,專門給到這個人的。它們是完全基于每個個體的內(nèi)容。
所以,這波 AI 會完全做到極度個性化,甚至未來,界面都是實(shí)時生成出來的,這就又回到關(guān)系算法,我們還可以基于這個角色和用戶的關(guān)系來生成內(nèi)容。這樣做之后,小方機(jī)里的每一個角色就會有成長體系,匯聚起來真正成為個性化、無窮盡的新時代抖音。
Q:做抖音還需要運(yùn)營和各種內(nèi)容供給的機(jī)制。靈宇宙是怎樣設(shè)計(jì)的?
顧嘉唯:過去已經(jīng)出現(xiàn)了非常多優(yōu)秀的教育、娛樂內(nèi)容,我們現(xiàn)在可以用AIGC重新交互一遍。除了我們在靈宇宙現(xiàn)在有一個"造人、造景、造記憶"的技術(shù)中臺和分發(fā)端 AgentNET,這套方案能讓外部開發(fā)者的產(chǎn)品進(jìn)入小方機(jī),類似智能手機(jī)里的 App Store,能讓我們LingOS上的內(nèi)容和功能都更豐富。
就像憤怒的小鳥之于iPhone一樣,我也要找到自己的下一個“憤怒小鳥”。它不太可能會在第一天出現(xiàn),但我要把靈宇宙的App Store搭好,這樣才會產(chǎn)生更多玩法。
最終目標(biāo):真機(jī)數(shù)據(jù)讓萬物有靈
Q:聊聊靈宇宙這輪的融資吧。這次拿這些機(jī)構(gòu)的錢,原因是什么?
顧嘉唯:這次的融資,你能看到,很多都是有戰(zhàn)略價值的“深口袋”的錢。
這些“深口袋”資本,不僅資金充裕、周轉(zhuǎn)周期長,耐心也很足。這種資本的核心價值在于兩點(diǎn):一是能持續(xù)加注資金,二是明白消費(fèi)硬件絕不是靠“燒錢”做起來的。
過去SaaS模式或互聯(lián)網(wǎng)的燒錢玩法,在消費(fèi)硬件領(lǐng)域根本沒有這樣成功的案例。像影石、大疆、拓竹、Plaud,沒有一家是燒錢燒出來的。甚至,即便蘋果做iPhone,靠第一款產(chǎn)品就爆火也是很難的。
所以硬件行業(yè)有自身規(guī)律,我們需要找到這樣的耐心資本,一步步打磨產(chǎn)品體驗(yàn),實(shí)現(xiàn)健康的現(xiàn)金流增長。那種ROI算不過來、退貨率高還硬撐的模式,肯定是難以為繼的。
這輪融資之后,我們彈藥非常充足,會持續(xù)招聘有邏輯、有韌性和有自驅(qū)力的年輕人,擴(kuò)充品牌、營銷、分銷等方向。業(yè)務(wù)方面,我們會出海,也會在明年發(fā)布新的離身/分體產(chǎn)品。
Q:不僅消費(fèi)級AI硬件,靈宇宙要做新一代硬件OS,也是一件長期的事。另一個疑問是,靈宇宙要生成個性化、可互動的世界,看起來和李飛飛的空間智能目標(biāo)類似?
顧嘉唯:之前在硅谷工作時,我和李飛飛老師的交流也很多。ImageNet 出來后,深度學(xué)習(xí)遇到了瓶頸,我們當(dāng)時都在找新的解題思路,核心其實(shí)是想實(shí)現(xiàn)兩個維度的突破:
一個是“數(shù)字孿生”類的合成能力。比如有了圖像后,能不能通過不斷推演,加速內(nèi)容生成,最終做出原來的實(shí)景中沒有的內(nèi)容。
另一個是真實(shí)場景數(shù)據(jù)的挖掘。這條路以前沒有AI的壓縮能力,像我們當(dāng)年在微軟做的Life Camera,雖然能胸前掛著記錄一整天,但既沒法高效查看、總結(jié),又因?yàn)橐曨l存儲量太大,根本存不下,更別說實(shí)現(xiàn)“生命日志”、“生命流”的回溯,進(jìn)而打造個人分身或助理了。但現(xiàn)在的AI,讓這件事變得可行了。
所以現(xiàn)在有兩條路徑在并行:一個是仿真路徑,這個方向NVIDIA這類有大算力、強(qiáng)資源的公司肯定是最強(qiáng)的。另一個是真機(jī)數(shù)據(jù)路徑,我覺得這條線有機(jī)會創(chuàng)造新價值,現(xiàn)在Meta也在走,還把相關(guān)實(shí)驗(yàn)室和具身實(shí)驗(yàn)室合并,并行拓展數(shù)據(jù)源——這和特斯拉FSD當(dāng)年的思路同源。
我為什么做這個路徑,因?yàn)楫?dāng)年Mobileye的聯(lián)創(chuàng)Ziv給了我很大啟發(fā),他想做OrCam(盲人眼鏡上的攝像頭),靠記錄盲人的視覺需求收集真機(jī)數(shù)據(jù),理解人如何操作物理世界。
雖然當(dāng)時沒有ScalingLaw、Transformer這些技術(shù),想法沒法落地,但就像科幻電影里描述的,從文本數(shù)據(jù)到聯(lián)網(wǎng)獲取監(jiān)控、攝像頭數(shù)據(jù),再到滲透物理世界,這個概念很打動我。
2014年凱哥(地平線創(chuàng)始人,百度IDL深度學(xué)習(xí)實(shí)驗(yàn)室創(chuàng)辦人余凱)帶我進(jìn)入深度學(xué)習(xí)領(lǐng)域,我們打造的百度大腦,從圖像識別到自動駕駛,從眼鏡到機(jī)器人,嘗試過各種,其中百度BaiduEye,核心就是想打通線上線下,通過設(shè)備鋪量收集物理世界的真實(shí)數(shù)據(jù)。到了現(xiàn)在這個節(jié)點(diǎn),兩條路徑開始耦合,涌現(xiàn)真實(shí)世界智能的可能性越來越大了。
所以,我現(xiàn)在想做的,就是靠設(shè)備鋪量,補(bǔ)全具身智能和空間智能缺失的真實(shí)數(shù)據(jù)集,再讓智能涌現(xiàn)。
而且人類的學(xué)習(xí)本就是兩個維度:第三視角去解讀場景、做推理,第一視角去實(shí)踐探索、反復(fù)驗(yàn)證修正。比如孩子眼睛看到拖鞋不在原來的地方,沒了,就會推理說媽媽可能回來了,這個過程特別有意思。我現(xiàn)在想走通的“數(shù)據(jù)南坡”路徑,核心邏輯就是這個。
Q:這個路徑為什么是現(xiàn)在更可能成功?
顧嘉唯:一個人一天要觸碰的東西是非常多的。今天我們有機(jī)會把操作系統(tǒng)變成整個世界,而不是屏幕里的GUI或者PC上的可執(zhí)行文件,那么其實(shí)是有機(jī)會跑通真機(jī)數(shù)據(jù)智能涌現(xiàn)的邏輯的。
以前,GPT使用文本模型預(yù)測下一個Token,那如果能把物件、空間、動作、行為這些維度放在一起做數(shù)據(jù)涌現(xiàn)的話,我覺得,我們是有機(jī)會預(yù)測出下一個行為的。所以,這就是我為什么做Luka的升級和小方機(jī),一個是讓Luka帶手腳和輪足去執(zhí)行任務(wù),另一個是讓小方機(jī)這個隨身設(shè)備構(gòu)建第一視角的交互數(shù)據(jù)集。
之前,這個方向還沒有人做成。甚至從行業(yè)一開始討論這個路線到現(xiàn)在,已經(jīng)有很多當(dāng)年的公司消失了,但這是我篤信的路徑。
更重要的是,現(xiàn)在靈宇宙有Luka盧卡時期的技術(shù)積累,團(tuán)隊(duì)有更多的商業(yè)經(jīng)驗(yàn),可以用小方機(jī)這樣的產(chǎn)品做出AI時代的步步高,這是一個商業(yè)版圖的機(jī)會啟動點(diǎn)。從這里切入,繼續(xù)完善數(shù)據(jù)版圖,是一個很有希望的開始。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.