我有一個暴論,那就互聯(lián)網(wǎng)領(lǐng)域什么事我堂哥開始關(guān)心了,那這個事大抵就出圈了。
小字廣告是這樣,豆包手機也是這樣,因為我哥之前是不關(guān)心這些的,短視頻能推送給他,說明已成熱門話題。
不過,在說豆包手機之前,我準備先說說名氣沒那么大,或者說還沒有出圈的豆包語音輸入法。
![]()
這款剛出的輸入法目前功能較為簡單,主打語音輸入功能,尤其是在方言、嘈雜環(huán)境和弱網(wǎng)無網(wǎng)條件下,表現(xiàn)驚艷。
其實,不只是豆包,智譜也出了款語音輸入法,叫做小凹,目前僅限MacOS平臺,從功能上看,與國外大火的Typeless更為接近。
![]()
豆包、智譜,加上我之前分析過的,輸入法這個很小的細分領(lǐng)域突然間變得熱鬧起來。
要說做輸入法的好處,顯然有很多。
比如入口卡位。
輸入法是一個高頻且長時的交互入口,其數(shù)據(jù)價值不言而喻,不但可以獲取用戶行為軌跡記錄,而且還可以作為AI訓練的燃料庫,更不用說從中分析用戶數(shù)據(jù)得來的商業(yè)價值。
再比如交互方式變革。
我叫兒子練習打字,他很是抵觸,說直接語音輸入不就好了。想想也是,當年前輩逼我練五筆,我也執(zhí)拗地選擇了拼音,而今語音輸入顯然是下一代的主要交互方式,做輸入法實際上也就是在搶占以后的交互定義權(quán)。
當然,最重要的是打破APP孤島。
現(xiàn)在各大APP都想打造成超級平臺,客觀上也造成了孤島化,而輸入法是打通這些孤島的物理開關(guān),比如豆包輸入法可以調(diào)用剪映,微信輸入法可以調(diào)用閱文內(nèi)容、QQ音樂和混元大模型等。
但這只是打通了自家的內(nèi)部產(chǎn)品,所以,豆包手機要做的,是跨產(chǎn)品的調(diào)用。
所謂豆包手機,其實是內(nèi)置了豆包助手的中興Nubia M153 AI手機,最大的亮點在于“所言即所得”,也就是只要對豆包助手說出需求,它就能幫助點外賣、發(fā)微博、選歌曲等功能。
![]()
圖片來源于池建強老師
比較激進的是,豆包助手不是調(diào)用上述產(chǎn)品的API接口,而是模擬人類手指行為直接操作這些APP。
這讓我不由得想起去年在硅谷紅極一時的“AI硬件黑馬”,曾開發(fā)過“渡鴉科技”的呂騁做的Rabbit R1。
![]()
Rabbit R1 就像是一個“云端的超級外掛”,通過把所有操作放到云端服務(wù)器上“模擬點擊”來規(guī)避了手機端的權(quán)限限制,但也因此留下了巨大的隱私和法律隱患,再加上當時的AI能力反應(yīng)速度極慢,現(xiàn)在已處于產(chǎn)品打折、公司欠薪的狀態(tài)。
現(xiàn)在豆包的AI能力已經(jīng)不成問題,但這種模擬點擊操作的方式仍然遭遇微信、手機銀行、電商、游戲等多個APP的強制退出。
其實,豆包手機已經(jīng)做到了“戰(zhàn)略上大膽、戰(zhàn)術(shù)上小心”了,按理說收購了錘科的字節(jié)完全有能力自己造手機,但還是選擇了與第三方合作,在發(fā)布時也一再強調(diào)這只是工程樣機,不算是正式產(chǎn)品。
只不過對隱私的擔憂和對利益的觸碰還是繞不過去,畢竟,觸動利益比觸動靈魂還要困難。
但是,從輸入法到手機,豆包的嘗試不會停止腳步,畢竟,AI agent 已是大勢所趨,對入口和場景的搶奪戰(zhàn),才剛剛開始,而AI手機,只是眾多載體中的一個選擇。
而豆包,不過是第一個吃螃蟹的人罷了。
延伸思考:輸入法能進化成
AI agent嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.