![]()
文 | 闌夕
在全民「養豬」龍蝦的熱潮尾聲,千問宣布實裝了「AI打車」的skill,對比起來,有種未來主義向現實主義回歸的基本常識。
從排隊安裝到付費卸載,短短十來天的時間,OpenClaw在中文互聯網就走過了從入門到入土的全生命周期,著實抽象。
除了鋪天蓋地的FOMO之外,缺少使用場景其實是被廣泛忽略的最大問題,在費盡心力的完成配置完之后,對著命令框,大多數人可能依然處于腦子一片空白的狀態,不知道讓它做什么好。
最后只好安排龍蝦給自己做個新聞簡報之類,姑且不論這個活兒其實主流AI助手都能辦到,燒掉幾十萬Tokens就為了證明自己用上了龍蝦,代價未免也太高了。
這就是我反復說過的,如果你不是已經把AI助手的能力榨取到了極限,極限到它已經無法滿足你的需求——要知道,連頂級數學家陶哲軒也都還在使用網頁版的ChatGPT——否則其實就用不上那些工程化的新品。
何況AI助手本身也在工程化,打個不恰當的比方,在撒腿跑步之前,先學會好好走路,可能才是AI連接普通用戶的最好路徑。
怎么說呢,看多了拔苗助長的行業躁動,千問繼續擴大辦事能力半徑的做法,反而更加顯得眉清目秀起來了??
打車當然是辦事的,但它和點奶茶、買東西不太一樣的是,帶有更大的非標性,和更低的容錯率。
AI幫買奶茶,如果點錯了或者買少了,對于用戶來說固然糟心,但也不是完全不能接受,但AI幫忙打車,把目的地選錯了,甚至耽誤了航班,必然引起「天塌了」級別的暴怒。
而且,打車的變量不止是起點和目的地,千問能做的事情,還有「不要臭車」「30塊以內」「定時預約」這些個性化需求的滿足,確保言出法隨的體驗。
我自己就模擬出了一整套通勤流程,由于平時就是高德地圖的高頻用戶,有了家和公司的預設地址,可以說不存在任何遷移成本,甚至半路想起來要買東西的臨場需求,千問都能一一實現。
![]()
下班也是一樣,對用戶意圖的識別和匹配相當精準,包括付款在內的整個流程都不需要跳轉其他APP。
![]()
工程學的難度及其原理在于,流程可以做加法,結果卻是做乘法,每個步驟的成功率是95%,看起來很高,十個步驟連在一起,成功率就連60%都不到了。
這也是為什么我對千問死磕辦事的評價一直很高,因為它是真的在以一己之力推動AI在真實世界贏得用戶信任這件事情。
當AI變得越來越油——在指出它犯了錯誤之后,「你說得對」成了它屢教不改的開場白——這反而強化了AI在通用場景里只適合完成開放性任務的刻板印象,但凡對準確度有所要求,AI的可信度就急劇下降。
所以才有「人工智能不如能工智人」的段子??
而千問正式上線以來的每一步,都是在把AI從近乎無限的免責區拉出來,拒絕延續「它還是個孩子」的寵溺。
重要的是,千問想做成的事情,向下有多扎實,往上就有多壯麗。
ChatGPT也能調用Uber,但是只有用了之后,才知道距離「一句話打車」的理想體驗有多遙遠:
必須指名Uber的應用,必須完整寫出明確指令——少一個字都不行——必須跳轉到Uber的App里完成下單,整個過程充滿了「脫褲子放屁」的多余感。
這當然不是模型不中用,ChatGPT再怎么強大,它也無法去管理Uber的運行數據,兩款產品通過有限的接口互通,博弈下來的成果就是,AI依然只能在它的「一畝三分地」里行動,只要涉及到第三方應用的,就還是要把流量和履約都挪過去。
也確實是難為AI了,模型的智商再高,也處理不了這些復雜的人情世故啊??
而千問能夠擺平同樣的問題,原因還是在于阿里的自有生態足以支持服務供給,而且不光是客觀上「有」,更得是主觀上「能」。
無論是用千問點奶茶也好、打車也好,響應的都是阿里自家生態產品,此時發揮出來的體制優勢,或者說「集中力量辦大事」的戰略高度,讓阿里不必重復OpenAI的窘迫。
從千問已經能夠支持的混合任務來看,阿里是真的把入口做了「AI優先」的重新設計,可以一句話打車,不代表只能一句話打車,事實上,用稍微復雜的表達,讓千問先訂電影票、然后以規劃時間為前提去幫打車、最后在電影結束后預約一輛回家的車,都是可以實現的。
而在這個過程中,檢驗的不只有模型自身的能力,還有千問對于工具的使用,它能像人一樣,去地圖里查看路線,去計算合理的日程,去預判網約車的接送時間。
還是那句話,但凡錯一項,給用戶體驗的損傷,都是毀滅級的。
這才是隨著千問的一次次升級,創造出來的開創性價值,它在做的事情,同行要么避而遠之,要么舉步維艱,對阿里來說也不可能立刻帶來特別突出的經濟效益,但千問偏要把這塊硬骨頭給啃了,不為別的,就是任性。
這會讓人想到1923年「紐約時報」追問登山家喬治·馬洛里為什么堅持要冒著生命危險去爬珠穆朗瑪峰時,后者甩出來的那句言簡意賅的回答:
「因為山在那里。」
是啊,山就在那里,作為一個職業的登山者,是不可能騙自己沒看到的。
如果阿里真的相信AI是當代正在發生的工業革命這個敘事,真的相信千問模型是開源之光、是能和頂級模型打得有來有回的資質,那么承擔為整個AI行業向前探路的使命,也就是一種必然,而不是選擇。
從買一杯奶茶,到打一輛車,千問在逐漸打出產品心智的同時,還在落實著AI之于主流用戶的安全性。
這里的安全性,在于放心委托AI替自己辦事,第一次可以是嘗鮮,第十次、第一百次就是習以為常的生活方式了。
所有的技術進步,遲早都要邁過這一步,現在的年輕人可能不知道,當計算器和電子秤最初被應用到菜市場等場景后,很長一段時間里,消費者不會輕信機器上顯示的數字,一定要自己心算過一遍才踏實。
也許,當下看過去有多滑稽,未來看當下就有多著急。
就像「阿瑪拉定律」所說的:「我們總是高估一項科技所帶來的短期效益,卻又低估它的長期影響。」
AI是一個過度炒作的行業嗎?很難否認。
誠實的說,正是因為許諾的太多,實現的太少,以致于前沿與大眾之間的割裂感過于嚴重。
但也有千問這樣,一步一個腳印的,把吹過的牛逼挨個實現的產品,并在長期的尺度上,對齊AI的智力和行動力,這就夠了。
凡是過往,皆為序章。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.