![]()
去年12月,Google把Gemini塞進Android Auto的時候,沒人想到這會是一次「換腦手術」。我開了三個月,發現一個反常識的事實:這個在手機上連定時器都設不利索的AI,到了車里反而成了最靠譜的副駕。
數據很能說明問題:Google Assistant處理多步驟指令的失敗率,在車載場景下長期居高不下。而Gemini的接入,本質上給汽車裝了一個能推理的認知層——不是更響的喇叭,而是換了個會思考的大腦。
場景一:導航終于聽懂人話了
傳統車載導航有個老毛病:非黑即白。你要么走A路線,要么走B路線,想中途加個加油站?系統當場死機。
Gemini的處理方式完全不同。上周我從深圳開車去廣州,順口說了句「找條不堵的路,中途加個充電站,別走高速收費那段」。它沒反問「您指的是哪段」,而是直接規劃了一條繞行北環、經停南沙充電站的路線。
Google工程師在1月的更新日志里提過,這是多輪意圖理解的落地——把「不堵」「充電」「避開收費」三個約束條件同時滿足,而不是逐個詢問確認。
老Assistant在這種場景下的標準回復是「我不明白」。現在Gemini的應對是默默算完,把結果甩到屏幕上。
場景二:跨應用的操作鏈
車載場景最煩的不是功能少,是功能散。導航、音樂、消息、日歷,四個App四個入口,開車時切來切去等于玩命。
![]()
Gemini的解法是把操作串成鏈。我試過一個典型場景:「告訴張三我晚到20分鐘,然后放我上周收藏的那個播客,音量調低兩格」。
拆解一下這個動作:先打開消息App找到聯系人發送延遲通知,再跳轉音樂App定位到特定播客,最后調節系統音量。老Assistant會在第一步就卡住,Gemini則能在10秒內走完全流程。
Google把這叫「擴展執行」(Expanded Execution),說白了就是讓AI記住中間狀態,而不是每步都讓用戶確認。這個能力在手機上還沒完全放開,車里反而先用上了。
場景三:模糊指令的推理補全
開車時說話不可能像寫代碼那樣精確。人說「找地方吃飯」,背后藏著一堆隱含條件:現在幾點、附近有什么、偏好什么口味、預算多少。
老Assistant的處理方式是列個列表讓你選,本質上把決策壓力拋回給用戶。Gemini會主動推理:當前時間12:47,判斷是午餐場景;結合歷史記錄,你常去粵菜館;再過濾掉評分低于4.0的——最后推一家「距離8分鐘、現在有位」的選項。
我故意試過一次刁難:「上次去東莞吃的那家,附近有沒有類似的」。Gemini從聊天記錄里挖出三個月前的一家燒鵝店,在當前位置3公里內找到同品牌分店,還備注了「這家店燒鵝口碑更好,但停車難」。
這種「記得住、聯得上、推得準」的能力,靠的是Gemini的長上下文窗口。Google沒公布具體數字,但實測它能回溯至少半年的對話記錄做關聯。
場景四:失敗時的降級處理
![]()
最意外的改進不是成功的時候,是搞砸的時候。
以前問復雜問題,Assistant要么沉默,要么彈出一堆不相關的搜索結果。現在Gemini會明確告訴你「這個我做不到,但我可以幫你做X」——把開放性請求轉成它能處理的封閉任務。
比如我問「這附近有沒有適合拍照的地方,最好有老建筑,人別太多」,它先承認「我無法實時獲取人流數據」,然后補充「但我可以導航到沙面島,那里老建筑集中,工作日人流相對較少,需要查看實時路況嗎」。
這種「部分滿足+明確邊界」的交互,比假裝聽懂然后亂答要體面得多。產品經理把這叫做「優雅的失敗」,但用戶感知到的只是「這玩意兒不裝傻」。
三個月用下來,一個感受越來越清晰:Gemini在車里比在手機里更像一個成熟產品。可能是因為車載場景的需求更聚焦——導航、通訊、娛樂、信息查詢,四個核心場景做深比做廣更重要。也可能是Google終于意識到,開車時用戶輸不起,一次理解錯誤就可能錯過高速出口。
1月的更新里,Google給Gemini加了實時視頻理解和更長的上下文記憶。這些能力還沒完全下沉到車載端,但路線圖已經很明顯:汽車正在成為AI Agent的第一個完整試驗場。
一個值得玩味的細節:Google在官方文檔里把車載Gemini定義為「駕駛專用智能體」(Driving-optimized Agent),而不是「助手」的升級。措辭變化背后,是產品定位的徹底轉向——從執行命令的工具,變成能自主決策的代理。
我還在等一個功能:讓Gemini記住我常走的路線偏好,在沒指令的情況下主動建議「今天周五,往常這個點南環很堵,要不要試試新開通的東曉南放射線」。如果這一步落地,導航和助理的邊界就徹底模糊了。
你最近一次用車載語音助手是什么時候?它聽懂你的真實需求了嗎,還是你不得不放慢語速、換個說法、最后干脆自己動手?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.