![]()
清晨 6:45。你的日歷里標注著 9:00 在會展中心的會議。
你還沒起身,Agent 在后臺已經完成了幾輪判斷。
今天氣溫升高了幾度,有點熱;當天場館周邊有大型活動,常走路線預計會很堵;車輛電量還剩 62%,足夠往返。
于是系統自動將出發提醒從原本的鬧鐘時間提前至 7:20,同時將車內溫度預設為 22 度,打開你慣常收聽的晨間播客。
等你下樓、走出電梯、拉開車門,車已經像剛剛被人收拾好一樣,溫度合適,路線妥當,內容也備好了。
你沒有按按鈕,也沒有說一句話,可它已經知道該做什么。這大概就是今天人們對 AI Agent 最具體、也最迷人的想象。
![]()
▲《鋼鐵俠》中的賈維斯就是這種幻想的終極表達
它不再只是網頁上的一個對話框,不再只是你輸入一句、它回一句的機器人。
它開始離開屏幕,走進物理世界,替你處理那些原本需要手、眼、耳同時介入的小事。
聰明的 Agent 撞上了「墻」
過去一個多月,這種科幻般的想象突然變得觸手可及。即便平時不太關注 AI 的人,大概也刷到過那個頻頻出圈的「龍蝦 OpenClaw」。
與過去那些只會聊天的 AI 不同, OpenClaw 這類工具看起來更符合大眾腦海中「真正的 Agent」的形象,它能接管鍵盤和鼠標,在終端后臺運行,直接調用系統 API 干活。
有人讓它寫代碼,有人讓它定時整理郵件、規劃待辦事項,還有人干脆把查航班、選座、值機這一整套雜活全扔給它。它就像一個永不下班的超級實習生,動作快、能力強,理論上什么活兒都能接。
![]()
但熱潮來得快,退得也快。 算力配置昂貴、調用成本高,加上脆弱的安全默認設置,想要將其轉化為穩定的生產力,中間還隔著重重門檻。
因此,輿論在很短時間里完成了一次反轉,先是「第一批靠龍蝦賺錢的人出現了」,接著就變成「第一批龍蝦受害者出現了」,再后來,甚至有人開始花錢請人上門卸載。
手機端的 Agent 們也是類似的情況,能自動比價、下單、甚至發微信的豆包手機,剛一露頭,就被各大平臺聯手設限。
![]()
屏幕里的 Agent 明明已經很聰明,卻總在最后一步碰壁。這堵「墻」,有時是系統權限,有時是封閉生態,有時則是巨頭們的商業利益。
這一困境恰好反襯出另一個硬件終端的巨大潛力——汽車,反而成了 Agent 最有可能率先落地的場景。
這件事頗具歷史的諷刺意味。
新能源汽車剛興起時,業界幾乎一致認為,智能汽車會是繼智能手機之后的下一個超級硬件入口。
那幾年,車企的宣傳口吻與手機廠商如出一轍:自研 OS、封閉生態、應用商店、開發者平臺、爭奪用戶停留時長。
大家都把車做成「帶輪子的大手機」。奔馳、寶馬、大眾都在講自己的車載系統,吉利和沃爾沃成立億咖通,比亞迪也早早就開放了自己的車載 SDK。
那時的大家都有一種很熟悉的樂觀,好像只要把手機那套再復制一遍,中控屏就會成為新的黃金地段,廣告、分成、增值服務都會順著這些流進來。
![]()
▲ 各種各樣的車載應用
但車終究不是手機。
車企們后來發現,除了導航和在線音樂,大多數車載 App 的活躍數據都慘不忍睹。沒人真想在車里打游戲,在車機上購物總覺得別扭,短視頻一上線就被安全監管盯上,連看起來極具想象空間的「車載 KTV」,實際使用率也遠不如宣傳的那般熱鬧。
畢竟,人開車上路是為了出行,而不是為了操作一塊屏幕。
手機是一個能獨占注意力的設備。你低頭看屏幕、滑動手指,整個人都可以沉浸其中。但汽車不行,尤其是在駕駛過程中,駕駛員的眼睛必須注視路面,雙手必須控制方向盤。
在時速 120 公里的高速上,視線只要離開路面 2 秒,車輛就已經向前飛馳了 67 米。在這 67 米的盲區里,足以發生任何意外。
車主們也很快意識到了這一點,為了打開座椅通風,居然要在屏幕里翻找二級菜單。這種看似「先進」的設計,真到了路上只會讓人暴躁。
正因如此,智能座艙的發展軌跡并沒有沿著「繁榮 App 生態」這條路繼續走下去,而是幾乎直接跳躍到了另一場革命:由大模型驅動的交互變革。那些曾被寄予厚望的車載 App,還沒來得及開花結果就被邊緣化了。
![]()
▲ 車企們逐漸恢復了物理按鍵
手機做不到的,汽車天生就會
舞臺的新主角換成了 Agent。它不再強調「我能給你提供多少個入口」,而是主打「我能替你把事辦完」。
2019 年,小鵬 P7 曾把「全場景語音控制」作為一個極其亮眼的賣點。當時的評測經常演示這樣一個場景:車主說一句「我有點冷」,空調溫度就會自動調高 2 度。這在當時無疑是巨大的進步,比手動戳屏幕方便得多,也更有未來感。
但在工程邏輯上,它背后依然依賴著一張預設好的「語句—指令」映射表。系統聽到「我有點冷」,就在代碼表里匹配到對應選項,執行「空調升溫 2 度」。這更像是一本厚厚的詞典,翻頁速度很快,但毫無思考能力。你說對了觸發詞,它就響應;你稍微換個說法,它就開始「我還不會哦」。
![]()
▲ 你好小 P
不過很快,我們將迎來具備主動感知能力的 Agent,它將開始能夠理解意圖,具備主動感知能力,并能跨系統編排復雜的動作。
它不會傻等著你發號施令,而是像一個資深的管家,平時就在一旁默默觀察、聆聽和記錄。比如你說「今天心情不太好」,舊系統往往會禮貌地失靈,或者只是給你一點心靈雞湯。
因為這句話不對應哪一個明確按鍵。可 Agent 可能會聯想到情緒、環境、偏好之間的關系,自己把音量調低,把氛圍燈收暗一點,切一首沒那么躁的歌。它不一定每次都猜得完全準,但它已經不再只是在執行口令了。
騰訊之前展示過一種場景感知型 Agent,可以結合時間、地點、用戶習慣主動給建議,也能接入點餐、停車繳費這類服務。
![]()
還有一些座艙 Agent 的預研方向,已經能識別后排乘客是否睡著,然后自動降低后排音量,微調溫度,甚至改變出風方式。
想象一下,一家人周末出門,車開在高架上,后排的小孩睡著了,傳統語音系統需要你說一句「把后排空調調小一點」。
真正的 Agent 卻可能自己判斷出,這時候要做的不是一個動作,而是一串連貫動作:把后排音響關小,調一下空調風向,稍微降低車窗透光率,讓后排光線別那么亮;底盤切到更柔和的模式,把細碎顛簸過濾掉;如果智駕開著,再順手把跟車策略調保守一點,讓加減速更平滑。前排的大人甚至沒有意識到自己下達過什么命令,車廂已經默默把環境改好了。
這就不再是一個功能在工作,而是整輛車作為一個整體,完成了一次從感知到響應的閉環。
![]()
這種真正讓汽車和其他終端拉開差距的,是跨域協同的能力。
過去汽車的電子電氣架構,像一座分租出去的大宅子。座艙域管娛樂、空調、座椅;底盤域管懸掛、制動、轉向;智駕域管 ADAS 和自動駕駛。每一層都有自己的邊界,彼此之間不像一間房那樣自然貫通。
舊式語音系統,通常只能在某一個域里做單點操作,說白了就是隔著門傳話。而 Agent 不一樣。它收到的往往是模糊意圖,卻能跨過幾扇門,把幾個系統一起調度起來。
也正因如此,汽車可能是今天所有終端里,最適合 Agent 落地的那個容器。原因就在于它足夠統一,足夠封閉,也足夠可控。
![]()
一個典型的反面例子是智能家居。
搞過裝修的朋友都知道,家里的電器,空調是一個牌子,燈是一個牌子,窗簾電機又是另一個牌子,音箱和門鎖也各玩各的協議。
看上去你買的是一套「智能生活」,實際到手常常是一堆彼此不怎么來往的設備。
Matter 協議 2022 年就出來了,試圖給這個行業造一門通用語言,但各家廠商在底層依然固守著私有接口和數據壁壘。
所以現在智能家居最順的體驗,往往還是「全家桶」。
![]()
手機端面臨的困境也大同小異。你想讓手機助手點杯咖啡,再去微信提醒朋友,最后切到高德導航,聽起來就 3 步,背后卻牽涉到幾家超級 App 之間漫長而脆弱的利益博弈。任何一方覺得吃虧,鏈路就會中斷。
相比之下,汽車的情況簡單得多。至少在車內這個封閉世界里,規則主要由車企自己說了算。底盤、空調、音響、座椅和燈光,天生就生長在同一張網絡里。
當然,汽車座艙也并非烏托邦。它的使用場景更加集中,核心永遠圍繞出行、駕駛和在途體驗,這使得 Agent 在車內比在手機上更容易構建出穩定的上下文邏輯。
但相應的,它的試錯成本也高昂得多。智能家居誤判最多半夜亮燈;車上的 Agent 一旦觸及安全控制權發生誤判,后果不堪設想。
![]()
從「坐在車里的你」,到「完整的你」
近年來,中國新能源汽車市場的競爭日趨白熱化,硬件層面的差距越縮越小。如今真正能拉開代差的,反而是智能化體驗。
加上中國用戶對新技術的接受度極高,這幾股力量匯聚,形成了一個罕見的加速器。這也是為什么近兩年來,最激進、最具規模的 Agent 上車實踐大多發生在中國。
然而,當車內 Agent 進化到一定階段后,很快又會面臨新的瓶頸,它僅僅認識「坐在車里的你」是遠遠不夠的。
它知道你喜歡聽什么歌、習慣多少度的空調,這很有用,但還太淺。它還得知道你昨晚幾點入睡,明天幾點開會,最近常去哪里,何時最不想被打擾。
它需要把你當作一個生活在連續時間軸上的「完整的人」來理解。
這正是華為、小米這類擁有全場景生態體系的玩家最大的優勢所在。他們的野心不止于「車里的 Agent」,而是要構建一個跨越不同終端的「個人 Agent」。
上周,小米推出了移動端 AI Agent 測試產品 Xiaomi miclaw,基于自研 MiMo 大模型構建,核心目標是驗證大模型在「人車家全生態」中的任務執行能力。
![]()
Miclaw 以系統應用身份運行,可深度調用超過50項手機底層能力,涵蓋短信、日歷、相機乃至米家智能家居設備實現從「對話」到「執行」的跨越。
更值得關注的是它采用「自進化」設計,支持文件級記憶、子智能體創建和 MCP 服務接入,能自主設計記憶系統、創建專業分工的子智能體,用得越多,就越懂用戶的偏好與習慣。
雖然 Miclaw 還沒有完成人車家全生態的接入,但趨勢已經相當明顯,你在不同設備上留下的行為數據,將被拼接成一條完整的生活軌跡。
![]()
▲小米 Claw 的部分功能
這時,文章開頭描繪的那個清晨場景就不再是科幻電影,而是越來越多人的日常。
Agent 掌握了你的日程、習慣和生理狀態,于是悄無聲息地提前了喚醒時間,重新規劃了路線,并為你布置好了舒適的座艙環境。
技術發展的最終形態,經常會出現一種有趣的「反轉」,最成熟的技術,往往既不科幻,也不性感。
蒸汽機剛發明時,所有人都盯著那股噴涌的巨大白汽;而當電力真正普及后,人們反而很少低頭去留意墻里的線路。
![]()
Agent 亦是如此。它真正動人的力量,不在于把人訓練成更加熟練的機器操作員,不在于逼迫你熟記更多的喚醒詞和口令;而在于它能不動聲色地將你從繁瑣的操作中徹底解放出來。
未來的汽車依然是那輛汽車,方向盤、座椅、車窗和輪胎都還在。但它已經開始理解你的生活節奏,記住你的個人偏好,默默替你打理好那些原本需要你親自動手、動腦去安排的每一件小事。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.