![]()
每一個OKR,本質都是對“還能更好”的一次追問。
文/劉宇翔
編輯/王芳潔
他們正在一路向東。
六天前,鄭曉康和老編輯決定上路,他們駕駛小鵬G7從新疆喀什出發(fā),目標是上海,這一程5000公里,計劃全程使用第二代VLA智能駕駛,在完全沒有數(shù)據(jù)積累的戈壁荒漠和車流復雜的十里洋場里相繼驗證——智能駕駛究竟能有多智能?它能開多遠?
至3月16日晚上,兩人抵達了西安,里程表顯示已駛過3000公里,實測結果是,不使用智駕,人每天開600-800公里是上限,非常疲憊,但使用小鵬第二代VLA,單人駕駛可以突破1000公里,并且在風景最美的地方,能偶爾解放一下雙眼,往車外看,飽覽壯美山河。
若在西部游玩,過去的司機想使用智駕系統(tǒng)會面臨一個悖論:在非常極端的1%場景下,不放心用,但剩下的99%場景沒必要用。因為在西部,99%的路一馬平川但風景乏味,1%的路風景最好,但也是挑戰(zhàn)最大的。所以,鄭曉康和老編輯想看看這1%有沒有解決辦法。
有的,兄弟,有的。“只有兩種情況會阻止第二代VLA,”鄭曉康在3月16日的小鵬汽車ASK ME ANYTHING直播連線中,對千里之外的小鵬汽車董事長、CEO何小鵬、小鵬汽車通用智能中心負責人劉先明說,“第一是修路,第二是純粹物理傳感器的極限。”
那是在吐魯番到哈密階段,因為G30連霍高速擴展、擴建工程,分了新舊兩條車道,要切車道,他們接管了駕駛。第二次是遇到了暴雪,暴雪把毫米波雷達覆蓋住后,系統(tǒng)提示要求接管停止智駕。
除此之外,第二代VLA全程沒有讓他們失望。此前,何小鵬曾認為L4級智駕的接管率以千公里計算,而L2級是以百公里計算。
“我可以說印證了你這個觀點,我們使用最長零接管里程,不包含充電和過檢查站,是橫跨兩天,一共是1220公里。”鄭曉康說。
這個結果讓何小鵬感到振奮。一般來說,自動駕駛分為三大場景,大部分是城市級的自動輔助駕駛,其次是園區(qū)自動駕駛,比如在小區(qū)內、停車場內,第三則是純野外場景,包括這次橫穿中國之旅。野外場景的自動駕駛是小鵬汽車在今明兩年重點發(fā)力的領域之一。
春節(jié)期間,何小鵬專門去了趟非洲,那邊沒有路,路得自己開出來,還得避讓可能出現(xiàn)的動物,“如果去一些國家旅游,發(fā)現(xiàn)基本上沒有道路,你就有一輛跑市區(qū)的車怎么開自動駕駛?我在路上不斷想這個問題,將來這個問題一定會解決的,只是需要點時間。”
這是何小鵬在直播中,給劉先明派的一個OKR。
01
極限測試
鄭曉康選擇這條路線,是經(jīng)過深思熟慮的。
“過去做過各種各樣、大大小小的輔助駕駛評測,”他在直播中說,“你越往后做就會意識到,你的評測只能對你所在的城市負責。”
這是規(guī)則驅動時代的“數(shù)據(jù)圍城”。工程師們?yōu)楸本┪瀛h(huán)、上海高架、深圳濱海大道等大城市的道路編寫了無數(shù)條規(guī)則,智駕系統(tǒng)在這些地方表現(xiàn)得像個老司機。但一旦駛出舒適區(qū),比如一個沒有車道線的鄉(xiāng)村路口,或者一個導航數(shù)據(jù)過時的施工路段,系統(tǒng)就會瞬間“失明”,要么降級為L2,要么直接退出。
在鄭曉康和老編輯看來,唯有中國大地上,從中國最西邊的新疆喀什一路開,才是對輔助駕駛系統(tǒng)泛化性能的最終極測試。
泛化性。這個詞在人工智能領域指的是模型在未見過的、與訓練數(shù)據(jù)分布不同的新數(shù)據(jù)上,依然能夠準確預測或執(zhí)行任務的能力。但在劉先明口中,它有了更樸素的解釋:“上線即全場景通用。”
在庫爾勒,鄭曉康做了一個更具挑戰(zhàn)性的測試:用地圖導航隨機打點,讓車輛在陌生城市中自主行駛。結果轉了一個多小時,“跑得非常好”,而那里幾乎沒有小鵬的采集車。
“這可能也可以表明小鵬一方面銷售還需要更加努力,”鄭曉康在直播中開玩笑說,“另一方面我們在這個城市采集的數(shù)據(jù),對小鵬、對第二代VLA都非常有用,這可能是針對場景,針對其泛化性能有說服力的東西。”
“之前我們說只要有小鵬車的地方就能開得很好,現(xiàn)在看起來沒有的地方,好像也可以開,”劉先明在直播中說。他的語氣就像一個老師突然發(fā)現(xiàn),自己的學生在完全沒見過的考題上也能答對。
這種驚喜,源于第二代VLA底層技術范式的根本改變。
要理解”泛化性”為什么重要,需要先理解上一代智能駕駛系統(tǒng)是怎么工作的。
在過去十余年里,自動駕駛的核心方法論是“規(guī)則驅動”。工程師們?yōu)槊恳环N路況、每一個場景編寫代碼:遇到紅燈停,遇到綠燈行,遇到行人減速,遇到施工路段繞行……系統(tǒng)就像一個嚴格遵守交通法規(guī)的新手司機,每一步操作都有明確的”if-then”邏輯。這就像在“在鐵軌上開車”——只要預設的規(guī)則覆蓋不到,系統(tǒng)就會“失明”乃至脫軌。
“過去包括小鵬的XNGP一樣,我們寫規(guī)則,”何小鵬說,“但你會發(fā)現(xiàn),從一線城市到四五六線城市,從中國到海外,特別是到很多沒有交通道路標志的地方,規(guī)則就變成了一個既在中國道路開得好,但在全球開得不好的點。”
但第二代VLA依賴的不是寫死的規(guī)則,而是推理。
媒體人大宇對第二代VLA的測評顯示,當時導航并沒有更新施工封路信息,按照導航提示是讓車子在前面左拐,但突然間看到了封路,就在那個路障前面,車子停頓了14秒,在這14秒里第二代VLA沒有降級也沒有退出,而是在“思考”,然后立馬左轉,及時更新了一條新路線。
研發(fā)團隊并不確切知道在那14秒里,第二代VLA是如何運作的,因為大模型推理依賴思維鏈(CoT,Chain-of-Thought),而不是結構化思維(SoT)。但可以肯定的是,那14秒里第二代VLA在做推理,嘗試推理不同路徑的可行性,并選擇了它認為最優(yōu)解的那條。
這就是第二代VLA架構的核心優(yōu)勢。以視覺為核心,像人一樣觀察世界,無需語言轉譯,直接作出反應。可以直接用海量真實數(shù)據(jù)進行訓練,接近1億的視頻訓練數(shù)據(jù)量,相當于人類司機駕駛65000年才能遇到的極限場景綜合。
這樣的模型框架可以大幅降低信息耗損,讓推理效率更高、反應更迅速。當前行業(yè)內的L2輔助駕駛,都是不同技術方案的縫合產(chǎn)物。高速、城區(qū)、小路、停車場,每一次切換場景都要切換不同的底層邏輯,也帶來了體驗上的割裂感,這種技術路線是無法實現(xiàn)「媽媽也愛開」的安心體驗的。
第二代VLA依賴的是海量訓練數(shù)據(jù),在什么情況下跑得好、跑得不好取決于訓練數(shù)據(jù)分布,小鵬汽車的訓練數(shù)據(jù)來自于所有車主每天正常開的工況,包括雨天、雪天、黑夜。從2024年起,小鵬汽車切換到純視覺路線,更新傳感器、攝像頭,具有更強通光量,動態(tài)范圍更大,給模型泛化性帶來了很好的硬件基礎。
同時,模型的端到端延遲大幅降低,在極端情況下有更好的處理速度,這使得在路面濕滑、夜晚等情況下,小鵬第二代VLA也有非常一致的表現(xiàn)。
要做到這點非常難,從感知角度,攝像頭采集到的視頻流既有物理空間信息,又有時間連續(xù)性的內容,VLA需要基于連續(xù)視頻流產(chǎn)生更好的運動軌跡。在L2級里,大模型“看到”的是分辨率被極度壓縮的連續(xù)的圖片,因為搭載的處理算力有限。而第二代VLA能從L2級直接躍升到L4級,得益于物理AI能力提升。
劉先明在直播中給出了一個核心公式:L4能力 = 模型 × 算力× 數(shù)據(jù)規(guī)模× 本體。
傳統(tǒng)AI主要處理數(shù)字信息(如文本、圖像),而物理AI需要理解并作用于真實的物理世界。小鵬的做法是自研圖靈芯片(算力)、自研VLA模型(模型)、積累海量駕駛數(shù)據(jù)(數(shù)據(jù))、深度整合EEA電子電氣架構(本體)。這四個維度協(xié)同優(yōu)化,才能實現(xiàn)真正的突破。
但這還遠遠不夠,在看到大宇的評測視頻時,何小鵬想的是為什么要等14秒?他覺得等個2秒就應該夠了,大模型的推理速度應該要比人類的推理速度更快,也許1-2秒更smart。
這是何小鵬給劉先明派的另一個OKR。
02
讓媽媽也敢開
技術突破最終要落腳到用戶體驗。關于用戶體驗,何小鵬只給了一個O——也就是目標(objective):“安心感”。
“安心超過了安全,”他說,“安全+放心+省心+舒心,這些放在一起,形成了安心。”
這個理念的誕生,源于一次私人經(jīng)歷。即使何小鵬做了多年智能駕駛,一度他母親還是不太愿意嘗試智駕。何小鵬在直播中回憶,“后來實在坳不過我,戴著安全帶,兩只手抓著右上角的把手,特別緊張。”
那是兩年前,當時市面上的智駕系統(tǒng)時不時傳出突然急剎、加速或者卡死不動的新聞,老人家不愿嘗試情有可原。但何小鵬從那次經(jīng)歷中看到了一個更深層的問題:智能駕駛不能只是“極客嘗鮮”,而要成為“大眾常用”。
“我跟很多朋友在聊,我說:’你買的車有智駕嗎?’他說:‘有,但不開。’什么品牌都有。我問:’為什么?’‘這里不能開、那里不能開,就怕了。’”
這種“怕”,本質上是對系統(tǒng)能力的“不信任”。用戶不知道系統(tǒng)在什么時候會”掉鏈子”,所以寧可自己開。這是阻礙智能駕駛普及的最大心理障礙,它遠比技術更難解決,而第二代VLA的目標,就是消除這種”不信任”。
小鵬汽車內部有一個測試項目叫“灑了嗎”,就是把裝著水的杯子放在車上,啟動智能駕駛,看行駛過程中水會灑多少,灑得很少的,那就開得很好;灑了很多,那開得不好。多位媒體人在測試第二代VLA后反饋:開了1-2個小時,沒有碰到一次重剎。
何小鵬曾邀請好幾位職場媽媽去試駕,她們最開始也非常擔心,但體驗了智駕后,都驚喜于“它什么都懂,而且又比我聰明,比我開得絲滑,比我認真,到處在看,從來不走神,所以她們的情緒很穩(wěn)。”
在何小鵬看來,“情緒很穩(wěn)”是一個非常重要的指標,一個比接管率、通行效率更感性的、更難以量化的指標,它反映的是:坐在車里的人,如若情緒是穩(wěn)定的,那她/他一定是覺得處在舒適、安全狀態(tài)之中,即安心。
安全不僅針對車內人,也包括車外人。最近一個視頻在網(wǎng)上的討論度很高,一位司機駕駛著小鵬汽車正常駕駛時,突然VLA離奇地減速,才提醒他注意路面情況,隨后他發(fā)現(xiàn)了前方路面躺著四個孩子,并及時踩下了剎車。而那四個小朋友之所以躺在大馬路上,僅僅是想模仿減速帶。是的,道路千萬條,你永遠不知道會遇到什么人、什么事。
劉先明在看到那段視頻時,心理很復雜。在事件發(fā)生后,團隊調取了車輛的后臺數(shù)據(jù),發(fā)現(xiàn)第二代VLA確實發(fā)現(xiàn)了前方異常,并減速,只是減速度還不足以馬上剎停。但如果不是第二代VLA及時提醒,司機其實并不知道路面躺著孩子,他只是看到車子自動減速了,才去踩的剎車,事后,他害怕了幾天:如果是自己開的車,可能就以為前面是“減速帶”,直接壓過去了。
根據(jù)神經(jīng)科學和心理學領域的權威研究,人眼看到,大腦分析到做出動作反應,所需時間約200毫秒到數(shù)秒不等,其中在開車時面對一個復雜且危險的突發(fā)情況出做躲避動作,需要500毫秒乃至數(shù)秒,這還不包括車輛根據(jù)駕駛員動作的響應和制動時間。
這是很多交通事故的原因,而智能駕駛的目標就是最大限度減少因人的生理機制而產(chǎn)生的安全風險。“安全是我們做智能駕駛最重要的事情,也是為社會做的最重要的事情。把安全做好,把技術做好,才是真正完美的L4。今天VLA只是減速了,只是在讓路,但它還沒有完全剎停,我們還應該做得更好。”
這其實是劉先明到小鵬后,領的第一個OKR。在其負責智能駕駛的第一天,何小鵬提的要求就是:要保證人的安全,要保證每個人的安全。這次事件也給團隊提了個醒,雖然第二代VLA已經(jīng)很強,但離做到完美還是有距離。
這種對安全近乎偏執(zhí)的追求,源于一個樸素的數(shù)據(jù):全球每年因交通事故直接死亡人數(shù)接近20萬。在廣東省,刑事犯罪中超過40%是酒駕。何小鵬算了筆賬:如果有一天,智能駕駛普及,車跟車之間能夠通訊,互相提示危險,他相信全球每年因交通事故死亡人數(shù)能從近20萬人大幅降低到200人。
這將挽救無數(shù)個家庭,也將大幅度減輕媽媽、新手對于開車的恐懼,并更接受智駕。
第二代VLA發(fā)布后,小鵬邀請了部分員工的媽媽、爸爸們來體驗,“開了15分鐘以后,真的是敢開(智駕)了,”何小鵬說,這些反饋讓他感到特別開心。
“一位媽媽或者是一個新手開智駕,根據(jù)他們的主觀判斷,舒適程度是開普通車的5倍,我給劉先明定的目標是到今年年底再提高5-10倍。”這是直播中,何小鵬給劉先明派的第三個OKR。
03
不止智能汽車
何小鵬最近有點“招人煩”。出差時,他會忍不住挑剔司機的駕駛技術,“切線可以舒緩一點”,沒辦法,他已經(jīng)適應了第二代VLA的絲滑。
但任何傳感器、大模型都是物理極限的。“我們研發(fā)的場景涵蓋了白天、黑夜、晴天、雨天、雪天。但大家一定要記得,人完全不能開的地方,也不應該讓智能駕駛去嘗試。”何小鵬在直播中提了個醒。
讓智能駕駛適應全場景全地形,非常難,涉及到軟硬件各個層面,而小鵬汽車選擇的又是最難的那條路。
和很多車企的“拿來主義”不同,小鵬汽車在所有維度上從頭自研、全面自研,包括自研的圖靈芯片、針對芯片重新設計的模型結構和編譯器、重建的軟件架構,以及自己的AI基礎設施。
這是”華山一條路”啊,鋪路石是決絕般的勇氣和投入。何小鵬透露為了研發(fā)第二代VLA,每個月要花三個億,連續(xù)十幾個月才可能有效果,“當時我也是心里面慌得一批。”
但正是這種破釜沉舟的勇氣,讓小鵬打破了原來的天花板。
在自動駕駛的分級體系中,L2是輔助駕駛,L3是需要監(jiān)督的自動駕駛,L4則是完全自動駕駛。行業(yè)主流觀點認為,這是一個循序漸進的過程。但小鵬的選擇是:跳過L3,直接從L2跨越到L4。
第二代VLA是小鵬汽車邁向L4的第一個版本,小鵬“跳級”的底氣源于大模型改變了一切。純視覺方案以統(tǒng)一視覺模態(tài)提升響應效率與駕駛安全性,搭配大算力、大模型驅動的高質量連續(xù)數(shù)據(jù)流,讓第二代VLA的決策更準。 第二代VLA的“擬人化感知”模擬人眼感知世界、人腦處理信息的方式,讓輔助駕駛系統(tǒng)變得聰明和擬人,也讓一臺車從一個冰冷的駕駛工具,變成一個能被全家接受的“智能體”。
在直播中,何小鵬分享了一個讓他特別開心的細節(jié):自3月11日全國732家小鵬門店全面啟動第二代VLA試駕后,市場反饋遠超預期,不少用戶專程和家人一起到門店試駕體驗,并表示第二代VLA在某些情況下開得比專業(yè)司機還好。
而根據(jù)小鵬汽車官方公布的數(shù)據(jù),在3月2日第二代VLA智能駕駛系統(tǒng)發(fā)布后,小鵬X9 第二代VLA版本的大定占比直接超過了80%,刷新了該車型的版本占比新紀錄。
家庭用戶用腳為更智能的小鵬車型投了一票。在AI時代,汽車不僅要有聰明的“大腦”(智駕),還要有會思考的“小腦”(智艙),甚至要懂得與底盤、動力系統(tǒng)進行跨域融合。何小鵬在2026年年會上明確提出,智能座艙和智能駕駛將技術合流組成超級智能體,汽車正式進入跨域融合的新階段。
“以后你打車去機場,如果無人駕駛,你要跟誰說‘在星巴克門口停一下’?”劉先明用一個例子解釋了跨域融合的必要性。當車內沒有司機,車本身必須成為一個能聽懂人話、理解意圖、并調動所有零部件完成指令的“機器人”。
為了讓“人”上車,小鵬調整了組織架構——將智駕、智艙、動力、底盤整合進一個團隊(One Team),讓車真正成為用戶的智能伙伴。
何小鵬透露,今年二季度,小鵬的整個架構融合將基本完成,三四季度會加速向前推進,讓更多車型的平臺化越來越好。這種能力,正在從汽車向更廣闊的領域延伸。同樣的VLA技術邏輯,正在被用于小鵬的機器人和飛行汽車。在2025年科技日上,小鵬正式升級定位為“物理AI世界的出行探索者,面向全球的具身智能公司”。
在何小鵬看來,有輪子的車、有腳的機器人、有翅膀的飛行器,本質上都是物理AI在不同載體上的演化。而VLA的泛化能力,讓這種跨域遷移成為可能。何小鵬透露,機器人領域的進展超出預期,第四代運控體系與第二代VLA運動體系的解耦,將讓小鵬機器人實現(xiàn)更擬人化的動作。全新一代IRON人形機器人目標是在2026年年底實現(xiàn)規(guī)模量產(chǎn)。
這種從汽車向機器人、飛行汽車的延伸,并非簡單的技術移植,而是基于同一個底層邏輯:理解物理世界、與物理世界交互。這也解釋了為何小鵬敢于提出“從L2直接跨越到L4”的戰(zhàn)略——因為小鵬汽車做了很多跟infra相關的事情,完全用AI解決,積累了大量技術和經(jīng)驗。
第二代VLA和特斯拉FSD都采用純視覺路線,但小鵬有自己的理解和工程實現(xiàn)方式。對于外界關于“中美智駕差距”的熱議,何小鵬在直播中的回答很坦然:中美同處第一梯隊,各有千秋。但中國道路更復雜,這反而給了中國智駕更好的訓練土壤。當攻克了最難場景后再泛化到其他路況,小鵬的VLA就有了走向全球的底氣。
劉先明也補充,近兩年最大的變化是中美AI人才格局的轉變,中國AI人才快速崛起,疊加政策支持、數(shù)據(jù)規(guī)模龐大、用戶接受度高,中國企業(yè)有望在全球物理AI競爭中占據(jù)領先地位。
在全球競爭中,“一般是第一有肉吃,第二有湯喝,第三啥都沒有了”。車企之間的技術軍備競賽是越來越卷了,但小鵬“卷”并不是為了讓賬面數(shù)據(jù)更好看,它的原點,依然是那個讓母親松開了扶手的瞬間。
何小鵬說,技術的本質是讓生活更輕松。
3月19日開始,第二代VLA被將被陸續(xù)推送到小鵬各款車型。這是第二代VLA量產(chǎn)的第一個版本,也就意味著“在未來,它是分數(shù)最低的一個版本,因為我們還在持續(xù)不停地迭代,后面的每一個版本都會不停地向上。”劉先明也自己派了個OKR。
“對于AI、物理AI世界變化的思考,”何小鵬在直播最后說道,“可能都比不上你去我們門店試駕15分鐘,那時你才會相信,無人駕駛真的會在未來幾年到來,機器人會走進家庭,生活會被徹底改變。你試過之后,才會對未來有更新的認識。”
有些認識,確實只有自己去試過才知道,有些路,智能駕駛開過去你就會相信,它將載著人類“一路向東”。
實測視頻參考:
https://mp.weixin.qq.com/s/3o7IXmf2VpE8XCaXDHF00g
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.