337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

警惕VLA“泡沫”,VLA只是錦上添花,并不是“萬能鑰匙”

0
分享至

就在VLA被推上“神壇”之際,博世智能駕控中國區總裁吳永橋給VLA潑了一盆涼水。剛剛結束的2025世界人工智能大會(WAIC)上,吳永橋提出了一個反共識的觀點:VLA短期內難以落地,仍需攻克多維難題。



其實2024年就有企業提及VLA的概念,2025年以來,VLA開始被行業大肆鼓吹。語音、手勢、甚至表情控制智駕系統,VLA被描繪得無所不能。這個原本在具身智能機器人領域廣泛討論的技術被移植到了自動駕駛。但在吳永橋看來,行業對VLA的癡迷太過急于求成。他提到VLA當下存在很多問題(引號內為吳永橋原話):

“首先,多模態大模型的特征對齊很難實現(視覺、語言、動作)”;

這里的多模態特征對齊指的是將不同模態(如圖像、文本、音頻等)的特征映射到統一的語義空間,從而實現跨模態信息的有效融合與理解。這種技術在多模態學習中扮演著“橋梁”的角色,使得不同模態的數據能夠協同工作,提升模型的智能表現。

“其次,多模態的數據獲取和訓練也十分困難?!?/p>

按照不少車企的宣傳話術,VLA可以實現語音識別,手勢識別,甚至眼神識別等,但是這些數據從哪來,沒有足夠多的實際數據作為支撐如何保證絲滑體驗。

“最重要的一點,VLA模型要部署在智駕芯片上,才能實現行車安全以及駕駛高度擬人化,模型規模必須要做到7B-10B左右。但目前市面上幾乎所有的三方智駕芯片都不是專為大模型的計算而設計的,帶寬相對較小,僅3B的模型布置在Thor芯片,頻率很難做到10赫茲?!?/p>

這里其實提到了3個問題,首先是參數量的問題,目前行業主流的車端VLA模型參數差不多在2B左右,企業披露的最高是4B。跟吳永橋說的10B(100億)差距甚遠。

聚焦VLA的企業首先要解決的就是量的問題。目前看來沒有任何一家企業能夠達到這個數據量,而且短期內很難速成,只能靠賣車一點點積累。

另外一個就是芯片問題。芯片硬件的設計要提前預判幾年后的軟件趨勢。VLA是最近1年才流行起來的說法,而目前主流的芯片都是至少3年前就開始立項開發,并不是專門針對大模型參數設計,這就存在吳永橋提到的帶寬問題。就是芯片在一定時間內能夠傳輸的數據量。是數據傳輸率的一個重要指標,表示在傳輸管道中可以傳遞數據的能力。大家可以換一個蓄水池的角度理解或許更形象,就是在一個足夠大的蓄水池里,但是出水口徑只有2cm,效率其實是非常低的。

有技術預判的企業肯定意識到了這個問題,為了支持大參數量,車企們的策略是自研芯片,小鵬和蔚來已經上車,但效果怎么樣還是未知數。但其實還是繞不開那個問題,這幾家企業芯片立項的時間都比較早,能考慮到多大的硬件極限也不清楚。

再有就是刷新頻率。就是系統對外部輸入信息的實時更新,按照吳永橋的說法,現在的模型刷新頻率都很難達到VLA需要的10赫茲。也有企業說達到了這個數據。

最后,吳永橋給了一個結論,可能要在3-5年之后,有了真正能跑大模型的芯片,才能支持VLA落地。博世并不否認VLA的價值,但是當下,吳永橋認為一段式端到端更有意義。只有將一段式端到端打磨到極致的性能,才能帶來高度擬人化、絲滑的智駕產品。(當然他說的應該是當下最好的產品)

無獨有偶,博世并不是唯一一個提醒大家保持冷靜的人。技術控曹旭東對VLA的態度更克制。上海車展期間,Momenta創始人曹旭東在接受騰訊汽車采訪時也提到了相同的觀點。(引號部分為曹旭東原話)

“VLM(Visual-Language Model,視覺語言模型)、VLA(Vision-Language-Action Model,視覺語言行動模型)是很好的方向,但在我看來是錦上添花的方向,在技術實現上其實沒那么難。它可能對自動駕駛系統上限,或者系統安全性來說,會有少則三五倍、多則五到十倍的提升,但這個提升對實現規?;疞4是遠遠不夠的,規模化L4至少是100倍到1000倍的提升才有可能實現。”

這里曹旭東表達了3個意思:1、VLA是一個不錯的方向;2、技術難度并不高;3、對系統安全的性能提升有限,最多5-10倍,這個提升對L4規?;h遠不夠。

這個可以順著他的意思把其中的邏輯給拆解一下,第一點他說VLA是一個很好的方向,但并沒有強調VLA的唯一性,這和不少企業將VLA宣傳成自動駕駛的必須且唯一解有本質區別。

后面2點,曹旭東解釋自動駕駛本身就是一個vision action(視覺-行動)的東西,把語言加進去,相當于加了一個信息輸入而已,技術難度并不高,而且加入一個信息元素系統安全也很難提升100到1000倍。

“我們認為提升要用強化學習,把端到端大模型放到通過海量真實數據構建起來的仿真環境去做探索,成功就給獎勵,失敗就給懲罰,這個模型就能夠學習到什么是安全駕駛、高效駕駛的概念。這種能力是能夠把模型的上限和安全的上限、下限提升100到1000倍,甚至1000到10000倍都是可以的?!?/p>

和吳永橋一樣,曹旭東也認為,要保證優質的自動駕駛體驗,將端到端與強化學習結合是更靠譜的方案。

相較于這些概念性的東西。曹旭東更強調自動駕駛本源的三要素:模型、數據、算法。他認為,模型設計的上限決定了系統學習能力的上限。如果模型設計的不好,給他再多的數據也學不會。就像老鼠的腦結構不可能超越人類。

順著這個思路再往下走,VLA只是一種“視覺-語言-行為”模型,證明它可以在一個模型里處理這些信息,但處理的好不好是另一回事。如果按照老鼠,猴子,猩猩,人類腦結構來劃分,不同物種有不同的VLA結構。其實又回到了模型設計的問題,然后通過大數據喂養和強化學習訓練在生成一個好的模型。而且還有一個核心的問題,目前最好的模型是什么人類無法提前預知,只能先搭建,然后用數據去試。

如果我們把視角再往前推會發現一個非常有意思的事情,大概1年前整個行業將端到端推上神壇,一體化架構、自主學習……各種花里胡哨的名詞,仿佛有了端到端就無所不能。結果僅僅一年時間,端到端還沒成熟,新的VLA技術又粉墨登場,被大肆宣揚。

慶幸的是,在所有人都被流量裹挾時被總有人發出不一樣的聲音。就像當年端到端大火的時候,所有人提起端到端都兩眼放光,前圖森未來創始人侯曉迪給端到端破了一盆冷水,他認為端到端只是人工智能里很平常的一項技術,提醒行業不要過分神化,有了端到端也未必能解決所有問題。站在今天的視角來看,端到端已經從成了大家口中的牛夫人,VLA才是當下的小甜甜,但是這股風到底會持續多久誰也不知道。明年會不會又有什么新的技術名詞出現呢?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
結束訪美的高市不笑了,回國前突然喊話中方:愿意和中國展開對話

結束訪美的高市不笑了,回國前突然喊話中方:愿意和中國展開對話

報君知史
2026-03-23 17:22:48
高油價助中國擺脫通縮,但工業企業虧損比例創2000年來新高

高油價助中國擺脫通縮,但工業企業虧損比例創2000年來新高

凱利經濟觀察
2026-03-24 10:52:31
外交部部長助理兼禮賓司司長洪磊接受莫桑比克新任駐華大使遞交國書副本

外交部部長助理兼禮賓司司長洪磊接受莫桑比克新任駐華大使遞交國書副本

財聯社
2026-03-23 20:28:16
沈萬三臨終告誡:尋財無需高深本領,牢記這三句話,輕松富甲一方

沈萬三臨終告誡:尋財無需高深本領,牢記這三句話,輕松富甲一方

千秋文化
2026-02-10 21:02:09
我沒想到騰訊還能做這樣的游戲

我沒想到騰訊還能做這樣的游戲

競核
2026-03-23 21:12:53
上線狂跌70億市值,這款3A開放世界拒絕涼涼

上線狂跌70億市值,這款3A開放世界拒絕涼涼

競核
2026-03-23 21:12:43
國際油價暴跌10%,凌晨國內漲價,為啥不接軌?網友叫苦想不明白

國際油價暴跌10%,凌晨國內漲價,為啥不接軌?網友叫苦想不明白

眼光很亮
2026-03-24 15:03:21
3月24日俄烏最新:克里姆林宮又提高報價了

3月24日俄烏最新:克里姆林宮又提高報價了

西樓飲月
2026-03-24 20:28:34
10萬億度需求也不買!中國攤牌,輸電專線全叫停,國產電價教做人

10萬億度需求也不買!中國攤牌,輸電專線全叫停,國產電價教做人

番外行
2026-03-24 13:19:09
穆迪復出重傷!勇士加時送獨行俠正式無緣季后賽 弗拉格32+9

穆迪復出重傷!勇士加時送獨行俠正式無緣季后賽 弗拉格32+9

醉臥浮生
2026-03-24 12:43:30
公安部172號令落地:70歲駕照不再終身有效,2026年這些事必須辦

公安部172號令落地:70歲駕照不再終身有效,2026年這些事必須辦

小怪吃美食
2026-03-24 17:29:52
經濟學人:字節跳動正在吞噬互聯網

經濟學人:字節跳動正在吞噬互聯網

藍洞新消費
2026-03-24 10:54:37
為什么氰化物入口幾秒,還沒到胃呢,人立馬就會死了?

為什么氰化物入口幾秒,還沒到胃呢,人立馬就會死了?

心中的麥田
2026-03-24 19:53:20
涉嫌嚴重違紀違法,張國秀被查!

涉嫌嚴重違紀違法,張國秀被查!

中國基金報
2026-03-24 13:24:18
滬指暴跌143點險守3800,股民滿倉兩天虧15萬太慘烈

滬指暴跌143點險守3800,股民滿倉兩天虧15萬太慘烈

財經智多星
2026-03-24 06:22:28
我的技術并不比世界第1差!我能打敗任何人!鄭欽文的話引發眾怒

我的技術并不比世界第1差!我能打敗任何人!鄭欽文的話引發眾怒

搏擊江湖
2026-03-24 20:35:57
去了一趟伊朗才發現:原來在伊朗人眼里,中國人是這樣的

去了一趟伊朗才發現:原來在伊朗人眼里,中國人是這樣的

千秋文化
2026-03-24 21:40:40
國足vs庫拉索,433陣型首發浮現:顏駿凌壓陣,王鈺棟+韋世豪沖鋒

國足vs庫拉索,433陣型首發浮現:顏駿凌壓陣,王鈺棟+韋世豪沖鋒

小火箭愛體育
2026-03-24 22:03:08
旅行者號撞上"空氣墻"?宇宙可能就是一場精心設計的大型模擬游戲

旅行者號撞上"空氣墻"?宇宙可能就是一場精心設計的大型模擬游戲

李將平老師
2026-03-22 16:46:15
突發!特斯拉中國出現嚴重缺貨問題

突發!特斯拉中國出現嚴重缺貨問題

XCiOS俱樂部
2026-03-24 19:24:17
2026-03-25 00:51:00
圓周智行
圓周智行
智能出行產業科技研究院
160文章數 1關注度
往期回顧 全部

科技要聞

年僅41歲,教育名師張雪峰猝然離世

頭條要聞

張雪峰因心源性猝死搶救無效去世 終年41歲

頭條要聞

張雪峰因心源性猝死搶救無效去世 終年41歲

體育要聞

NBA最強左手射手,是個右撇子

娛樂要聞

張雪峰經搶救無效不幸去世 年僅41歲

財經要聞

特朗普再TACO 可以押注伊朗局勢降級?

汽車要聞

尚界Z7雙車預售22.98萬起 問界M6預售26.98萬起

態度原創

旅游
數碼
房產
教育
軍事航空

旅游要聞

2025年哈薩克斯坦入境游客持續增長 中國為第四大來源國

數碼要聞

榮耀平板PC應用新增剪映專業版App,支持大屏多軌剪輯等功能

房產要聞

北上廣深二手房集體回暖!三月小陽春行情全面兌現

教育要聞

多地中考改革調整開閉卷科目

軍事要聞

以色列媒體:美國計劃于4月9日結束對伊朗戰爭

無障礙瀏覽 進入關懷版