![]()
文:王智遠(yuǎn) | ID:Z201440
OpenClaw 火了十來(lái)天。
短短十天里,AI 圈吵翻了天。有人說(shuō)它是「桌面 Agent 的 ChatGPT 時(shí)刻」,有人說(shuō)它只是極客玩具,還有人盯著 Token 賬單直呼燒不起。
這場(chǎng)景,讓我瞬間想起「AI Skills」爆火時(shí),我當(dāng)時(shí)還跟身邊的朋友說(shuō)過(guò),很多東西真沒(méi)必要死磕,看個(gè)熱鬧、了解是究竟怎么回事就行。
為啥呢?因?yàn)槟壳笆忻嫔辖^大多數(shù)的 AI 產(chǎn)物,本質(zhì)是「過(guò)渡形態(tài)」。不信,我們先看看,這玩意兒到底是什么物種?
01
先把話說(shuō)透:OpenClaw 是一個(gè)能本地運(yùn)行、自帶自主執(zhí)行邏輯、可以深度操控你電腦系統(tǒng)、文件的開(kāi)源桌面智能體(Agent)。
正因?yàn)樗_(kāi)源、還能一鍵部署,普通人也能上手試試,這才讓它十天就炸了 AI 圈。
看,這就懵了吧,每個(gè)詞都認(rèn)識(shí),放一起,就亂了。別急,想象一下,你家以前有電視、空調(diào)、音響,每個(gè)電器都有一個(gè)專門的遙控器。
想看電視就得拿電視遙控器,想開(kāi)空調(diào)又得換一個(gè),廠家們?yōu)榱俗屇愣喑騼裳鬯麄兊倪b控器,把按鈕做得五顏六色,還貼滿了亂七八糟的廣告。
到最后,家里桌子上全是破遙控器,煩都煩死了,咋辦?
這時(shí)候有人站出來(lái),做了一個(gè) Agent,就是 OpenClaw。它像一個(gè)「萬(wàn)能語(yǔ)音遙控器」,你只要跟它說(shuō)一句話,它就自動(dòng)去幫你按那些繁瑣的按鈕,不用你自己動(dòng)手。
所以,它和我們?nèi)粘S玫亩拱⑽男摹hatGPT 完全不是一個(gè)東西。
別人只在對(duì)話框里待著,它能鉆進(jìn)你的系統(tǒng)、讀寫(xiě)文件、發(fā)郵件、寫(xiě)代碼、跑腳本、模擬鼠標(biāo)鍵盤,像一個(gè) 24 小時(shí)待命的數(shù)字員工。
簡(jiǎn)單講,它是AI 的「手」和「腳」;它沒(méi)有「大腦」,得靠調(diào)用 MiniMax、Claude 這些大模型做推理,它只負(fù)責(zé)把模型的想法,真正落地到電腦操作里的執(zhí)行層。
02
聊到這兒,估計(jì)不少人跟我一樣心想:OpenClaw 是獨(dú)立開(kāi)發(fā)者做的開(kāi)源工具,自己沒(méi)「大腦」,還燒錢、還要手搓、還有安全隱患,那大廠為啥要費(fèi)這么大勁,趕在這 10 天里扎堆跟進(jìn)?
答案很簡(jiǎn)單,OpenClaw 無(wú)意間捅破了一層窗戶紙
大廠們怕別人先搶走「AI 操控電腦」的核心入口,更怕自己在馬上要到來(lái)的桌面 Agent 時(shí)代,被甩在后面,甚至徹底丟了桌面端的話語(yǔ)權(quán)。
要知道,大廠從來(lái)都不打沒(méi)準(zhǔn)備的仗,更不會(huì)瞎跟風(fēng),這次之所以打破常規(guī),急急忙忙下場(chǎng),背后藏著的是 AI 行業(yè)最核心的競(jìng)爭(zhēng)邏輯。
啥邏輯啊?三個(gè)詞:時(shí)間、權(quán)限、生態(tài)。這三個(gè)詞串起來(lái)的每一步,都透著緊迫感,甚至能決定未來(lái) AI 行業(yè)的競(jìng)爭(zhēng)格局。
為啥這么講?
先說(shuō)說(shuō)時(shí)間的事兒,互聯(lián)網(wǎng)競(jìng)爭(zhēng)有個(gè)冷知識(shí),搶功能不如搶用戶心智,搶心智不如搶用戶習(xí)慣。大廠們集體「急了」,因?yàn)樗麄儼l(fā)現(xiàn),OpenClaw 正在定義一種特別嚇人的用戶習(xí)慣:「跳過(guò)App」。
以前我們要打車、比價(jià)、寫(xiě)文檔,得在幾個(gè) App 之間反復(fù)橫跳,大廠靠著這些精美的 UI 界面攔住你的視線,順便塞給你廣告和會(huì)員。
現(xiàn)在這東西一出來(lái),只要說(shuō)句話,它在后臺(tái)把所有活兒都干了,大廠心里跟明鏡似的,這種「需求已經(jīng)被驗(yàn)證」的窗口期,慢一步,就可能被競(jìng)爭(zhēng)對(duì)手搶了先手。
而且,第一批種子用戶雖說(shuō)只是一時(shí)跟風(fēng),但他們是「第一批被教育的用戶」,誰(shuí)先讓他們用自己的云服務(wù)器、自己的部署方案,誰(shuí)就能先在他們心里種下「AI操控電腦,找我就對(duì)了」的印象。
后續(xù)不管用戶留存,教育市場(chǎng)、還是引導(dǎo)他們用更高級(jí)的算力、更貴的模型 API,都是水到渠成的事。
接著,就是搶權(quán)限問(wèn)題了。OpenClaw 再火,也是「外來(lái)戶」,它沒(méi)有電腦系統(tǒng)的核心權(quán)限,所有操作本質(zhì)上都是 騙電腦,這戳到了大廠的痛處。
你琢磨琢磨,阿里、騰訊為啥急著上云服務(wù)器模板?因?yàn)樗麄円柚赴踩箲]」,把權(quán)限攥回自己手里。
你不敢在本地跑 OpenClaw,怕它誤刪文件、跑路,那我就給你提供一個(gè)云端的「數(shù)字沙盒」,你在我這兒跑,我既能幫你把 Agent 隔離開(kāi),保證安全,還能順便攥住 Agent 操控電腦的最高解釋權(quán)。
所以,他們心里門清,桌面 Agent 的終局,是「誰(shuí)的權(quán)限更高」,權(quán)限決定了產(chǎn)品的上限,決定誰(shuí)能真正把「AI 操控電腦」做到極致。
說(shuō)到這兒,就在周六(2月7號(hào)),豆包也推出了瀏覽器和桌面助手的分開(kāi)版本。為啥這么急?因?yàn)樗蚕脍s緊動(dòng)手,把手里的「權(quán)限」,快速變成面向普通用戶的產(chǎn)品優(yōu)勢(shì)。
至于最后,就是為搶生態(tài)了。咱們都知道,大廠做產(chǎn)品要長(zhǎng)期的生態(tài)閉環(huán),讓用戶從頭到尾,都離不開(kāi)自己的產(chǎn)品體系。
OpenClaw 爆火之后,大廠敏銳地發(fā)現(xiàn),這是個(gè)搭生態(tài)的好機(jī)會(huì),借著熱度,快速再把自己的算力、模型、系統(tǒng)、硬件串起來(lái),形成一個(gè)「Agent生態(tài)閉環(huán)」。
誰(shuí)能做到這一點(diǎn),誰(shuí)就能在未來(lái)的Agent時(shí)代占據(jù)絕對(duì)主導(dǎo)地位;要慢一步,生態(tài)被其他大廠搶了,自己再想擠進(jìn)去,就得付出幾倍甚至幾十倍的代價(jià)。
所以,搶權(quán)限,為了筑牢長(zhǎng)期的產(chǎn)品壁壘;搶生態(tài),是為了掌控未來(lái)的行業(yè)格局。
03
如果說(shuō)戰(zhàn)略宏圖是大廠布的一盤大棋,那對(duì)咱們普通用戶來(lái)說(shuō),最核心的疑問(wèn)就一個(gè):
到底有沒(méi)有這個(gè)需求?它到底解決實(shí)際痛點(diǎn)的真命題,還是只為緩解大家「不折騰就落后」的焦慮?
在我看來(lái),它是一種過(guò)渡型需求,短期靠嘗鮮撐熱度,中期是規(guī)模化落地的必經(jīng)之路,長(zhǎng)期形態(tài)會(huì)慢慢消失,但背后的核心需求,會(huì)一直都在。
為啥呢?咱們分階段看。
從最直觀的短期來(lái)看,這一波 OpenClaw 帶火的「一鍵部署」,本質(zhì)是流量需求,不是真使用需求。
你仔細(xì)想想,跟著教程一鍵部署的人,大多都抱著「我也擁有賈維斯了」的好奇心,裝完截張圖、發(fā)個(gè)朋友圈,之后就再也沒(méi)打開(kāi)過(guò)。
因?yàn)椴渴鹜辏闊┎耪嬲_(kāi)始。
Token 消耗得飛快,半小時(shí)就能燒掉上百萬(wàn),普通用戶根本扛不住;再加上高權(quán)限帶來(lái)的安全顧慮,生怕它誤刪重要文件、泄露聊天記錄,沒(méi)人敢真拿它處理正經(jīng)工作。
更關(guān)鍵的是,大多數(shù)人根本沒(méi)那么多「需要 AI 自動(dòng)完成的繁瑣任務(wù)」。平時(shí)無(wú)非發(fā)個(gè)郵件、整理個(gè)文件,自己動(dòng)手幾分鐘就搞定,犯不著折騰 Agent,更沒(méi)必要為了這幾分鐘,承擔(dān) Token 成本和安全風(fēng)險(xiǎn)。
所以,短期來(lái)看,一鍵部署根本沒(méi)解決用戶的真實(shí)痛點(diǎn)。
它讓不懂代碼、不懂模型的普通人,也能跟風(fēng)蹭一波 AI 熱度,可熱度一退,沒(méi)有真實(shí)使用場(chǎng)景撐著,自然就被丟在一邊。
放到中期來(lái)看,情況就完全不一樣了。
未來(lái)一兩年,「一鍵部署」會(huì)從「流量需求」變成真正的剛需,甚至是桌面 Agent 走出極客圈、走向普通用戶和企業(yè)的必經(jīng)之路。
畢竟桌面 Agent 本身門檻太高,企業(yè)想用 Agent 自動(dòng)處理報(bào)表、批量發(fā)郵件,總不能每個(gè)團(tuán)隊(duì)都配個(gè)技術(shù)人員專門部署吧?
普通人想讓 Agent 幫忙取消郵件訂閱、整理行程,也不可能先花好幾天學(xué)代碼、學(xué)配置吧?
這時(shí)候,「一鍵部署」就成了降門檻的關(guān)鍵。
阿里云、騰訊云、百度智能云推出的一鍵部署模板,都在為中期規(guī)模化鋪路,先讓用戶「用起來(lái)」,再慢慢引導(dǎo)他們「用下去」。
再看長(zhǎng)期,三年以上,一鍵部署這種形態(tài)會(huì)慢慢消失,但它背后「低門檻使用 Agent」的核心需求,會(huì)一直存在;因?yàn)榇髲S們會(huì)把 Agent 直接原生集成到系統(tǒng)里,開(kāi)機(jī)就能用,根本不用用戶手動(dòng)部署。
比如:
蘋果的 Apple Intelligence、微軟的 Copilot、華為鴻蒙的原生智能,未來(lái)都會(huì)直接內(nèi)置在系統(tǒng)里,你打開(kāi)電腦,直接跟 AI 說(shuō)「幫我做什么」,它就能直接干活。
云廠商也會(huì)把 Agent 集成到云桌面里,用戶登錄就能直接用。到那時(shí),「一鍵部署」也就沒(méi)必要存在了,它只是用來(lái)填補(bǔ)「系統(tǒng)原生 Agent 還沒(méi)上線」的空白期。
所以,咱們要分清,形態(tài)消失不代表低門檻使用 Agent的需求消失了;恰恰相反,需求只會(huì)越來(lái)越規(guī)模化、越來(lái)越剛性。
未來(lái),AI 操控電腦會(huì)像現(xiàn)在用 Wi-Fi、藍(lán)牙一樣普遍,每個(gè)人都需要一個(gè)不用折騰、開(kāi)箱即用的 Agent,這么一想,所有事兒就都通透了。
04
既然大家都看準(zhǔn)了未來(lái)AI 操控電腦標(biāo)準(zhǔn)配置,那這場(chǎng)桌面agent的收編、或者叫競(jìng)爭(zhēng)賽,誰(shuí)才是掌握大權(quán)的「最高法院呢?
現(xiàn)在的 OpenClaw,本質(zhì)是對(duì)系統(tǒng)搞「暴力破解」。它的做法,就像家里來(lái)了個(gè)幫廚,不認(rèn)識(shí)廚房的開(kāi)關(guān),只能拿著說(shuō)明書(shū)一點(diǎn)點(diǎn)瞎試。
這種「非侵入式」的接管,說(shuō)難聽(tīng)點(diǎn)是一種低效的補(bǔ)丁。
真正的「最高法院」是掌握了系統(tǒng)底層的「房東」,比如:蘋果、微軟、或者國(guó)內(nèi)的華為、小米。
這些玩家手里攥著「系統(tǒng)內(nèi)核」和「原生 API」,他們做的原生 Agent,壓根不需要截屏,直接在系統(tǒng)底層發(fā)指令就行,就跟你腦子里一想「握拳」,手立刻就動(dòng)了,不用先睜眼看手在哪兒。
這種「原生權(quán)限」帶來(lái)的響應(yīng)速度、隱私安全和低功耗,是任何第三方補(bǔ)丁都跨不過(guò)去的鴻溝。
但這里有個(gè)關(guān)鍵變數(shù):握得住「軀殼」的人,不一定能搞定「靈魂」。你看,手機(jī)廠、系統(tǒng)廠雖是房東,握著系統(tǒng)鑰匙,但未必是最頂尖的「大廚」。
大模型的訓(xùn)練、推理調(diào)度,還有復(fù)雜邏輯理解,都是極燒錢、極吃人才的硬本事;不是說(shuō)你掌控了系統(tǒng)內(nèi)核,就能做出 Claude、MiniMax 那樣聰明的「大腦」。
所以,模型廠商的機(jī)會(huì)就在這兒。
系統(tǒng)廠的「原生 Agent」腦子不夠靈光,最后大概率還得放低身段,去擁抱頭部模型廠;這個(gè)趨勢(shì)已經(jīng)很明顯了:系統(tǒng)廠出「權(quán)限」和「骨架」,模型廠提供「智力」與「靈魂」,這是互補(bǔ)式的收編。
還有一種更具想象力的野心:如果房東不給鑰匙,那大廚就自己蓋房子。
就像現(xiàn)在的豆包,一連串動(dòng)作都在釋放一個(gè)信號(hào):
現(xiàn)有手機(jī)、電腦系統(tǒng)給的權(quán)限不夠用,那干脆做一款 AI 時(shí)代的「原生硬件」?直接把模型、硬件、系統(tǒng)全鏈路鎖死。這種「自帶靈魂的軀殼」,才有可能把 Agent 的體驗(yàn)拉到天花板,成為終極形態(tài)。
所以,要么系統(tǒng)廠收編模型,要么模型廠重塑硬件。在這個(gè)各顯神通的時(shí)代,誰(shuí)才是悶聲發(fā)大財(cái)?shù)摹纲u鏟人」呢?
這波浪潮里,最先嘗到甜頭的是像 MiniMax 這樣的玩家。
為啥 OpenClaw 的作者專門點(diǎn)名 M2.1 模型?因?yàn)樵?Agent 圈子里,辦事得經(jīng)歷無(wú)數(shù)次自我糾錯(cuò)、指令循環(huán),這對(duì)模型的邏輯穩(wěn)定性要求,已經(jīng)到了變態(tài)的地步。
MiniMax 聰明地方在于,專注卷「指令跟隨」,這十天里,只要你跑 OpenClaw,你的 API 賬單,大概率就交到它手里了。
昆侖萬(wàn)維前兩天,剛發(fā)布了天工 Skywork 桌面版。
它號(hào)稱「Windows 版的 Claude Cowork」,這種思路是典型的「中國(guó)式賣鏟子」;我不光賣你大腦,還把「辦公室環(huán)境」都給你搭好了,讓你能直接雇一個(gè)「AI 員工」處理本地文件,還不用擔(dān)心安全。
還有智譜 AI,他們的 AutoGLM 走另一種「動(dòng)作模型」原生化的路子,他們想把「看屏幕、點(diǎn)圖標(biāo)」的能力直接練進(jìn)模型里。
不過(guò)說(shuō)白了,打法都差不多,先讓模型跑起來(lái),用云 + 端兜底,快速讓普通人能用得上。
國(guó)外就不一樣了,老外的思路完全是另一種畫(huà)風(fēng)。
Anthropic推出的「Computer Use」,典型的「標(biāo)準(zhǔn)定義者」邏輯,它想定義一套讓 AI 操控電腦的底層協(xié)議,相當(dāng)于告訴全世界:以后 AI 調(diào)動(dòng)鼠標(biāo)鍵盤,就得按我這套規(guī)矩來(lái)。
這就好比當(dāng)年定義 Wi-Fi 標(biāo)準(zhǔn)一樣,它想在動(dòng)作層收稅。
而 OpenAI 的「Operator」和 Google 的 Jarvis,走入口收割的路子;OpenAI 追求「托管式的簡(jiǎn)單」,它想做 Agent 界的「應(yīng)用商店」;而 Google 則把 Jarvis 直接揉進(jìn) Chrome 生態(tài)。
這兒就有個(gè)很明顯的對(duì)比:
國(guó)外大廠忙著「造地基、定標(biāo)準(zhǔn)」,走的是科研驅(qū)動(dòng)、想從根上重構(gòu)電腦邏輯的路線;國(guó)內(nèi)大廠則忙著「搞基建、推落地」,走的是場(chǎng)景驅(qū)動(dòng)、快速響應(yīng)普通用戶需求的路線。
除了賣模型的、做應(yīng)用的,最穩(wěn)的還要數(shù)「數(shù)字房東」,云廠商。
只要你的 Agent 還在后臺(tái)瘋狂燒 Token 進(jìn)行自我對(duì)話,你的云費(fèi)和流量費(fèi)就一分都少不了,所以,云廠商這次也會(huì)贏麻了。
說(shuō)白了,這一場(chǎng)桌面 Agent 的狂歡,本質(zhì)是互聯(lián)網(wǎng)從「流量經(jīng)濟(jì)」向「任務(wù)經(jīng)濟(jì)」的一次大轉(zhuǎn)型。沒(méi)有誰(shuí)高誰(shuí)低,關(guān)鍵就看誰(shuí)能抓住信息差,搶占先機(jī)。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.