這兩天,我AI圈的朋友們分成兩派人:已經(jīng)玩過Clawdbot的,和正準備玩的。(Clawdbot后來改名為Moltbot,昨天又改名為OpenClaw。不過出于習慣,咱下面還是叫它Clawdbot)
它?到什么程度?據(jù)說直接帶動了Mac mini的??價格大幅上漲(因為據(jù)說Mac mini最適合部署它),甚??度引發(fā)囤貨。
我也試用了一下,效果還是挺震撼的(等會介紹)。我有一個判斷:我們離“全能助手”的時代,又進了一步。
要看懂Clawdbot到底是啥,咱先快速復習一個基礎(chǔ)框架:
一個真正能干活的AI智能體,由3部分組成:感知、決策、行動。
感知,就像人的眼睛耳朵。聽懂你對它說的話,看懂你給的指令。
決策,就像人的大腦。調(diào)用ChatGPT這樣的大模型,去拆解、分析你的指令。
行動,就像人的手腳。真正去點鼠標、按鍵盤、改文件。
過去兩年,AI的眼睛和大腦,已經(jīng)進化得相當恐怖了。眼睛的能力,能從幾千張混亂的裝修設(shè)計圖中,瞬間提取出所有的建材清單。甚至只要拍一張復雜的電路板照片,它就能準確指出哪里可能存在焊接短路。大腦更是卷到?jīng)]邊,上知天文下知地理,前一秒還在幫你寫量子力學的論文,后一秒就能調(diào)研行業(yè)給你一份幾百頁的商業(yè)計劃書。
但在“手腳”的能力上,發(fā)展一直沒那么迅速。不過,很多專業(yè)人士都認為,2026會是“行動”這一端大爆發(fā)的一年。而Clawdbot的出現(xiàn),就是補齊了“行動”的拼圖。
這是一個開源的AI助手,可以通過WhatsApp、Telegram之類的平臺交互。國內(nèi)用戶則可以用飛書、釘釘、企微之類的辦公軟件。下面我用一個小例子,帶你體驗下它能干什么。
我建了一個“旅游照片”文件夾,里面放著一些世界各地的旅游照片(當然,是網(wǎng)上下載的,不是我拍的)。既有金字塔、自由女神像這樣的世界級地標,也有清萊藍廟、釜山甘川文化村這樣相對不是特別出名的地方。
![]()
網(wǎng)圖,文件名自然是亂碼。我想把文件名改規(guī)整。怎么辦?一個個手改?
用Clawdbot試試,我把圖片全都扔給它,然后說“幫我把這些照片用‘國家+景點名’的方式命名好”。它會在電腦后臺里,自動下載圖片、改名,再把它們打包。最后你猜怎么著?不到一分鐘,它就給了我一個壓縮包。
![]()
下載壓縮包,解壓,就會變成這個樣子。
![]()
怎么樣?是不是有點東西?對于喜歡旅游的人來說,這樣的相冊可能有好幾百張照片。一個個手改,怎么都得弄個小半天吧。
這只是舉個例子,你在網(wǎng)上一搜,還有更多稀奇古怪的玩法,你也可以自己開發(fā),我就不啰嗦了。
本質(zhì)上,它是在把那些需要你親手操作的“重復性流程”,封裝成了一鍵執(zhí)行的“數(shù)字化技能”。
隨便暢想幾個場景。
對于打工人,也許它未來就是你的全能助理。
假設(shè)你剛出差回來,電腦里存了幾百張照片,全是亂七八糟的序列號命名。過去,你得一張張看,一張張改。現(xiàn)在,你只需要給Clawdbot 發(fā)一句話:“幫我把出差照片按城市和日期分類整理好。”然后,你就可以喝咖啡去了。接下來你會看到神奇的一幕:
它先去讀照片, 通過經(jīng)緯度,識別出哪些是上海拍的,哪些是杭州拍的(感知)。再去想邏輯: 既然老板要分類,我得建文件夾,還得重命名(決策)。最后開始瘋狂操作: 發(fā)現(xiàn)電腦缺個插件?它自己去瀏覽器下載、安裝,然后建文件夾、重命名、拖拽文件(行動)。以前你要干半天的體力活,它幾分鐘就搞定了。
對旅游愛好者,也許你可以用它“一鍵生成耍帥朋友圈”。
把這幾百張照片扔給它,說“選出9張最有視覺沖擊力的,按照由遠及近的邏輯排個序,再配上一段王家衛(wèi)風格的文案,最后記得標注出每張照片的拍攝地點和海拔。”
對自媒體人,也許它是最懂你的腳本助手。
你看到一篇有趣的文章,隨手甩給它。它就可以提取金句->生成小紅書、微博、知乎等5 個不同平臺的文案->在本地文件夾里搜索適合配圖的素材->甚至打開剪映幫你把草稿拉好。以前你需要開五個網(wǎng)頁、導三次文件,現(xiàn)在只需要一句話。
這就叫“手腳”,只有到了這一步,它才終于有了完整的“感知、決策、行動”能力,是一個“真正能干活的AI智能體”。
其實,Clawdbot并不是第一個“智能手”。就這一年時間,這個領(lǐng)域真是百花齊放,大體上可以分為三類,核心區(qū)別是權(quán)限的不同。
第一類,叫“手機手”(Mobile Phone Use),它擁有手機級別的權(quán)限,在模擬人手去操控手機。
去年年底很火的豆包手機,本質(zhì)就是這類。它只能模擬你的手去操控手機,你對它說:幫我找一個預算2000-4000的房子,它會像人手一樣點開貝殼,選擇價格進度條。而且沒法一次性拉到“2000”,要像洗澡擰熱水一樣反復好幾次。
第二類,叫“瀏覽器手”(Browser Use)。它擁有瀏覽器級別的權(quán)限,可以直接操控你的瀏覽器。
比如最近這一年里大火的Manus,它能在你授權(quán)的各種網(wǎng)頁里橫沖直撞,幫你查資料、填表單。遇到要掃碼登錄的地方,它還會提醒你:該你輸密碼了。
但你讓它打開你的某個文件夾,改文件名,這肯定是做不到的,因為它“沒有權(quán)限操控你的電腦”。
第三類,叫“電腦手”(Computer Use)。它擁有最高級別電腦權(quán)限。
Clawdbot就是這類。它直接長在你的電腦系統(tǒng)里,能接管你的桌面,操控你所有軟件。
說到這,你可能迫不及待想馬上裝一個試試。但我得先提醒你,方便的另一面,永遠是風險。
理論上,如果有別有用心的人控制了這種“電腦手”,就擁有了你電腦的幾乎所有權(quán)限(除了少數(shù)要輸密碼的)。它能幫你炒股,也就能虧光你的錢。它能幫你找資料,也就能刪你最重要的合同。它能幫你通宵達旦地修復Bug,也就可能在你毫無察覺的深夜,親手格式化掉你積累了十年的數(shù)據(jù)庫。
權(quán)限給得越高,干活越爽,但也越危險。它還沒有“輕重緩急”的絕對意識,也沒法幫你承擔責任,你對它最大的懲罰, 就是卸載。
所以,如果你也想試試,我要給一個最核心的提醒:
別在有你全副身家的主電腦上裝。
最好找一臺備用電腦,你要把它當成一個“被隔離的員工”,只給它一個溝通窗口,而不是直接把自己的命門交出去。再或者,嘗試下虛擬機或者云服務器。
當然,Clawdbot才剛剛發(fā)布,我們還不知道它會更新出怎樣的能力,也不知道還會出多少類似的軟件。但我們知道一件事,那就是標題里的那句話:
我們離“全能助手”的時代,真的又進了一步。
很多人問,如果以后活都被AI干了,我們干什么?
嘶,這可能會是特別殘酷的一點。當AI拿走了你的鼠標,它其實是把“思考”強行還給了你。
這是可能是一種解放,也可能是一種挑戰(zhàn)。
因為,你再也沒有理由用“我很忙”,來掩蓋“我沒有思考”。
觀點/ 劉潤主筆/ 歌平編輯/ 歌平版面/ 黃 靜
這是劉潤公眾號第2851篇原創(chuàng)文章。未經(jīng)授權(quán),禁止任何機構(gòu)或個人抓取本文內(nèi)容,用于訓練AI大模型等用途
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.