![]()
通過 HDMI 接口來 “看” 屏幕,通過 Type C 接口來 “操作” 鼠標和鍵盤。
文丨祝穎麗
編輯丨趙磊
或許很多創業公司都該感謝 OpenClaw,它以一己之力,在不到 3 個月的時間里就快速完成了對用戶和投資人的關于 Agent 的市場教育。
Violoop 也趕上了這個風口,這家 Agent 硬件公司去年底開始融資,元旦開始啟動,一個月的時間里就走到了第三輪,目前已經在接觸最頭部的投資機構。
Violoop 是一個形似縮小版臺式機的硬件,插在電腦上就可以通過對話遠程指揮里面的 Agent 在你的電腦里干活——從結果上的確很像一個有了身體的 “龍蝦”。
![]()
但這家創業公司走到今天,并不是一個趕風口的結果;他們也不打算講跟 OpenClaw 類似的故事。
Violoop 的兩位合伙人結識于 2019 年。當時還在做留學生長租公寓生意的何佳霖對于朱賢楨的印象是,“這哥們兒智商太高、技術太深了”,他一直想等一個跟朱賢楨合作的機會。
2022 年因為疫情,何佳霖在美國的業務被迫結束;彼時,朱賢楨也在不停試錯、換項目的過程中,進入一個空窗期。兩人一拍即合,決定合伙做些什么事情。
那是 ChatGPT 已經出現并火爆的時間點。他們一邊探索做各種 AI 應用(諸如用 AI 減肥、面試、做筆記和畫布等產品),一邊接下一家世界五百強的 AI 項目。
有了大客戶的錢,還有實際的業務場景,他們比大多數的創業者幸運。而更幸運的是,正是這段給大客戶做項目的過程中,他們從自己的需求和實踐中發現了個人 Agent 的創業機會。一個如今他們看來,可能是萬億級別的市場機會。
為什么 Agent 要做成硬件?
Violoop 的起點也是一個跑在電腦里的軟件,正如如今的 Openclaw,只不過是通過郵件連接電腦——當時兩位合伙人在給大客戶提供 AI 技術服務時,經常需要人工熬夜加班到凌晨,為了能讓大家少熬夜,他們開始著手研發各種終端 Agent ,希望通過遠程控制來實現工作的自動化。
但產品做出來后,他們意識到,純軟件的 Agent 服務,在安全上始終存在問題;而且每一個任務都要推送到云端讓大模型理解,這在長期使用上成本也會更貴;面對沒有開放接口的產品和服務,純軟件 Agent 可以用的辦法也更少。
硬件則在上述諸多問題上都有更好的解決方案。
比如安全上,把 Agent 放在硬件里,可以通過芯片來做最后的攔截;執行任務時,硬件先完成一部分簡單的事情——比如圖像識別——再把更難的事情交給云端模型,也能省很多錢;至于那些沒有開放接口的軟件操作,硬件 Agent 也可以模擬人的眼和手,來查看和操作你的電腦。
2025 年 6 月,他們正式從軟件 Agent 轉向做硬件類的 Agent。最終確立的硬件技術框架是:通過 HDMI 接口連接電腦來 “看” 屏幕畫面,通過 Type-C 接口連接來 “控制” 鼠標和鍵盤的操作。
桌面版的 Violoop,定位為 “工作助手”——插上電腦(或者同一個 wifi 下連接),它就能實時 “看” 到并且學習你使用電腦的習慣、你的工作流程,持續學習后,它能夠幫你操作電腦,甚至在觀察后,主動幫你工作。通過內置軟件的連接,你還能在手機上隨時遙控它。
![]()
Violoop 工作原理
不同于如今市場上的一些 Agent 電腦, Violoop 并不想取代 Mac 或者是 Macmini;何佳霖說,它們最大的特點是跟主電腦配合,是讓一個實體 Agent 去操作工作電腦。
盡管思路不一樣,但給 Mac mini 裝上 OpenClaw 仍然是大多數用戶的選擇,也是他們必須面臨的競爭。要賣出去,首先就得比 Mac mini 便宜。
為了將產品價格控制在 Mac mini 售價一半的水平,他們沒有采用市面上昂貴的直連 HDMI 芯片,而是自研了一款轉接芯片,在不犧牲算力的前提下將核心成本降到了 100 元人民幣左右。
其次,為了能讓用戶用得起,他們又找到了端云結合的方案,自己訓練了本地模型,讓它可以識別不同軟件的圖標、快捷鍵,以及判斷電腦目前所處的工作狀態;處理完畢后只將提煉出的核心文本發給云端大模型,這樣可以大大降低 Token 成本。
在產品設計上,為了解決存儲焦慮,他們的硬件還設計了一個可拆卸的后蓋,允許用戶直接插入標準的固態硬盤,最大可擴展到 4TB,甚至比很多主電腦的容量還要大。
今年以來,Openclaw 以開源的形式爆火讓他們意識到,純軟件層的 Agent 更沒有機會了,就像當開源的 Linux 統一了操作系統后,只有裝到了 IBM 和戴爾里面的 Windows 以及本身就是賣硬件的 MacOS 才可以與之匹敵,“沒有其他的 OS 是以純軟件的形式挑戰 linux 的。”
連續創業者,找到了一個大機會
何佳霖和朱賢楨成長于完全不一樣的環境:何佳霖初高中隨父母來到非洲津巴布韋,12 歲起就在叢林環境中住校;朱賢楨則在上海長大,一路都在最好的學校里當天才學生。
但在底層追求上,兩人又出奇地一致,他們幾乎從第一天就覺得 “上班打工” 極其無趣,是天生的創業者。
何佳霖去美國讀大學時,就成了加州最大的線下招聘會承包商;2015 年前后,他敏銳地捕捉到留學生租房需求,創辦了長租公寓業務,管理規模曾達到 2.5 億美金。
朱賢楨在 MIT 讀完芯片設計碩士后,只在微軟工作了一年,就發現自己無法忍受大公司每個人螺絲釘一樣的位置,辭職創業,做過高效率的創業者工具、線下交友 App,甚至做過 AI 芯片和區塊鏈業務。
但過去的折騰里,兩個 90 后都沒有抓住移動互聯網最頂峰的機會,只能在在一些被稱為 “生意” 和 “項目” 的事情里不斷地切換,直到 AI 的到來,“這份遺憾,正好可以在這個最好的時代去付諸實踐了”,何佳霖說。
過去的三年里,他們嘗試過很多 AI 相關的項目,直到找到了現在這個方向,他們才確定這是一個屬于自己的最大機會、一個萬億級別的市場。
僅從硬件看,目前全球 20 億臺電腦中,他們推測,哪怕只有二十分之一的人配備個人 Agent 硬件,他們的規模也能到達 1 億臺。
但賣硬件也并不是他們能想到的終局,他們看到的一個更有想象力的未來是結合個人化端側模型,做成一個模型 + Agent 軟件 + 硬件一體的公司。
具體推演邏輯是,他們可以先通過硬件采集個人的工作流和習慣,并在端側建立起專屬的邏輯記憶體。
當累積了足夠多的數據后,他們會在端側設備上為用戶訓練一個屬于自己的個人化小模型,這個模型會把用戶所有的記憶、習慣甚至性格都封裝在本地設備里。
他們堅信,未來的操作系統一定是由這種結合了個人記憶、世界知識并且極其了解用戶的 “個人專屬 AI 模型” 來構成的——就如同每個人擁有專屬的 Mac 電腦和 macOS 操作系統一樣。
不過在遠景到來之前,首要的是先把產品賣出去。
Violoop 的產品目前已經成型,接下來的一個月,他們會在 Kickstarter 開始眾籌。
團隊員工現在已經是自家產品第一批用戶:他們的工程師用它寫代碼,運營用來自動篩選公眾號流量、抓取調研數據,兩位創始人則利用 Violoop 自動生成團隊周報,把十幾個人的任務進展總結提煉,省去了冗長的對齊會議。
除了桌面版的,他們目前還在研發一款帶磁吸功能的卡片版 Agent,可以單獨使用,成為配合手機的 Agent 助手;也可以與桌面版配合,通過這個硬件直接控制電腦。
雖然面臨的是一個大機會,兩位合伙人都認為自己并不追求在商業上成為最有影響力的那類人,對他們而言,更重要的是做一件前人沒做過、能突破對世界理解極限的 “酷” 事。
說到這里,何佳霖擼起袖子,露出他手上的一個圓形紋身,他說自己曾經覺得在地球這個圓里可以獲得無限的體驗,但后來意識到體驗世界也可以是另外一種方式,“就是真的是找到一個前人沒有走過的路,或者在前人的肩膀上,去突破對這個世界理解的極限。”
以下是篩選后的部分問答,與正文互為補充。
晚點:你們的 Agent 跟 Openclaw 在 Agent 的技術框架上有什么不一樣嗎?
何佳霖:接入外部 IM 這種其實都是通用的,本身也都是開放的接口,區別不大。
但我們主動介入用戶工作生活,是有一套我們自己的基于視覺的機制,這個跟龍蝦的定時還是不太一樣,當然定時我們其實也有。
然后記憶的實現方式我們跟龍蝦也不太一樣,他更多是基于文檔與向量數據庫,我們是多了很多圖形數據庫的能力。
我們走 HDMI 線,可以實時捕捉用戶的電腦屏幕的變化,然后通過本地的視覺識別與 VLM 進行理解與分析,在理解用戶正在使用電腦完成不同任務的意圖后,主動向用戶提示我們可以為用戶自動化完成與優化。
例如用戶正在整理報銷截圖到飛書,我們的 Agent 會告訴用戶,這件事兒我們看到了,要不要我們來幫用戶自動化?或者看到用戶正在查詢某些類型的新聞或資料,我們會主動告訴用戶,我可以為用戶去搜集更多相關的報道與調研報告。
晚點:現在 Openclaw 大火,對你們的影響是什么?
何佳霖:其實在 Openclaw 出之前,我們就已經寫過一個文章,當時定義的 Agent 的三大核心能力:一個就是主動性,一個是記憶,然后一個就是這種跨平臺、跨軟件的交互,跟它的執行能力幾乎一模一樣。所以它出來之后,我天吶服了……
晚點:是覺得你們沒有先出,讓他們先火了嗎?
何佳霖:人家先火這倒不是太大的問題,我還蠻認可 Peter (Paypal 創始人)的一句話,就是 competition is for losers。就是我們選這個方向的時候,當時就想說挑一個沒人在干的事兒……但它火了之后,未來肯定會出現更多想要去跟我們競爭的人,這個是一定的。
晚點:那你們的產品跟 Openclaw 的關系是什么?
何佳霖:我們理解 Openclaw 可能就是這個時代的 linux,它是所有操作系統的底層。Windows、mac、安卓其實都是基于 linux 進行二次開發。只不過回顧那個時代,沒有其他的 OS 是以純軟件的形式挑戰 linux,Windows 是封裝了 linux 之后,以 toB 協作的方式,把我的軟系統裝到 IBM 里面去,裝到戴爾里面,讓他們去幫 Windows 去做分發。而蘋果是我做一體,硬件自己做、軟件自己做,我的系統自己做。然后我去打造一個完整獨立的產品去賣給市場。
所以我們認為 OpenClaw 出來之后,一定還是會有類似于像 Windows 或者像 Mac 這樣的一個機會,他們一定是基于某種程度上依托于硬件,而純軟件的部分我認為無法挑戰。
晚點:一開始你們應該不知道 “軟件的部分無法挑戰”,為什么還去做了 Agent 硬件?
何佳霖:安全性、主動參與到用戶生活跟工作當中的感知力,外加上這種跨開源閉源軟件端到端的處理能力,這些是我們認為如果沒有硬件其實做不到的。
晚點:除了安全,你們的 Agent 硬件還有什么比較核心的壁壘?
何佳霖:記憶能力。當時給大客戶去做本地的這個知識庫,一開始用的就是那個向量數據庫,但是他們數據量太大了,完全靠向量數據庫質量也沒有那么高,所以我們又給配了圖形數據庫。
這樣的記憶方式,相當于是把整個邏輯鏈條整理出來,檢索的 Token 消耗量也會更少,因為它是很聚焦的。
晚點:現在也有一類是做 Agent 電腦的產品,想要未來可以取代現在的電腦,你們跟這類產品的區別是什么?
何佳霖:我們沒有想做一個獨立的 mac 是因為我們認為更高價值的工作跟更高價值的軟件或者是文件,其實還都是在用戶的主電腦上。
所以我們當時設計的就是怎么讓他去控制用戶的主電腦,這個是我們當時設計的一個核心。這也是為什么我們給他設計了這個 HDMI 的接口,以及這個 Type C 的接口。
晚點:為什么蘋果這樣擁有端側算力優勢的巨頭,目前還沒有推出類似的 Agent 服務?
何佳霖: 理論上最得天獨厚的其實就是蘋果,但是蘋果有兩大戰略上的考量 。第一層就是安全性,如果蘋果提供一個服務并做了一些用戶沒想到的操作,對于蘋果的品牌是有很大影響的 。第二層是蘋果如果這么去做,某種意義上是在跟它的開發者生態決裂 。它現在最大的無形資產是數以百萬計的開發者在免費寫 App,如果它做一個統一接口讓 Siri 控制微信、控制 Photoshop,騰訊和 Adobe 肯定不會同意。
題圖來源:Violoop 創始人、CEO 何佳霖
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.