![]()
整理 | 鄭麗媛
出品 | CSDN(ID:CSDNnews)
25 美元(約合人民幣 173 元),你會拿來做什么?
買一頓外賣、充一次話費,或者隨手下單一個藍牙耳機?但在美國一位喜歡折騰 AI 的開發者(本文稱他為 Ethan)看來,這 25 美元,足夠搭出一個“物理世界可操作的智能體”。
他做了一件聽起來有點離譜的事:在一臺沃爾瑪售價 25-30 美元的預付費安卓手機上,跑起了最近很火的 OpenClaw,讓它通過 Discord 接收指令,然后直接控制手機硬件——開手電筒、拍照識別、讀取傳感器,甚至嘗試打電話。
![]()
更有意思的是,他還不滿足于一臺,而是打算搞一整排手機,做成一個Agent“手機集群”。
![]()
從聊天機器人到“能動手”的 Agent
Ethan 的方案其實并不復雜,核心結構是:
● 在安卓手機上安裝 Termux(一個安卓上的類 Linux 終端環境)
● 在 Termux 中運行 OpenClaw Agent
● 通過 Termux API 調用安卓系統能力
● 通過 Discord 與 Agent 對話
換句話說,這臺 25 美元的手機,變成了一個隨時在線的“硬件執行節點”。例如,他可以在 Discord 里發出指令:“Hey Claw,幫我把手電筒打開再關掉。”幾秒鐘后,手機手電筒亮起,又熄滅。
這背后的流程并不神秘:OpenClaw 接收 Discord 消息,調用 Termux API,再由 API 調用安卓系統接口完成硬件操作——原本只有 App 或系統進程才能做的事情,現在交給了一個語言模型驅動的 Agent。
在 Ethan 看來,真正有趣的并不是“能開手電筒”,而是“模型開始擁有物理執行能力”。
![]()
拍照+GPT 5.2:一臺入門機的視覺能力
為了驗證這不是“玩具級 Demo”,他又做了一個更具象的測試。
他對 Agent 說:“用后置攝像頭拍一張照片,然后告訴我你看到了什么。”接著,他把手機對準桌上的一塊 Raspberry Pi。手機拍照成功,畫面通過 Discord 回傳。隨后圖片被送入當前配置的模型,也就是通過GPT 5.2進行視覺分析。
對此,模型返回的描述是:“一塊單板計算機,Raspberry Pi,以及連接的 USB 線纜。”
這個任務實現了:低端安卓機負責采集圖像,云端大模型負責視覺理解,Discord 負責交互,Agent 負責流程編排——一個完整的“感知—理解—反饋”閉環,就這樣在 25 美元的硬件上跑通了。
![]()
不僅能感受手機姿態,還可以打電話
不僅如此,Ethan 還測試了傳感器能力。他問:“現在手機的姿態是什么?”
Agent 調用加速度計數據,分析重力方向,最終回復:手機大致處于豎直直立狀態——那一刻,手機確實是被他豎著拿在手里的。
這說明,Agent 不再只是“文本理解系統”,而是能夠讀取真實物理狀態的系統節點。例如 IMU、攝像頭、閃光燈,這些原本服務于 App 的硬件,現在都成了 AI 的工具箱。
或許有人要問了,既然能調攝像頭、能讀傳感器,那能不能打電話?
理論上是可以的。Ethan 讓 Agent 去聯系人列表里查找“Mike”并撥號,手機確實調起了撥號界面,并嘗試發起通話——不過,畢竟這是一臺沒有實際綁定號碼的預付費手機,通話自然失敗。
說到這里,Ethan 還補充了一點:“如果想讓 OpenClaw 監聽麥克風音頻或發送語音,手機需要 Root 權限。但我這臺沒 Root,所以做不到,因為安卓對通話、音頻這類權限做了非常嚴格的沙箱隔離。”
![]()
未來暢想:搭建一個“手機集群”
事實上,當下有不少開發者都選擇用 Mac Mini 或小型服務器跑 Agent 集群,優勢在于硬件性能強、部署穩定、環境可控。相較之下,Ethan 選擇用低價手機跑 OpenClaw 的決定不免令人意外。
經過了以上演示,Ethan 表示這臺 25 美元的廉價手機雖然配置有限,但作為 OpenClaw 的入門級運行設備,已經足夠優秀:“對于很多想嘗試 OpenClaw 但不想花費太多錢購置硬件的開發者來說,這類廉價預付費手機是一個絕佳的選擇,它能讓你快速上手,體驗 AI 智能體操控硬件的樂趣。”
不過他也客觀承認,若預算充足,還是更推薦用樹莓派運行 OpenClaw:
“樹莓派搭載的是原生 Linux 系統,不需要像安卓手機這樣,為了繞過系統限制去折騰 OpenClaw 的配置,使用起來更便捷,也能避免很多兼容性問題。”
至于未來規劃,Ethan 透露下一步他想搭建一個“手機集群”:“現在很多人會購置多臺 Mac mini 搭建 OpenClaw 集群,我也想嘗試用幾臺這種廉價安卓手機,組成一個手機集群,每臺手機都跑上 OpenClaw 智能體,然后通過 Discord 同時與所有智能體交互,看看能實現哪些更有趣的功能。”
![]()
社區質疑:手機集群,真有用嗎?
Ethan的視頻發出后,評論區的聲音頗為分裂。
有人直言:“很酷,但我想不到集群控制手機有什么實際用途。”也有人開始腦洞大開:
● 可以做成一個極低成本的安防系統:當檢測到畫面移動時,自動錄制 15 秒視頻并通過短信或郵件發送給主人——理論上,這套邏輯確實可行。手機自帶攝像頭、網絡、傳感器,只要 Agent 能夠串聯觸發條件與發送邏輯,它就可以變成一個分布式監控節點。
● 也有評論開玩笑提到,可以給所有手機插上 SIM 卡,它們就成了一個“社交媒體點贊農場”。
在眾多評論中,還有一個更現實的聲音。
過去很多人想做類似實驗,卻被模型成本卡住。調用頂級模型 API 需要訂閱費用;而本地可運行的開源模型,往往動輒 40GB 內存起步。對于只有 10~20GB 可用內存的普通開發者來說,幾乎不可能流暢運行。
而如今,通過云端 API + 低端硬件采集的組合,反而成了一種折中方案:重計算交給云端,大模型只負責理解,手機只負責感知和執行——這讓更多“窮折騰”的開發者也有機會參與進來。
那么,你對于 Ethan 的這項實驗又有何看法呢,歡迎在評論區留言。
參考鏈接:https://www.reddit.com/r/AgentsOfAI/comments/1qybhk2/this_guy_installed_openclaw_on_a_25_phone_and/
未來沒有前后端,只有 AI Agent 工程師。
這場十倍速的變革已至,你的下一步在哪?
4 月 17-18 日,由 CSDN 與奇點智能研究院聯合主辦「2026 奇點智能技術大會」將在上海隆重召開,大會聚焦 Agent 系統、世界模型、AI 原生研發等 12 大前沿專題,為你繪制通往未來的認知地圖。
成為時代的見證者,更要成為時代的先行者。
奇點智能技術大會上海站,我們不見不散!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.