原本以為,三星 Galaxy S26 系列早已被曝光,發(fā)布會(huì)也就走個(gè)流程。沒(méi)想到三星和 Google 還藏了一手。
兩家公司共同展示了 S26 搭載的全新 Gemini 智能體能力:口頭吩咐一句話,Gemini 就能在 Uber 幫你打車(chē),或者 DoorDash 上點(diǎn)外賣(mài)。
![]()
圖源:Android Central
這個(gè)功能目前還處于早期預(yù)覽階段,僅在美國(guó)和韓國(guó)提供。
你可以理解為,Google 和三星一起聯(lián)手,做了一個(gè)全球版的「豆包手機(jī)」(準(zhǔn)確來(lái)說(shuō)叫豆包手機(jī)助手)。
Galaxy S26 系列只是開(kāi)始,這些能力后續(xù)會(huì)推送到 Google Pixel 10 手機(jī),以及更多 Android 17 設(shè)備上。
在看過(guò)、用過(guò)許多個(gè)手機(jī)/電腦系統(tǒng)級(jí) AI 智能體,也深度使用過(guò)「豆包手機(jī)」之后,再看這次的 Gemini 智能體,我覺(jué)得關(guān)于它的討論不該止于一個(gè)「新功能」。
誠(chéng)然,這不是 Android 操作系統(tǒng)的底層框架首次為了容納智能體而被深度定制——包括 OPPO、榮耀、華為等在內(nèi)的許多廠商都已經(jīng)做了相當(dāng)多的早期的嘗試。
但這可是 Google,是 Android 操作系統(tǒng)的絕對(duì)擁有者。
如果說(shuō)字節(jié)跳動(dòng)作為一個(gè)「外人」,做的嘗試對(duì)國(guó)民級(jí) app 犯了「大不敬」——Google 來(lái)做這件事情,意義就完全不一樣了。
不過(guò)別急,我們還是先看看,這次 Google 和三星做的「豆包手機(jī)」,到底怎么一回事。
三星「豆包手機(jī)」,用起來(lái)怎么樣?
三星和 Google 這次展現(xiàn)的「Gemini 自動(dòng)任務(wù)」能力,能夠模仿人類(lèi)操作手機(jī),從而實(shí)現(xiàn)任務(wù)的自動(dòng)化。背后的實(shí)現(xiàn)思路,是 AI 讀屏理解 + 系統(tǒng)底層/應(yīng)用層 API 的雙重路徑。
需要注意的是,字節(jié)和努比亞共同開(kāi)發(fā)的「豆包手機(jī)」,重度使用系統(tǒng)級(jí)權(quán)限的能力,以及讀屏,而非 API。你可以理解為,豆包手機(jī)主要走的是「沒(méi)跟應(yīng)用開(kāi)發(fā)者打好招呼」的(至少主流國(guó)民級(jí) app 沒(méi)有),「硬來(lái)」的實(shí)現(xiàn)思路,也為國(guó)民級(jí) app 對(duì)其封殺抵制留下了把柄。
而三星和 Google 這次在 Galaxy S26 系列上做的 Gemini 智能體,可以說(shuō)兩者兼?zhèn)洹8鶕?jù)三星方面透露的信息,其應(yīng)用商城排名前 200 的應(yīng)用都能支持(但僅限特定應(yīng)用的使用效果可以保證,后面詳述)——說(shuō)明三星、Google 至少大體上這些應(yīng)用開(kāi)發(fā)者打好了招呼。
![]()
我們來(lái)看《連線》雜志的體驗(yàn)效果:直接呼出 Gemini,告訴它自己要去機(jī)場(chǎng),Gemini 應(yīng)用本身會(huì)打開(kāi)一個(gè)「虛擬窗口」中打開(kāi) Uber,并在后臺(tái)開(kāi)始執(zhí)行這個(gè)動(dòng)作,用戶可以隨時(shí)點(diǎn)擊進(jìn)入查看 Gemini 的執(zhí)行進(jìn)程。
由于當(dāng)?shù)赜袔讉€(gè)不同的機(jī)場(chǎng),Gemini 很快又提醒用戶選擇合適的目的地;下單時(shí),Gemini 也會(huì)把界面推到用戶面前,方便用戶選擇合適的車(chē)輛并支付。
Gemini 的「虛擬窗口」,可以理解為一個(gè)沙箱化的「虛擬機(jī)」,是 Google 對(duì)用戶隱私保護(hù)的一種考量。
過(guò)去的 Gemini 運(yùn)行在 Android 系統(tǒng)中,但這次的新 Gemini 智能體操作應(yīng)用時(shí),僅限在這個(gè)沙箱內(nèi)工作,并不會(huì)觸及設(shè)備的其他部分。
再多提一嘴:如果大家用過(guò) Manus、 月暗的 Kimi computer、智譜 AutoGLM 等,具備云電腦/云手機(jī)能力的智能體產(chǎn)品,應(yīng)該就很容易理解這個(gè) Gemini 虛擬機(jī)的邏輯了。
![]()
圖源:9To5Google
這算是相當(dāng)簡(jiǎn)單的任務(wù),不少國(guó)產(chǎn) AI 手機(jī)助手在一年前都已經(jīng)攻克了這種場(chǎng)景。
而 Gemini 更加殺手級(jí)的能力,是和此前已經(jīng)長(zhǎng)線布局的讀屏、抓信息特性相結(jié)合。
比如,當(dāng)用戶和朋友聊到聚會(huì)要訂披薩,用戶可以直接叫出 Gemini,吩咐一句「弄清楚訂單」,Gemini 就能直接抓取聊天中提到的披薩店,甚至特定的披薩種類(lèi),整理好每個(gè)人的需求。
![]()
隨后,用戶可以直接讓 Gemini 在外賣(mài)平臺(tái) Grubhub 上點(diǎn)外賣(mài),AI 會(huì)按照剛梳理完成的訂單需求,在后臺(tái)自動(dòng)化把所有食物添加到購(gòu)物車(chē),交付給用戶確認(rèn)和下單。
![]()
有時(shí),訂餐的情況會(huì)沒(méi)那么順利,Gemini 也會(huì)嘗試自己先去解決突發(fā)狀況,并給用戶提供解決方案。有一次,披薩店在繁忙時(shí)段限制了大號(hào)披薩的下單量,Gemini 就會(huì)詢問(wèn)能不能點(diǎn)兩個(gè)中號(hào)代替。
還有一個(gè)例子:用 Google Keep 筆記列舉了燒烤派對(duì)的出席名單,并標(biāo)注了素食主義者。Gemini 可以先計(jì)算好整個(gè)派對(duì)總共需要多少熱狗和面包,然后再讓它去采購(gòu)食材,幾分鐘后商品全部被安放在了 DoorDash 平臺(tái)的購(gòu)物車(chē)?yán)铩?/p>
Google Android 生態(tài)系統(tǒng)總裁 Sammer Samat 透露,Gemini 并非提前「記住」了這些平臺(tái)操作的步驟和線路,而是真的在利用推理能力,模仿人類(lèi)查看屏幕并進(jìn)行下一步操作,這意味著 Gemini 未來(lái)能在更多場(chǎng)景發(fā)揮潛力。
這里你能看到,Gemini 首批主打訂餐、叫車(chē)場(chǎng)景,這一點(diǎn)倒是更像春節(jié)前千問(wèn)所做的事情。
![]()
圖源:Wired
又一個(gè)「豆包手機(jī)」,來(lái)自 Android 官方
對(duì)比真正「全能」,連微信收藏都能幫忙找的豆包手機(jī)助手(至少在被抵制之前),Gemini 目前的能力還相當(dāng)局限,聚焦在打車(chē)、外賣(mài)、雜貨這些日常場(chǎng)景,雖說(shuō)底層技術(shù)能力更強(qiáng),但用戶的實(shí)機(jī)使用效果,跟鴻蒙的小藝、榮耀的 YOYO 等國(guó)產(chǎn)手機(jī) AI 助手并無(wú)太大不同。
不過(guò)正如文章一開(kāi)頭提到,Google 手握一整個(gè) Android 生態(tài),有著絕對(duì)的號(hào)召力和掌控力。
隨著 Gemini 自動(dòng)化能力的發(fā)布,Google 也詳細(xì)公開(kāi)了背后 Android 系統(tǒng)的底層布局和未來(lái)計(jì)劃——有兩個(gè)方向,簡(jiǎn)單來(lái)說(shuō),就是既「蘋(píng)果」又「豆包」。
首先,Google 去年發(fā)布了一個(gè)名叫「AppFunctions」的框架,允許開(kāi)發(fā)者公開(kāi)應(yīng)用特定的功能和特性入口,以便 AI 助手調(diào)用。
Google 將 AppFunctions 類(lèi)比為 Android 的「模型上下文協(xié)議」(MCP),可以簡(jiǎn)單理解為一個(gè)對(duì)話標(biāo)準(zhǔn),幫助第三方的 App 應(yīng)用和 AI 模型進(jìn)行對(duì)接。
![]()
這個(gè)框架類(lèi)似蘋(píng)果的 App Intents。在蘋(píng)果的構(gòu)思中,用戶可以使喚 Siri 來(lái)操作各種 app 來(lái)實(shí)現(xiàn)功能,而底層實(shí)現(xiàn)方式就是通過(guò) App Intents ——新一代 Siri 遲遲不能落地的前提下,App Intents 足以提供不錯(cuò)的效果。
Google 的 AppFunctions 也是同理。
比如用戶下達(dá)指令,希望能從好友的電子郵件中找到一個(gè)食譜,并將相關(guān)配料加入購(gòu)物清單中。AI 接到命令,首先調(diào)用郵件 App「搜索」的功能入口,檢索并提取出相關(guān)內(nèi)容,然后調(diào)用備忘錄的「購(gòu)物清單」入口,把數(shù)據(jù)填入整理。
一些 AppFunction 功能已經(jīng)在三星 Galaxy S26 和 One UI 8.5 系統(tǒng)中落地。比如,用戶可以對(duì) Gemini 下達(dá)指令,找出相冊(cè)中的特定照片,并用短信發(fā)送給朋友。
需要注意的是,整個(gè)過(guò)程中,Gemini 不需要打開(kāi)相冊(cè)和短信 App,甚至沒(méi)離開(kāi) Gemini App,而是通過(guò) AppFunctions,把對(duì)應(yīng)入口抓取到 Gemini 之中執(zhí)行操作,效率更高。
本質(zhì)上,基于 AppFunctions 的實(shí)現(xiàn)方式,和過(guò)去的 API 路徑邏輯相同。這是一種「打好了招呼」的解題思路。
![]()
但是,并非所有 App 都做好了相關(guān)的適配。沒(méi)關(guān)系,Google 還做了另一手準(zhǔn)備。
昨天發(fā)在 Android 開(kāi)發(fā)者博客上的一篇文章中,Google 明確提出:公司還在開(kāi)發(fā)一個(gè) UI 自動(dòng)化的框架,讓 AI 助手和第三方應(yīng)用模仿人類(lèi),直接打開(kāi) App 一步步操作。
![]()
——這,就是翻版的「豆包手機(jī)」了。
不過(guò),盡管 Google 說(shuō)以后 UI 自動(dòng)化會(huì)承擔(dān)真正的「重活」,在這次的 Galaxy 26 系列當(dāng)中,UI 自動(dòng)化只是一個(gè)「早期預(yù)覽版」。
![]()
▲ 豆包手機(jī)幫我種草比價(jià)洗發(fā)水
如果說(shuō) AppFunctions 需要 App 開(kāi)發(fā)者進(jìn)行額外的適配工作,那么 UI 自動(dòng)化框架則是把工作量都留給 AI 智能體,無(wú)需任何額外適配,但效果非常取決 AI 智能體的能力,優(yōu)勢(shì)就在于一上線就能覆蓋大量應(yīng)用。
現(xiàn)在你可以看到,在 Google 的 Android Gemini 智能體計(jì)劃中,AppFunctions 和 UI 自動(dòng)化是兩條路線,互為補(bǔ)充:通過(guò)規(guī)范化、可追溯的接口方式來(lái)確保最大限度的兼容性,同時(shí)為真正代表未來(lái)的讀屏交互模式打好基礎(chǔ)。
Google 還表示,這不會(huì)只是 Gemini 的專屬功能,而是 Android 系統(tǒng)的特性。
這也意味著,未來(lái)不管是手機(jī)廠商自己內(nèi)置的 AI 助手,還是 ChatGPT 等第三方應(yīng)用,都能調(diào)用 AppFunctions 執(zhí)行任務(wù),或者「讀懂」手機(jī) UI 進(jìn)行自動(dòng)操作。
值得一提的是,在國(guó)行用不了 Gemini 的情況下,三星 Galaxy S26 的 Bixby 助手也能實(shí)現(xiàn)點(diǎn)外賣(mài)、叫車(chē)、電商比價(jià)的功能。
我們可以合理推斷,三星在國(guó)內(nèi)也找到了一家模型供應(yīng)商來(lái)替代 Gemini 的身份,至于這些大模型小龍當(dāng)中具體是誰(shuí),可能就取決于過(guò)去一年里誰(shuí)在手機(jī)智能體上成績(jī)更突出了。
![]()
AI 手機(jī)的道路,不會(huì)只有「孤勇者」
去年「豆包手機(jī)」驚艷亮相,又因?yàn)榱钊诉z憾的情況而「早夭」。在深感遺憾的同時(shí),也讓我們不禁去思考,AI 自動(dòng)化的模式,就是 AI 手機(jī)的理想模式嗎?
這個(gè)問(wèn)題,沒(méi)有個(gè)三五年也得不出答案。至少,豆包手機(jī)不是單打獨(dú)斗,手握 Android 系統(tǒng)的 Google,同樣選擇了這個(gè)路線,而且話語(yǔ)權(quán)大得多。
![]()
其實(shí)當(dāng)豆包手機(jī)火到海外之后,就有網(wǎng)友開(kāi)始暢想,如果 Google 在 Pixel 以及 Android 手機(jī)上推廣這個(gè)技術(shù),那前景將會(huì)非常廣闊。
雖然我覺(jué)得,Google 對(duì)于怎么回答「AI 手機(jī)」這個(gè)命題,其實(shí)也沒(méi)有一個(gè)非常清晰的答案,更像是因?yàn)槭稚贤瑫r(shí)有 AI、系統(tǒng)和硬件,每個(gè)方向都嘗試一下,說(shuō)不定就有一條路跑通了。
但至少,Google 已經(jīng)為 Android 打好了「系統(tǒng)級(jí)自動(dòng)化」的樣板,接下來(lái)不少新機(jī),都有了化身「豆包手機(jī)」的潛力。
這個(gè)浪潮或許還不止于 Android 陣營(yíng)。別忘了,蘋(píng)果已經(jīng)和 Google 達(dá)成合作,Gemini 將成為 Siri 的技術(shù)支持。而 App Intents 和 AppFunctions 又非常相似……
![]()
AI Siri 的演示
再往前看一點(diǎn):Gemini 智能體甚至不只局限于 AI 手機(jī)。在 Sammer Samat 設(shè)想中,未來(lái)智能眼鏡、AI 吊墜,甚至是汽車(chē),只要有 Gemini,就能用它來(lái)完成復(fù)雜的任務(wù)——當(dāng)然,這樣的場(chǎng)景距離落地還有距離。
不過(guò),Google 也只是在技術(shù)層面跑通了 AI 自動(dòng)化的路線,而范式成立,不代表問(wèn)題消失。豆包手機(jī)當(dāng)時(shí)遇到的種種矛盾,也會(huì)成為后來(lái)者不得不面對(duì)的挑戰(zhàn)。
首先當(dāng)然是隱私和安全問(wèn)題。Google 的餅畫(huà)得很大,未來(lái)調(diào)用、操作手機(jī) App 的將不僅限于 Gemini,一些第三方 AI 應(yīng)用能更深入用戶的數(shù)據(jù)核心,如果有偽裝的惡意應(yīng)用利用了這些接口,也會(huì)造成更大的損失。
![]()
圖源:9To5Google
更激烈的矛盾,是手機(jī)硬件廠商、模型/智能體能力提供商、大平臺(tái)應(yīng)用這三者之間,圍繞 AI 時(shí)代新「入口」的爭(zhēng)奪。這也是原版的豆包手機(jī),一度最難逾越的高墻。
畢竟,用 Gemini 叫車(chē),可能意味著用戶不用再看到 Uber 的會(huì)員促銷(xiāo)、廣告推薦,甚至不再形成品牌黏性,直接損害到應(yīng)用服務(wù)商/廣告行業(yè)的收益。
中國(guó)有互聯(lián)網(wǎng)/AI 巨頭,海外何嘗不是如此?像 Meta、Amazon 這樣的老對(duì)手,本身還擁有強(qiáng)勢(shì)的平臺(tái)與生態(tài),它們未必心甘情愿對(duì) Google 開(kāi)放,讓 Gemini 來(lái)自動(dòng)化一切。
無(wú)論是以隱私、安全,還是平臺(tái)規(guī)則為由,設(shè)置限制、提高接入門(mén)檻,博弈必然發(fā)生,爭(zhēng)斗將進(jìn)一步白熱化。
至少 Google 對(duì)未來(lái)很有信心。Sammer Samat 認(rèn)為,AI 技術(shù)已經(jīng)進(jìn)入了「正在進(jìn)行時(shí)」,開(kāi)發(fā)者與其絞盡腦汁對(duì)抗 ,還不如去思考一個(gè)合適的方式擁抱它。
新與舊的對(duì)抗不可避免,即便是用戶量再大的國(guó)民級(jí)應(yīng)用也不會(huì)永遠(yuǎn)獨(dú)善其身。最終的勝利者,多半可能是那些在變革前夜,就已經(jīng)在勇敢追逐的玩家。
參考資料:
https://android-developers.googleblog.com/2026/02/the-intelligent-os-making-ai-agents.html
歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知
我們正在招募伙伴
簡(jiǎn)歷投遞郵箱hr@ifanr.com
?? 郵件標(biāo)題「姓名+崗位名稱」(請(qǐng)隨簡(jiǎn)歷附上項(xiàng)目/作品或相關(guān)鏈接)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.