![]()
文 | 周天財經
周天財經 原創出品
2026,大概率是AI智能體的「大年」。
大模型經歷了三年的技術發展演進,行業敘事從chatbot(聊天機器人)時代,邁入「用AI替人辦事」的Agent時代。
就在最近,智能體全面接管我們日常生活的信號,就出現了。千問App上線了全新AI Agent能力「任務助理」,全面打通阿里生態,包括淘寶、閃購、飛豬、高德地圖和支付寶。
通俗來說,你張張嘴就有個AI助理替你點單,替你找餐廳、訂酒店。
在這個時間點,互聯網平臺都在暗暗準備各自的Agent方案和AI路線圖。
阿里是全生態一起上,能打通的盡量打通。
某搜索中廠,他們的發力點之一是AI醫療,正在暗中大舉招人,想把競價排名的模式在AI醫療里復現,哪家醫院付費意愿強,就把哪家作為答案直接給到用戶。搜索大廠缺乏自己的生態、用戶粘性和優質內容,只能回過頭把過去最賺錢的項目重新撿起來,用AI重做一次。
豆包則是推出了自己的硬件豆包手機,以「蔚來-江淮模式」開發出一個讓豆包擁有系統級權限的手機,主打通過「讀屏+模擬用戶點擊」的方式來接替用戶進行操作。
各家都在自己的能力稟賦和野心范圍內,進行著AI時代的進攻和防守。
AI一鍵生成文字圖片視頻,chatbot和你聊天,不管聊成啥樣,對我們普通人的影響還不算很大,最多是需要提防AI換臉騙術的可能性。
但Agent替你下單,替你聊天,涉及到錢和隱私的事兒,普通人的顧慮應該會高一個量級,不論是行業還是用戶,都需要關注背后的運行機制。
因此,這次我就拿放大鏡看看千問的運行邏輯,到底是怎么替你辦事,替你把錢付出去的。
我從千問的用戶說明里閱讀到這么一段文字:
合作方調用與數據授權。AI Agent在部分功能下需要調用合作平臺接口 (如淘寶、淘寶閃購),為您提供自動購物、智能比價、外賣各類生活服務。
在您明確授權的前提下,我們會將您的必要個人信息共享給合作平臺,用于實現您的千問賬號與合作平臺賬號的綁定、數據互通及功能授權,具體共享的個人信息類型、使用目的見產品頁面提示。未經您的許可,我們不會擅自共享您的敏感個人數據。
用行業術語來說,這就明晰了合作模式是agent to agent之間的能力調用:千問和其合作平臺、應用簽署了調用協議——這屬于一種雙重授權機制,不僅千問和用戶之間簽署協議,千問還和不同平臺簽署協議,獲得調用許可。
整個大阿里生態的思路是一致的,就在這兩天,螞蟻支付寶還聯合千問App、淘寶閃購、Rokid、大麥、阿里云百煉等,正式發布ACT協議 (智能體商業信任協議)。這是中國首個面向Agent商業需求設計的開放技術協議框架,為AI與電商、外賣等服務平臺的協同打造一套「通用語言」,助力跨終端、跨系統、跨平臺的AI任務執行。
那么,在2026年的年初,路線區別就顯現出來了。
![]()
阿里千問所代表的「雙重授權機制」,是一種基于開放協議的合作模式。在這種模式下,AI Agent通過標準化授權協議與第三方服務進行對接,所有的數據交換都在結構化的接口中完成,權限邊界清晰可控,每一次操作都有完整的審計日志。這就像是外交渠道——走正門,遞國書,在明面上進行。
也是在不久前,豆包手機問世,則代表了另一種技術路線:「讀屏加模擬點擊」。它通過屏幕OCR識別界面元素,然后模擬人類點擊、勾選等觸控操作來完成任務。這種方式繞過了應用的邏輯層,直接在表現層進行操作,繞開了第三方平臺的配合或授權。形象地說,更像是翻窗入室——雖然也能進去辦事。
讀屏模擬路線最大優勢在于部署速度快、覆蓋范圍廣。由于不需要與任何平臺進行商務談判或技術對接,廠商可以單方面實現對幾乎所有應用的接管能力,這種「即插即用」的特性使其在市場競爭中具有明顯的先發優勢。
但從用戶側來看,這種便利性還是會打一些折扣。讀屏+模擬點擊路線,需要模擬人類點擊,需要跳轉App,再一頁一頁去翻、去識別、去填寫,而如果是兩個Agent之間簽有協議,瞬間就完成信息授權和互通。
業內人士認為,模擬點擊的便利性是有代價的,存在安全隱患和責任真空。API授權路線雖然部署緩慢、覆蓋范圍受限于平臺開放意愿,但它提供了精確的權限粒度控制和清晰的責任歸屬。
從資金安全和用戶隱私角度考慮,讓我們具體想象一個場景:用戶對AI說「幫我把余額寶的錢轉到銀行卡」。在讀屏模式下,為了完成這個任務,AI必須具備讀取屏幕上所有信息的能力,這意味著它實際上能看到用戶所有的賬戶余額、所有的交易記錄、所有的聯系人信息,并且可以模擬點擊任何按鈕——包括轉賬給任意賬戶。
還有一個敏感場景是好友之間的對話,特別是對方不知情的情況下,讓Agent幫自己回復信息,是節省了打字的麻煩,但讀屏讀的是當前頁面全部信息,很敏感的信息也會一覽無余,這一點上讀屏模式可能還是得拿出令人信服的風控方案。
責任歸屬的模糊性或許是最棘手的問題。假設AI誤操作導致轉錯賬或買錯股票,或者把一張情侶之間的照片發給了恰好同名的第三方,在API模式下,有完整的調用日志、授權記錄和明確的接口語義,可以清晰地追溯責任。但在讀屏模式下,AI Agent說它看到的是這個按鈕,App則說按鈕當時不在那個位置,整個事件無法復現、無法審計、無法鎖定責任。這種責任真空在金融場景中尤其不可忽視。
而從互聯網生態健康度的角度看,讀屏模式本質上是一種「寄生」關系,它鼓勵的是對抗而非合作。平臺一旦發現自己的應用被這種方式「入侵」,自然會采取技術反制措施,這將導致一場無休止的攻防戰。相反,API模式創造的是「共生」關系——Agent廠商獲得能力,平臺獲得流量和生態位,用戶獲得便利,各方都受益。
站在更加宏觀視角,讀屏模擬點擊路線,很可能使得滴滴、攜程、美團這類具有線下履約網絡的平臺,其線上的高利潤環節被繞開,商業價值被削弱,這會對產業產生巨大震蕩,Agent是幫用戶節省了三秒鐘,地球上就此消失了若干家世界五百強,這種路線,在當前經濟社會狀況下,應該是不會得到各方首推的。
我猜想一下趨勢可能的走向,在未來一到兩年的短期內,讀屏模式會在非敏感場景快速普及,比如查天氣、內容消費這類場合。而涉及到金融、支付和聊天場景,需要更加審慎。
![]()
站在旁觀者角度來看此次千問發布會,有一個意義是很突出的,阿里生態選擇雙重授權路線,能率先卡住A2A路線,有機會成為行業標準制定者,建立一個生態聯盟,有利于先把朋友搞得多多的。
合理推測,2026年,阿里必會推出自己定義的AI手機,甚至對于大多數頭部互聯網平臺來說,盡快推出自己定義的Agent手機,都是件迫在眉睫的事。
在AI敘事的另一個大國,2026年1月,谷歌也在行動,它聯合Shopify、沃爾瑪等全球零售業巨頭,發布「通用商務協議」(UCP),前沿探路者們都在試圖爭奪標準定義權。
在三到五年的中期,我預計會出現類似「Agent Protocol」的行業標準,主流應用會提供官方的Agent接入點,讀屏模式將退化為「最后手段」,用于那些尚未適配的長尾應用。
讀屏模擬是「證明Agent有用」的捷徑,API授權是「讓Agent可信」的必經之路。前者適合開荒探路,后者適合長久定居。站在不想被一眼看穿的普通用戶,以及產業能健康發展的角度,我們還是希望雙重授權的A2A模式,成為最終行業標準和共識,大家一起走得更加平穩一點。
*本文如有提及上市公司,僅作為研究交流用途,不構成推薦股票或相關金融產品的建議。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.