網易首頁 > 網易號 > 正文申請入駐

AI智能體2026第一槍：阿里千問明確「雙重協議」路線

2026-01-18 19:30:48　來源: 周天財經

安徽舉報

分享至

文 | 周天財經

周天財經原創出品

2026，大概率是AI智能體的「大年」。

大模型經歷了三年的技術發展演進，行業敘事從chatbot（聊天機器人）時代，邁入「用AI替人辦事」的Agent時代。

就在最近，智能體全面接管我們日常生活的信號，就出現了。千問App上線了全新AI Agent能力「任務助理」，全面打通阿里生態，包括淘寶、閃購、飛豬、高德地圖和支付寶。

通俗來說，你張張嘴就有個AI助理替你點單，替你找餐廳、訂酒店。

在這個時間點，互聯網平臺都在暗暗準備各自的Agent方案和AI路線圖。

阿里是全生態一起上，能打通的盡量打通。

某搜索中廠，他們的發力點之一是AI醫療，正在暗中大舉招人，想把競價排名的模式在AI醫療里復現，哪家醫院付費意愿強，就把哪家作為答案直接給到用戶。搜索大廠缺乏自己的生態、用戶粘性和優質內容，只能回過頭把過去最賺錢的項目重新撿起來，用AI重做一次。

豆包則是推出了自己的硬件豆包手機，以「蔚來-江淮模式」開發出一個讓豆包擁有系統級權限的手機，主打通過「讀屏+模擬用戶點擊」的方式來接替用戶進行操作。

各家都在自己的能力稟賦和野心范圍內，進行著AI時代的進攻和防守。

AI一鍵生成文字圖片視頻，chatbot和你聊天，不管聊成啥樣，對我們普通人的影響還不算很大，最多是需要提防AI換臉騙術的可能性。

但Agent替你下單，替你聊天，涉及到錢和隱私的事兒，普通人的顧慮應該會高一個量級，不論是行業還是用戶，都需要關注背后的運行機制。

因此，這次我就拿放大鏡看看千問的運行邏輯，到底是怎么替你辦事，替你把錢付出去的。

我從千問的用戶說明里閱讀到這么一段文字：

合作方調用與數據授權。AI Agent在部分功能下需要調用合作平臺接口 (如淘寶、淘寶閃購)，為您提供自動購物、智能比價、外賣各類生活服務。

在您明確授權的前提下，我們會將您的必要個人信息共享給合作平臺，用于實現您的千問賬號與合作平臺賬號的綁定、數據互通及功能授權，具體共享的個人信息類型、使用目的見產品頁面提示。未經您的許可，我們不會擅自共享您的敏感個人數據。

用行業術語來說，這就明晰了合作模式是agent to agent之間的能力調用：千問和其合作平臺、應用簽署了調用協議——這屬于一種雙重授權機制，不僅千問和用戶之間簽署協議，千問還和不同平臺簽署協議，獲得調用許可。

整個大阿里生態的思路是一致的，就在這兩天，螞蟻支付寶還聯合千問App、淘寶閃購、Rokid、大麥、阿里云百煉等，正式發布ACT協議 (智能體商業信任協議)。這是中國首個面向Agent商業需求設計的開放技術協議框架，為AI與電商、外賣等服務平臺的協同打造一套「通用語言」，助力跨終端、跨系統、跨平臺的AI任務執行。

那么，在2026年的年初，路線區別就顯現出來了。

阿里千問所代表的「雙重授權機制」，是一種基于開放協議的合作模式。在這種模式下，AI Agent通過標準化授權協議與第三方服務進行對接，所有的數據交換都在結構化的接口中完成，權限邊界清晰可控，每一次操作都有完整的審計日志。這就像是外交渠道——走正門，遞國書，在明面上進行。

也是在不久前，豆包手機問世，則代表了另一種技術路線：「讀屏加模擬點擊」。它通過屏幕OCR識別界面元素，然后模擬人類點擊、勾選等觸控操作來完成任務。這種方式繞過了應用的邏輯層，直接在表現層進行操作，繞開了第三方平臺的配合或授權。形象地說，更像是翻窗入室——雖然也能進去辦事。

讀屏模擬路線最大優勢在于部署速度快、覆蓋范圍廣。由于不需要與任何平臺進行商務談判或技術對接，廠商可以單方面實現對幾乎所有應用的接管能力，這種「即插即用」的特性使其在市場競爭中具有明顯的先發優勢。

但從用戶側來看，這種便利性還是會打一些折扣。讀屏+模擬點擊路線，需要模擬人類點擊，需要跳轉App，再一頁一頁去翻、去識別、去填寫，而如果是兩個Agent之間簽有協議，瞬間就完成信息授權和互通。

業內人士認為，模擬點擊的便利性是有代價的，存在安全隱患和責任真空。API授權路線雖然部署緩慢、覆蓋范圍受限于平臺開放意愿，但它提供了精確的權限粒度控制和清晰的責任歸屬。

從資金安全和用戶隱私角度考慮，讓我們具體想象一個場景：用戶對AI說「幫我把余額寶的錢轉到銀行卡」。在讀屏模式下，為了完成這個任務，AI必須具備讀取屏幕上所有信息的能力，這意味著它實際上能看到用戶所有的賬戶余額、所有的交易記錄、所有的聯系人信息，并且可以模擬點擊任何按鈕——包括轉賬給任意賬戶。

還有一個敏感場景是好友之間的對話，特別是對方不知情的情況下，讓Agent幫自己回復信息，是節省了打字的麻煩，但讀屏讀的是當前頁面全部信息，很敏感的信息也會一覽無余，這一點上讀屏模式可能還是得拿出令人信服的風控方案。

責任歸屬的模糊性或許是最棘手的問題。假設AI誤操作導致轉錯賬或買錯股票，或者把一張情侶之間的照片發給了恰好同名的第三方，在API模式下，有完整的調用日志、授權記錄和明確的接口語義，可以清晰地追溯責任。但在讀屏模式下，AI Agent說它看到的是這個按鈕，App則說按鈕當時不在那個位置，整個事件無法復現、無法審計、無法鎖定責任。這種責任真空在金融場景中尤其不可忽視。

而從互聯網生態健康度的角度看，讀屏模式本質上是一種「寄生」關系，它鼓勵的是對抗而非合作。平臺一旦發現自己的應用被這種方式「入侵」，自然會采取技術反制措施，這將導致一場無休止的攻防戰。相反，API模式創造的是「共生」關系——Agent廠商獲得能力，平臺獲得流量和生態位，用戶獲得便利，各方都受益。

站在更加宏觀視角，讀屏模擬點擊路線，很可能使得滴滴、攜程、美團這類具有線下履約網絡的平臺，其線上的高利潤環節被繞開，商業價值被削弱，這會對產業產生巨大震蕩，Agent是幫用戶節省了三秒鐘，地球上就此消失了若干家世界五百強，這種路線，在當前經濟社會狀況下，應該是不會得到各方首推的。

我猜想一下趨勢可能的走向，在未來一到兩年的短期內，讀屏模式會在非敏感場景快速普及，比如查天氣、內容消費這類場合。而涉及到金融、支付和聊天場景，需要更加審慎。

站在旁觀者角度來看此次千問發布會，有一個意義是很突出的，阿里生態選擇雙重授權路線，能率先卡住A2A路線，有機會成為行業標準制定者，建立一個生態聯盟，有利于先把朋友搞得多多的。

合理推測，2026年，阿里必會推出自己定義的AI手機，甚至對于大多數頭部互聯網平臺來說，盡快推出自己定義的Agent手機，都是件迫在眉睫的事。

在AI敘事的另一個大國，2026年1月，谷歌也在行動，它聯合Shopify、沃爾瑪等全球零售業巨頭，發布「通用商務協議」（UCP），前沿探路者們都在試圖爭奪標準定義權。

在三到五年的中期，我預計會出現類似「Agent Protocol」的行業標準，主流應用會提供官方的Agent接入點，讀屏模式將退化為「最后手段」，用于那些尚未適配的長尾應用。

讀屏模擬是「證明Agent有用」的捷徑，API授權是「讓Agent可信」的必經之路。前者適合開荒探路，后者適合長久定居。站在不想被一眼看穿的普通用戶，以及產業能健康發展的角度，我們還是希望雙重授權的A2A模式，成為最終行業標準和共識，大家一起走得更加平穩一點。

*本文如有提及上市公司，僅作為研究交流用途，不構成推薦股票或相關金融產品的建議。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.