![]()
新智元報道
編輯:艾倫
【新智元導(dǎo)讀】Anthropic最新報告揭示,AI智能體近半數(shù)使用量集中在軟件工程,其余16個垂直行業(yè)各占不到9%。AI已具備連續(xù)工作5小時的能力,但用戶目前最多只讓它跑42分鐘,信任遠(yuǎn)未跟上技術(shù)。Y Combinator CEO陳嘉興斷言:這片幾乎空白的行業(yè)版圖里,藏著下一代300個獨(dú)角獸。
你所在的行業(yè),可能還沒見過哪怕一分鐘的AI智能體。
這個事實(shí)本身蘊(yùn)含著巨大的機(jī)會。
2026年2月18日,Anthropic發(fā)布了一份關(guān)于AI智能體實(shí)際使用情況的大規(guī)模研究報告(報告:https://anthropic.com/research/measuring-agent-autonomy),分析對象是其公共API上數(shù)百萬次真實(shí)的人機(jī)交互。
報告的核心發(fā)現(xiàn)可以濃縮成一張柱狀圖。
![]()
軟件工程獨(dú)占了49.7%的智能體工具調(diào)用量,像一根拔地而起的煙囪。
剩下的16個垂直行業(yè)——醫(yī)療、法律、金融、教育、客服、物流,每一個的份額都是個位數(shù):醫(yī)療1%。法律0.9%。教育1.8%,沒有任何一個超過9%。
Y Combinator的CEO陳嘉興(Garry Tan)盯著這張圖,得出了一個讓很多創(chuàng)業(yè)者坐不住的結(jié)論:那片幾乎空白的區(qū)域,藏著下一代300個獨(dú)角獸。
他的原話更直白:「如果我今天創(chuàng)業(yè),我會盯著那張柱狀圖上那一大片紅色區(qū)域,直到從中看到自己的未來。」
你的AI比你以為的能干得多
這份報告里有一組數(shù)據(jù),適合貼在每個產(chǎn)品經(jīng)理的工位上。
獨(dú)立評估機(jī)構(gòu)METR的測試結(jié)果顯示,Claude已經(jīng)能夠獨(dú)立完成需要人類近5小時才能搞定的工作。然而在實(shí)際使用中,即便是全球最激進(jìn)的那批用戶(統(tǒng)計意義上的第99.9百分位),單次讓AI連續(xù)工作的時長也不過42分鐘左右。
![]()
5小時的能力,42分鐘的授權(quán)。
這中間巨大的落差,陳嘉興給它起了個名字叫「部署積壓」(deployment overhang)。
翻譯成大白話就是:AI已經(jīng)準(zhǔn)備好了,人還沒準(zhǔn)備好。
好消息是,人正在追趕。
從2025年10月到2026年1月,這個第99.9百分位的會話時長幾乎翻了一倍,從不到25分鐘漲到42分鐘。
值得留意的是,這條增長曲線非常平滑,并沒有因?yàn)樾履P偷陌l(fā)布出現(xiàn)突然跳升。
換句話說,驅(qū)動變化的主力不是模型變聰明了,而是人類在一次又一次的協(xié)作中,學(xué)會了慢慢松手。
Anthropic內(nèi)部的使用數(shù)據(jù)印證了同樣的趨勢。
2025年8月到12月,Claude Code在最困難任務(wù)上的成功率翻倍,每次會話中人工介入的次數(shù)從5.4次降到了3.3次。
對于正在考慮創(chuàng)業(yè)方向的人來說,這意味著一件很具體的事:窗口期還在。
絕大多數(shù)行業(yè)甚至還沒開始認(rèn)真嘗試讓AI智能體介入自己的核心工作流。
不是技術(shù)不行,是信任還沒到。
老手更敢放手,也更敢叫停
關(guān)于人和AI如何磨合出默契,這份報告講了一個很有意思的故事。
剛開始用Claude Code的人,只有大約20%的會話選擇了「全自動批準(zhǔn)」模式——也就是讓AI自己跑,不用每一步都等人點(diǎn)頭。
累計使用超過750次之后,這個比例上升到40%以上。
信任在日復(fù)一日的使用中緩慢生長,可以被精確測量。
反直覺的地方在于:那些更愿意放手讓AI跑的老用戶,同時也更頻繁地打斷它。
新手的打斷率大約是5%,老手反而到了9%。
![]()
這看起來矛盾,其實(shí)是兩種截然不同的工作方式。
新手像是在考場上監(jiān)考,AI每寫一道題都要看一眼。
老手更像是委托了一個信得過的下屬,平時不盯著,一旦感覺方向不對立刻喊停。
從「逐項(xiàng)審批」到「委托+監(jiān)控」,這種轉(zhuǎn)變對理解人機(jī)協(xié)作的未來至關(guān)重要。
另一個容易被忽視的細(xì)節(jié):在復(fù)雜任務(wù)中,Claude主動暫停來向用戶確認(rèn)的次數(shù),是用戶主動打斷它的兩倍還多。
AI在拿不準(zhǔn)的時候會停下來問一聲,而非悶頭往前沖。
Anthropic的研究團(tuán)隊(duì)提煉出一個核心概念來描述這種動態(tài)——「共建」。
AI智能體的自主程度,不是模型單方面決定的。
它由三方力量塑造:模型在不確定時選擇暫停,用戶隨經(jīng)驗(yàn)調(diào)整監(jiān)管尺度,產(chǎn)品設(shè)計在中間架設(shè)橋梁。
這個發(fā)現(xiàn)直指當(dāng)下最熱的AI監(jiān)管爭論。
如果政策要求人類必須「逐項(xiàng)審批AI的每一個動作」,結(jié)果大概率是生產(chǎn)力被扼殺,安全性卻沒有實(shí)質(zhì)提升。
報告中的數(shù)據(jù)也支持了這種判斷:73%的工具調(diào)用有人在回路中監(jiān)管,僅0.8%的操作屬于不可逆類型。
而那些看起來高風(fēng)險的極端案例(API密鑰操作、自主加密貨幣交易),經(jīng)核實(shí)大多是安全團(tuán)隊(duì)做的紅隊(duì)演練,不是真實(shí)生產(chǎn)場景。
護(hù)城河在行業(yè)里,不在模型里
看到這里,可能有人要問:既然垂直行業(yè)機(jī)會這么大,為什么大家都擠在軟件工程里?
答案并不復(fù)雜。
代碼是可測試、可回滾、出錯成本低的——寫壞了一段代碼,最多回退一個版本。
但你讓AI幫一個病人處理醫(yī)保報銷,或者替律師做證據(jù)開示,出了錯可能是一場訴訟。
軟件工程的智能體滲透率高,本質(zhì)上是因?yàn)檫@個領(lǐng)域的「容錯空間」最寬裕。
Box的CEO Aaron Levie點(diǎn)出了垂直AI創(chuàng)業(yè)的真正壁壘所在:能把遺留工作流吃透,能在監(jiān)管的夾縫中找到產(chǎn)品路徑,能幫客戶推動組織內(nèi)部的變革。
![]()
誰都可以在大模型外面包一層界面做個「AI殼」。
但要讓智能體在醫(yī)療賬單審核、法律合同檢索或建筑許可審批這些場景里真正跑起來,創(chuàng)業(yè)者必須比客戶自己還懂那個行業(yè)的痛點(diǎn)和雷區(qū)。
這也是為什么陳嘉興認(rèn)為垂直AI公司天然具備防御性。
他提了一筆大賬:過去二十年,SaaS行業(yè)每十年規(guī)模增長十倍,超過40%的風(fēng)險投資流入了SaaS公司,催生了300多個獨(dú)角獸。
他的核心推演是——這300多個獨(dú)角獸,每一個都對應(yīng)著一個垂直AI版本等待被創(chuàng)造;而AI版本的天花板可能是SaaS版本的十倍,因?yàn)樗娲牟恢皇擒浖旧恚€有操作軟件的那些人。
Bessemer Venture Partners在2025年的一份研究中給出了類似的判斷:美國勞工統(tǒng)計局的數(shù)據(jù)顯示,軟件支出僅占美國GDP的1%,而由重復(fù)性語言任務(wù)主導(dǎo)的商業(yè)與專業(yè)服務(wù)行業(yè)占到13%。
垂直AI的潛在市場不在于搶占現(xiàn)有軟件的份額,而在于切入那些軟件從未觸及的服務(wù)經(jīng)濟(jì)腹地。
放到中國語境下,這個邏輯同樣成立,甚至空間更大。
中國企業(yè)級市場的一個顯著特征是供給端偏愛通用化、標(biāo)準(zhǔn)化的產(chǎn)品,而需求端渴望的是能夠深入特定行業(yè)流程的定制方案。
疊加數(shù)據(jù)孤島和組織協(xié)同壁壘,這種供需錯配反而為垂直AI創(chuàng)業(yè)者提供了結(jié)構(gòu)性的保護(hù)。
Gartner預(yù)測,到2026年底約40%的企業(yè)應(yīng)用將集成任務(wù)型AI Agent——2025年這個數(shù)字還不到5%。
我們正站在從實(shí)驗(yàn)到規(guī)模化的臨界點(diǎn)上。
圖已經(jīng)畫好了
軟件工程這塊地盤基本已經(jīng)有主了。
但醫(yī)療、法律、金融、教育、客服、物流——16個垂直行業(yè)各自只占個位數(shù)的份額,幾乎是一片未經(jīng)開墾的土地。
如果你是一個正在選方向的創(chuàng)業(yè)者,或者是一個在傳統(tǒng)行業(yè)里每天處理大量重復(fù)性工作的從業(yè)者,這份報告指向的信號很明確:你日常工作中那些讓你疲憊又無聊的環(huán)節(jié),很可能就是下一個獨(dú)角獸公司的起點(diǎn)。
那些你每天重復(fù)填寫的表格、反復(fù)核對的數(shù)據(jù)、來回扯皮的審批流程,在AI智能體的視角里都是尚未被開發(fā)的礦脈。
模型已經(jīng)具備連續(xù)工作五小時的能力,用戶目前只讓它跑42分鐘。
TechCrunch在2025年底調(diào)研了24位專注企業(yè)市場的風(fēng)險投資人,壓倒性的共識是2026年將成為企業(yè)真正從AI中看到回報的一年。
與此同時,麥肯錫的數(shù)據(jù)顯示92%的企業(yè)計劃在未來三年增加AI投資,但只有1%認(rèn)為自己已經(jīng)進(jìn)入成熟部署階段。
也就是說,幾乎所有人都知道要往這個方向走,幾乎所有人都還站在起跑線上。
陳嘉興的總結(jié)很簡練:300個SaaS獨(dú)角獸已經(jīng)來過了,300個垂直AI獨(dú)角獸即將到來。
贏家屬于那些選準(zhǔn)一個行業(yè)扎進(jìn)去、把領(lǐng)域知識編織進(jìn)智能體、同時能幫客戶完成變革管理的創(chuàng)始人。
每一輪技術(shù)革命最豐厚的回報,往往不屬于鑄造錘子的人,而屬于那些清楚該往哪面墻上敲的人。
參考資料:
https://anthropic.com/research/measuring-agent-autonomy
https://garryslist.org/posts/half-the-ai-agent-market-is-one-category-the-rest-is-wide-open
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.