Anthropic最新報告，揭示了300個獨(dú)角獸的創(chuàng)業(yè)機(jī)會！YC CEO力挺

2026-02-23 13:03:58　來源: 新智元

北京舉報

分享至

新智元報道

編輯：艾倫

【新智元導(dǎo)讀】Anthropic最新報告揭示，AI智能體近半數(shù)使用量集中在軟件工程，其余16個垂直行業(yè)各占不到9%。AI已具備連續(xù)工作5小時的能力，但用戶目前最多只讓它跑42分鐘，信任遠(yuǎn)未跟上技術(shù)。Y Combinator CEO陳嘉興斷言：這片幾乎空白的行業(yè)版圖里，藏著下一代300個獨(dú)角獸。

你所在的行業(yè)，可能還沒見過哪怕一分鐘的AI智能體。

這個事實(shí)本身蘊(yùn)含著巨大的機(jī)會。

2026年2月18日，Anthropic發(fā)布了一份關(guān)于AI智能體實(shí)際使用情況的大規(guī)模研究報告（報告：https://anthropic.com/research/measuring-agent-autonomy），分析對象是其公共API上數(shù)百萬次真實(shí)的人機(jī)交互。

報告的核心發(fā)現(xiàn)可以濃縮成一張柱狀圖。

軟件工程獨(dú)占了49.7%的智能體工具調(diào)用量，像一根拔地而起的煙囪。

剩下的16個垂直行業(yè)——醫(yī)療、法律、金融、教育、客服、物流，每一個的份額都是個位數(shù)：醫(yī)療1%。法律0.9%。教育1.8%，沒有任何一個超過9%。

Y Combinator的CEO陳嘉興（Garry Tan）盯著這張圖，得出了一個讓很多創(chuàng)業(yè)者坐不住的結(jié)論：那片幾乎空白的區(qū)域，藏著下一代300個獨(dú)角獸。

他的原話更直白：「如果我今天創(chuàng)業(yè)，我會盯著那張柱狀圖上那一大片紅色區(qū)域，直到從中看到自己的未來。」

你的AI比你以為的能干得多

這份報告里有一組數(shù)據(jù)，適合貼在每個產(chǎn)品經(jīng)理的工位上。

獨(dú)立評估機(jī)構(gòu)METR的測試結(jié)果顯示，Claude已經(jīng)能夠獨(dú)立完成需要人類近5小時才能搞定的工作。然而在實(shí)際使用中，即便是全球最激進(jìn)的那批用戶（統(tǒng)計意義上的第99.9百分位），單次讓AI連續(xù)工作的時長也不過42分鐘左右。

5小時的能力，42分鐘的授權(quán)。

這中間巨大的落差，陳嘉興給它起了個名字叫「部署積壓」（deployment overhang）。

翻譯成大白話就是：AI已經(jīng)準(zhǔn)備好了，人還沒準(zhǔn)備好。

好消息是，人正在追趕。

從2025年10月到2026年1月，這個第99.9百分位的會話時長幾乎翻了一倍，從不到25分鐘漲到42分鐘。

值得留意的是，這條增長曲線非常平滑，并沒有因?yàn)樾履Ｐ偷陌l(fā)布出現(xiàn)突然跳升。

換句話說，驅(qū)動變化的主力不是模型變聰明了，而是人類在一次又一次的協(xié)作中，學(xué)會了慢慢松手。

Anthropic內(nèi)部的使用數(shù)據(jù)印證了同樣的趨勢。

2025年8月到12月，Claude Code在最困難任務(wù)上的成功率翻倍，每次會話中人工介入的次數(shù)從5.4次降到了3.3次。

對于正在考慮創(chuàng)業(yè)方向的人來說，這意味著一件很具體的事：窗口期還在。

絕大多數(shù)行業(yè)甚至還沒開始認(rèn)真嘗試讓AI智能體介入自己的核心工作流。

不是技術(shù)不行，是信任還沒到。

老手更敢放手，也更敢叫停

關(guān)于人和AI如何磨合出默契，這份報告講了一個很有意思的故事。

剛開始用Claude Code的人，只有大約20%的會話選擇了「全自動批準(zhǔn)」模式——也就是讓AI自己跑，不用每一步都等人點(diǎn)頭。

累計使用超過750次之后，這個比例上升到40%以上。

信任在日復(fù)一日的使用中緩慢生長，可以被精確測量。

反直覺的地方在于：那些更愿意放手讓AI跑的老用戶，同時也更頻繁地打斷它。

新手的打斷率大約是5%，老手反而到了9%。

這看起來矛盾，其實(shí)是兩種截然不同的工作方式。

新手像是在考場上監(jiān)考，AI每寫一道題都要看一眼。

老手更像是委托了一個信得過的下屬，平時不盯著，一旦感覺方向不對立刻喊停。

從「逐項(xiàng)審批」到「委托+監(jiān)控」，這種轉(zhuǎn)變對理解人機(jī)協(xié)作的未來至關(guān)重要。

另一個容易被忽視的細(xì)節(jié)：在復(fù)雜任務(wù)中，Claude主動暫停來向用戶確認(rèn)的次數(shù)，是用戶主動打斷它的兩倍還多。

AI在拿不準(zhǔn)的時候會停下來問一聲，而非悶頭往前沖。

Anthropic的研究團(tuán)隊(duì)提煉出一個核心概念來描述這種動態(tài)——「共建」。

AI智能體的自主程度，不是模型單方面決定的。

它由三方力量塑造：模型在不確定時選擇暫停，用戶隨經(jīng)驗(yàn)調(diào)整監(jiān)管尺度，產(chǎn)品設(shè)計在中間架設(shè)橋梁。

這個發(fā)現(xiàn)直指當(dāng)下最熱的AI監(jiān)管爭論。

如果政策要求人類必須「逐項(xiàng)審批AI的每一個動作」，結(jié)果大概率是生產(chǎn)力被扼殺，安全性卻沒有實(shí)質(zhì)提升。

報告中的數(shù)據(jù)也支持了這種判斷：73%的工具調(diào)用有人在回路中監(jiān)管，僅0.8%的操作屬于不可逆類型。

而那些看起來高風(fēng)險的極端案例（API密鑰操作、自主加密貨幣交易），經(jīng)核實(shí)大多是安全團(tuán)隊(duì)做的紅隊(duì)演練，不是真實(shí)生產(chǎn)場景。

護(hù)城河在行業(yè)里，不在模型里

看到這里，可能有人要問：既然垂直行業(yè)機(jī)會這么大，為什么大家都擠在軟件工程里？

答案并不復(fù)雜。

代碼是可測試、可回滾、出錯成本低的——寫壞了一段代碼，最多回退一個版本。

但你讓AI幫一個病人處理醫(yī)保報銷，或者替律師做證據(jù)開示，出了錯可能是一場訴訟。

軟件工程的智能體滲透率高，本質(zhì)上是因?yàn)檫@個領(lǐng)域的「容錯空間」最寬裕。

Box的CEO Aaron Levie點(diǎn)出了垂直AI創(chuàng)業(yè)的真正壁壘所在：能把遺留工作流吃透，能在監(jiān)管的夾縫中找到產(chǎn)品路徑，能幫客戶推動組織內(nèi)部的變革。

誰都可以在大模型外面包一層界面做個「AI殼」。

但要讓智能體在醫(yī)療賬單審核、法律合同檢索或建筑許可審批這些場景里真正跑起來，創(chuàng)業(yè)者必須比客戶自己還懂那個行業(yè)的痛點(diǎn)和雷區(qū)。

這也是為什么陳嘉興認(rèn)為垂直AI公司天然具備防御性。

他提了一筆大賬：過去二十年，SaaS行業(yè)每十年規(guī)模增長十倍，超過40%的風(fēng)險投資流入了SaaS公司，催生了300多個獨(dú)角獸。

他的核心推演是——這300多個獨(dú)角獸，每一個都對應(yīng)著一個垂直AI版本等待被創(chuàng)造；而AI版本的天花板可能是SaaS版本的十倍，因?yàn)樗娲牟恢皇擒浖旧恚€有操作軟件的那些人。

Bessemer Venture Partners在2025年的一份研究中給出了類似的判斷：美國勞工統(tǒng)計局的數(shù)據(jù)顯示，軟件支出僅占美國GDP的1%，而由重復(fù)性語言任務(wù)主導(dǎo)的商業(yè)與專業(yè)服務(wù)行業(yè)占到13%。

垂直AI的潛在市場不在于搶占現(xiàn)有軟件的份額，而在于切入那些軟件從未觸及的服務(wù)經(jīng)濟(jì)腹地。

放到中國語境下，這個邏輯同樣成立，甚至空間更大。

中國企業(yè)級市場的一個顯著特征是供給端偏愛通用化、標(biāo)準(zhǔn)化的產(chǎn)品，而需求端渴望的是能夠深入特定行業(yè)流程的定制方案。

疊加數(shù)據(jù)孤島和組織協(xié)同壁壘，這種供需錯配反而為垂直AI創(chuàng)業(yè)者提供了結(jié)構(gòu)性的保護(hù)。

Gartner預(yù)測，到2026年底約40%的企業(yè)應(yīng)用將集成任務(wù)型AI Agent——2025年這個數(shù)字還不到5%。

我們正站在從實(shí)驗(yàn)到規(guī)模化的臨界點(diǎn)上。

圖已經(jīng)畫好了

軟件工程這塊地盤基本已經(jīng)有主了。

但醫(yī)療、法律、金融、教育、客服、物流——16個垂直行業(yè)各自只占個位數(shù)的份額，幾乎是一片未經(jīng)開墾的土地。

如果你是一個正在選方向的創(chuàng)業(yè)者，或者是一個在傳統(tǒng)行業(yè)里每天處理大量重復(fù)性工作的從業(yè)者，這份報告指向的信號很明確：你日常工作中那些讓你疲憊又無聊的環(huán)節(jié)，很可能就是下一個獨(dú)角獸公司的起點(diǎn)。

那些你每天重復(fù)填寫的表格、反復(fù)核對的數(shù)據(jù)、來回扯皮的審批流程，在AI智能體的視角里都是尚未被開發(fā)的礦脈。

模型已經(jīng)具備連續(xù)工作五小時的能力，用戶目前只讓它跑42分鐘。

TechCrunch在2025年底調(diào)研了24位專注企業(yè)市場的風(fēng)險投資人，壓倒性的共識是2026年將成為企業(yè)真正從AI中看到回報的一年。

與此同時，麥肯錫的數(shù)據(jù)顯示92%的企業(yè)計劃在未來三年增加AI投資，但只有1%認(rèn)為自己已經(jīng)進(jìn)入成熟部署階段。

也就是說，幾乎所有人都知道要往這個方向走，幾乎所有人都還站在起跑線上。

陳嘉興的總結(jié)很簡練：300個SaaS獨(dú)角獸已經(jīng)來過了，300個垂直AI獨(dú)角獸即將到來。

贏家屬于那些選準(zhǔn)一個行業(yè)扎進(jìn)去、把領(lǐng)域知識編織進(jìn)智能體、同時能幫客戶完成變革管理的創(chuàng)始人。

每一輪技術(shù)革命最豐厚的回報，往往不屬于鑄造錘子的人，而屬于那些清楚該往哪面墻上敲的人。

參考資料：

https://anthropic.com/research/measuring-agent-autonomy

https://garryslist.org/posts/half-the-ai-agent-market-is-one-category-the-rest-is-wide-open

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.