![]()
新智元報道
編輯:傾傾
【新智元導讀】Anthropic殺瘋了!開年第一篇論文直接化身自爆卡車,實錘AI正在讓程序員變傻。你以為效率提高了?其實只快了2分鐘。
作為2026年公認最強的編程AI,Anthropic竟然搞了波「反向帶貨」,甩出一份2026開年最狠的論文,指著所有用戶的鼻子罵:
別以為你在提效率,你只是在把腦子外包給機器,然后慢慢變蠢!
![]()
論文地址:https://arxiv.org/abs/2601.20245
更諷刺的是,研究發現用AI輔助的人,只比純手寫的人快了120秒,但是付出的代價遠不止如此。
Anthropic這次親手撕碎了AI提升職業上限的謊言,數據讓人后背發涼。
![]()
17%的認知「稅」
AI到底讓你變蠢了多少?
Anthropic選擇了52名有Python經驗的工程師,讓他們使用一個不熟悉的Python庫(Trio)編寫功能。
![]()
研究設計示意圖:實驗組組在三重任務中使用AI協助,控制組全程無AI。
結果顯示,完全靠自己手寫代碼的一組,測驗平均分達到了67%;而使用AI助手的一組,平均分僅為50%。
這17%的差距什么概念?直接讓你從阿里P7連降三級跌回校招實習生。
更恐怖的是「理解真空」。
實驗發現,AI組在Debug環節全線崩盤。
也就是說,當AI生成的代碼出現邏輯偏差時,這批開發者不僅不知道怎么改,甚至連「哪兒錯了」都看不出來。
這與CodeRabbit 2025年的行業數據形成了驚人的「死亡閉環」:AI生成的代碼,邏輯錯誤率比人寫的暴漲75%,整體缺陷率高達1.7倍。
![]()
AI代碼issues曲線直接碾壓人類,平均1.7倍缺陷(10.83vs6.45),極端情況更夸張
AI共同創作PR平均問題量1.7倍(10.83vs6.45),極端情況2倍(26vs12.3)
你以為你在用AI「彎道超車」,實際上你是在賽博空間里瘋狂堆砌「屎山」。
你省下的那些敲鍵盤時間,全變成了未來修Bug時流的淚。
快了2分鐘?那是統計學的謊言
但我快啊!天下武功唯快不破!有人不服。
Anthropic反手就是一巴掌:在學習新東西時,AI帶來的速度優勢,約等于
實驗數據顯示,使用了AI的工程師、確實比手寫組完成得快了一點——具體來說,快了大約2分鐘。
然而,這一差異并沒有達到統計學顯著的標準。
最抽象的一幕出現了:為了讓AI寫對一段代碼,有人足足改了15版Prompt,耗時11分鐘。
你以為你是AI的主人?不,你是幫它改需求的卑微乙方。
這不叫提效,這叫賽博版《等待戈多》。
職場達爾文時刻:你是「宿主」還是「電池」?
既然AI有毒,那我們要立刻斷網、回歸石器時代嗎?這顯然是另一種愚蠢。
Anthropic拋出了一個結論:并不是所有使用AI的人都在變傻。
研究團隊通過逐幀分析錄屏,將52名工程師的交互行為歸納為五種模式。
![]()
AI輔助測驗得分暴跌17%(50%vs67%),速度優勢僅2分鐘且不顯著
死亡組:大腦托管者
這是一群被AI徹底「廢掉」的工程師。他們的認知卸載達到了頂峰。
1.「甩手掌柜」模式:
這群人完全把AI當外包。他們直接把需求扔給AI,然后全盤接受生成的代碼。
他們完成任務的速度最快,甚至在過程中沒遇到什么報錯。
但在測驗中,他們徹底崩盤。
2.「溫水煮青蛙」模式:
這群人剛開始還試圖掙扎一下,問一兩個概念問題,但很快就放棄抵抗,全面轉向「幫我寫代碼」。
他們的結果最為慘烈:由于在任務后半段完全放棄了思考,他們不僅沒學到東西,連前半段的記憶也被沖刷殆盡。
進化組:主動拷問者
這群人的交互方式完全不同。他們把AI當作「蘇格拉底式的導師」。
1.只動口不動手」模式
這是唯一真正利用AI進化的模式。
他們只向AI詢問概念和原理,然后堅持自己親手寫代碼。
雖然他們遇到的報錯最多,還得花時間自己修Bug,但這種「痛苦」卻轉化為了極高的掌握度。
更反直覺的是,這組人不僅分高,速度還是所有高分模式中最快的。
2.「先生成后追問」模式
這是一種折中但有效的策略。他們先讓AI生成代碼,但絕不直接復制粘貼。
他們會盯著生成的代碼,反過來追問AI:「這一行為什么要這么寫?」、「有沒有更好的寫法?」。
他們用AI來檢查自己的理解,而不是替代自己的理解。
垂死掙扎組:無效努力
這一類人最慘。
他們既想自己寫,又在遇到Bug時立刻慌神,瘋狂把錯誤拋給AI求救。結果陷入了無休止的「報錯-AI修-再報錯」循環。
他們花的時間最長,分數卻依然很低。因為他們沒有在這個過程中建立任何因果邏輯,只是在盲目試錯。
痛苦是學習的必要條件。如果你在使用AI時感到無比絲滑、毫無阻礙,警鐘就該響了——你可能正在退化。
更可怕的是,這不只是個人問題,企業也在為此買單。
高分組的秘密:主動找虐
別慌,AI不一定會讓你變傻,但前提是你得「反人性」地使用。
在Anthropic的實驗中,有約23%的開發者(12名)在AI的輔助下依然拿到了65%以上的高分。
研究拆解出三種能夠實現效率與深度雙贏的高分模式:
模式一:概念查詢
這是全場表現最驚艷的群體。他們只向AI詢問底層概念和原理,然后堅持自己動手寫出每一行邏輯代碼。
雖然在這個過程中他們遇到了最多的報錯,但由于是獨立解決Bug,他們對Trio庫的記憶極深。
結果是,這種模式的綜合速度排名全場第二,且考核得分最高。
模式二:生成后拆解
這類開發者會先讓AI生成代碼,但絕不直接運行。
他們會手動將代碼復制到編輯器中,并針對每一行邏輯向AI追問:「為什么要這么寫?」「這個異步鎖的邏輯是什么?」
這種「回溯式學習」雖然犧牲了一定的速度,但在掌握度上與純手寫組不相上下。
模式三:混合解釋請求
他們在發送提示詞時,會強制要求AI在輸出代碼的同時提供詳盡的原理注釋。
通過同步閱讀解釋和代碼,他們在操作過程中就完成了知識的內化。
高分開發者通過主動制造障礙,維持了心理學上的「必要難度」。
![]()
他們明白,AI提供的絲滑感是學習的敵人。真正的強者會把AI關進「蘇格拉底式」的籠子里,只讓它提供指引,而不交出主權。
Anthropic這份報告,不只是給開發者看的,更是扇向盲目追求KPI的管理層的一記耳光。
當你為團隊本月代碼量暴漲30%而歡呼時,你公司的「技術資產」可能正在急速縮水。
初級工程師為了趕Deadline,正在批量淪為AI復制粘貼機器。
這哪里是技術團隊,這分明是搖搖欲墜的「屎山施工隊」。
AI時代的頂級門檻,早已不是寫代碼的手速,而是對邏輯的絕對主權。
轉發給你身邊的「復制粘貼黨」,問問他:是為了這120秒爽一把,還是想保住你的腦子?
參考資料:
https://x.com/AnthropicAI/status/2016960382968136138?s=20
https://www.coderabbit.ai/ja/blog/state-of-ai-vs-human-code-generation-report
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.