網易首頁 > 網易號 > 正文申請入駐

AI Coding分水嶺：狂卷參數的背后，生態標準之戰才剛開始

2025-12-07 19:11:37　來源: 節點AI

山東舉報

分享至

文 / 道哥

來源 / 智百道

AI Coding正無可爭議地成為人工智能領域商業化最先落地的賽道。

據研究機構Market Research Future預測，AI編程工具市場將從2025年的151.1億美元增長到2034年的991億美元，CAGR達到23.24%。

在今年5月舉辦的Meta LlamaCon大會上，微軟CEO納德拉表示，現在微軟30%的代碼都是AI寫的。微軟首席技術官凱文斯科特曾預測，到2030年95%的代碼將由AI生成。

再看中國市場，工信部發布的數據顯示，2024年前三季度，我國軟件業務收入98281億元，同比增長10.8%；這都有可能轉為AI編程的潛在市場空間。

面對萬億級的商業前景，中國模型正在上演一場驚心動魄的參數追擊戰。

以DeepSeek-V3.2（12月1日推出）為例，衡量大模型代碼工程任務解決能力的SWE Verified達到了73.1%，逼近Anthropic旗下的Claude-4.5-Sonnet（9月29日推出）的74.9%。

在《智百道》看來，僅僅盯著數字的差距，或許會讓我們錯失戰局的真相。中美AI編程的勝負手,或許正在從參數性能轉向生態標準。

01 國模開源搞基建，美國閉源賣性能

長久以來，編程被定義為一種嚴謹的、邏輯驅動工作，能將人類意圖轉化為機器可理解并執行的語言。也是因為這種嚴謹的因果邏輯，對于時下主流的LLM來說，編程是PMF最好的領域。

在AI Ascent 2025上，紅杉資本直言，AI Coding是第一個被顛覆的市場，這也將成為未來其他行業AI化進程的重要先兆。

在這個高付費意愿的領域，中國與美國走上了兩條路。

美國是精英化的閉源路線，靠著不俗的模型性能博得資本市場青睞，撐起了驚人的市值。

AI編程工具 Cursor 近期宣布完成23億美元D輪融資,股東名單集結了Google、英偉達等頭號玩家，其母公司 Anysphere 估值在四個月內翻了3倍,達到293億美元。而在B端市場攻城略地的 Anthropic，估值更是飆升至3500億美元。

其于11月25日新推出的 Claude Opus 4.5,在 SWE-Bench Verified 測試中突破 80.9%，不僅超越了 Gemini-3 Pro 和 GPT-5.1，更是首個在該指標上達到80分的大模型，標志著AI的代碼修正能力已具備甚至超越人類專家的水準。

更有殺傷力的是價格戰。Claude Opus 4.5 的 API 定價降至每百萬 tokens 5美元(輸入)/25美元(輸出),相比上一代直接砍去了三分之二。

相比之下，中國模型走出了截然不同的開源+性價比路線。

今年，DeepSeek 的R1橫空出世,不僅拉升了國產模型的基準線,更奠定了中國廠商的開源基調。經過一年角逐,以 Kimi、Qwen、GLM 為首的國產模型軍團,在參數表現上已能幾乎與海外頂尖模型分庭抗禮。

以DeepSeek 在12月1日新推出的V3.2為例，SWE Verified達到了73.1%，逼近Anthropic旗下Claude-4.5-Sonnet（9月29日推出）的74.9%，這體現出了開源+性價比的可行性。

路線不同也決定了雙方的受眾并不同。

財富雜志此前報道，許多歐美高管傾向于OpenAI、Anthropic或谷歌等公司專有模型的性能優勢。

而亞洲市場則更務實,數據主權和成本控制是核心考量。

中國人工智能云托管服務商硅基流動的聯合創始人兼首席執行官袁進輝表示，該公司開發了多種技術，能更經濟高效地運行開源模型，這意味著使用開源模型完成任務的成本遠低于采用專有人工智能模型。此外，他還表示，如果針對特定應用場景，利用自有數據對開源模型進行微調，其性能表現能超越專有模型并完全避免敏感數據或商業機密泄露的風險。

祥峰投資控股公司的陳逸邦強調，雖然專有模型供應商也會為企業提供基于自有數據的微調服務，通常還會承諾不將這些數據用于更廣泛的訓練，但真實情況如何我們無從得知。

開源模型允許開發者免費下載、修改和集成，初創企業更易開發產品，也使研究人員更易改進模型。其廣泛應用正對人工智能未來走向產生巨大影響，這一邏輯正在全球范圍內生效。

新加坡國家人工智能計劃(AISG)近期的戰略調整最具標志性，其最新版東南亞語言大模型"Sea-Lion"宣布棄用Meta，轉而基于阿里的Qwen架構構建。這代表中國開源模型已開始在全球技術版圖中憑借實用主義突圍。

過去一年，中國團隊自主研發的開源AI模型下載份額占比已上升至17.1%，首次超過美國的15.8%。麻省理工學院與Hugging Face數據顯示，DeepSeek和阿里巴巴的千問模型，占據中國模型下載量的絕大多數。

02 我們在造車，美國在修路

隨著大模型迭代速度的放緩，在參數上，國內逼近甚至追平美國頂尖模型或許只是時間問題，但從另一個角度看，海外領先的或許不只有模型的工程化能力，而是生態的護城河。

在《智百道》看來，以Anthropic為首的頂級模型廠商在試圖定義智能體時代的HTTP。

今年2月，Anthropic推出Claude Code。這不僅僅是一個工具,而是原生的IDE系統。與 Cursor等"套殼"IDE 不同,Claude Code實現了模型與開發環境的深度解耦與重構。它能直接理解代碼庫、管理上下文,并調用第三方工具。

僅僅4個月，Claude Code 就吸引了11.5萬名開發者。Menlo Ventures 預測,僅此一款產品就能為Anthropic貢獻1.3億美元收入。

此外，Google 推出了A2A開放協議，支持模型到模型的互操作性，解決不透明代理系統之間的黑盒狀態。

眾所周知，每個模型都各有所長，在實際應用場景中，開發者往往需要調用不同模型來共同實現目標。A2A協議支持用戶在執行任務時，支持用戶調用不同大模型生成不同的Agent共同完成特定目標。

如果說與A2A是指在貫通模型之間的合作，那么與其互補的是MCP。

2024年11月，Anthropic 將MCP開源，率先定義了"模型怎么連接工具和數據源"的標準。簡言之，MCP比Claude Code簡單做鏈接更高階，讓模型可自主決定調用哪些工具，并實現復雜任務。

在生態能力上，Anthropic 為了解決MCP重復造輪子的缺點，推出了Skills。Skills并沒有創造一個新“功能”，它并不是單純讓Claude去調用工具，而更像是在給模型裝上記憶與流程。你可以把一整套業務流程、模板、甚至公司內部知識，打包成一個個Skill模塊，讓 Claude在合適的時機自動調用。對開發者來說，它就像是給LLM加上一層輕量級Workflow，既可控又靈活。不光省token、省時間，還能提升準確率、方便協作共建。開發者借助Skills將編寫的工具與模型對接，給模型擴展能力。

當智能體可以跨平臺協作，擁有最豐富工具鏈和操作系統的玩家自然就掌握了立法權。生態位的競爭，自然先于技術路線的分歧。

海外大模型廠商能對B端應用有較為成熟的理解，和美國更成熟的SaaS生態相關。美國 SaaS 產業起步于上世紀80年代，早已形成標準化、成熟的SaaS工作流。因為強依賴標準化API與插件體系，對智能體自動化跨平臺協作的意愿更強烈。

中國企業SaaS起步晚近10年，很多企業業務并非高度結構化，這就給國內模型廠商的生態化、標準化工具的推廣帶來阻礙。

好在，覺醒已經開始。

今年8月，阿里推出了Qwen Code 嘗試在生態層面追平，這也讓我們看到了國模在生態上其實也頗有前景。

Qwen Code 也表示，將持續把開發者體驗放在最前面，未來會進一步擴展 IDE 插件、增強工具調用能力，持續靠功能積累提升工程效能。

可以看出Qwen Code 正在慢慢走進“AI 工程化”真正的核心戰場，試圖開發工作流接管，形成自己的規則。

從長遠視角看，未來最重要的不是模型的單點性能，而是哪個國家搶到B端標準制定權，雖然參數提升速度快，追趕成本低；但生態成熟需要多年開發者積累、接口標準、企業垂直理解，這些無法速成。

AI 應用生成工具領域的發展就像基礎模型的競爭一樣，不是一個贏者通吃的市場，而是各家在逐步找到差異化空間，實現共存，而國模廠商從性價比到生態也在奮起直追，畢竟我們已經意識到，只有建立起自己的生態與標準，中國AI才能真正跨越那道看不見的護城河。

*題圖由AI生成

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.