DeepSeek 首次融資，AGI 理想向資本低頭？

2026-04-18 11:05:08　來源: 鈦媒體APP

北京舉報

分享至

據(jù)《The Information》援引知情人士報道，長期以“不融資”聞名的AI明星公司DeepSeek，正在與投資者洽談，計劃以至少100億美元的估值籌集不少于3億美元資金。這是這家由中國量化巨頭幻方量化孵化的公司成立以來首次啟動對外融資，標(biāo)志著其長達(dá)數(shù)年的“自我供血”模式將畫上句號，也標(biāo)志著DeepSeek從技術(shù)“理想主義”走向“現(xiàn)實主義”。

回顧DeepSeek的發(fā)展軌跡，這種轉(zhuǎn)變顯得尤為意味深長。在過去兩年中，當(dāng)整個中國AI行業(yè)都在瘋狂融資、擴(kuò)張、講生態(tài)故事時，DeepSeek反而在做一種刻意的收縮——不對外發(fā)聲，不頻繁發(fā)產(chǎn)品，不參與大廠敘事，甚至對資本保持距離。創(chuàng)始人梁文鋒從公司成立第一天就劃了一條清晰的紅線：不接受外部融資，不稀釋股權(quán)，不被任何人的商業(yè)化時間表綁架。他想打造的更像一個純粹的研究機(jī)構(gòu)，追逐AGI（通用人工智能）、堅持開源、讓技術(shù)本身說話。

理想主義者的現(xiàn)實主義轉(zhuǎn)身

要理解DeepSeek為何在此時融資，首先得回顧它為何長期拒絕融資。

DeepSeek由量化對沖基金幻方量化的創(chuàng)始人梁文鋒于2023年創(chuàng)立。在此之前，幻方用多年的量化交易利潤為DeepSeek提供了持續(xù)的資金“輸血”。公司股權(quán)結(jié)構(gòu)極為集中，梁文鋒直接和間接持有84.29%的股份，并擁有幾乎100%的表決權(quán)。

這種“不差錢”的底氣，讓梁文鋒得以堅守一種近乎理想主義的發(fā)展哲學(xué)：拒絕資本的短視干擾，專注打磨基礎(chǔ)模型，追求實現(xiàn)AGI的技術(shù)上限。

聯(lián)想創(chuàng)投高級合伙人宋春雨曾透露，自己早在2024年2月就與梁文鋒深入交流，但對方明確表示不融資。“梁文鋒對商業(yè)化不感興趣，他專注打磨基礎(chǔ)模型，確保每一代模型都保持領(lǐng)先。”另有報道稱，梁文鋒曾拒絕來自騰訊和阿里巴巴等科技巨頭的合作機(jī)會，擔(dān)心外部投資者會干預(yù)公司決策。

這一定位讓DeepSeek在早期創(chuàng)業(yè)公司中顯得格外另類。當(dāng)其他大模型創(chuàng)業(yè)公司在2023-2024年瘋狂融資、高調(diào)亮相時，DeepSeek像一個隱士般潛心研發(fā)，直至V3和R1的橫空出世才讓世界注意到它的存在。

然而，這種“不缺錢”的自信在2026年初出現(xiàn)了明顯裂縫。最直接的信號來自人才流失。2025年底至2026年初，DeepSeek多名核心研發(fā)骨干相繼出走：V3架構(gòu)關(guān)鍵開發(fā)者羅福莉轉(zhuǎn)投小米接手MiMo大模型團(tuán)隊；第一代大語言模型核心作者王炳宣去了騰訊；多模態(tài)方向核心研究員阮翀加入元戎啟行；OCR系列核心作者魏浩然也在今年春節(jié)前后離開。

更致命的是期權(quán)問題。DeepSeek從未融資，沒有市場化的估值錨點。公司給核心成員的股權(quán)承諾，拿到手里無法換算成真金白銀。大廠的期權(quán)有行權(quán)價、有內(nèi)部回購機(jī)制、有IPO預(yù)期。外界只知道DeepSeek很值錢，但到底值多少，沒有人能說清，員工更不知道。

而這些原因似乎也預(yù)示著DeepSeek的融資只是遲早的事。

多重壓力下的必然選擇

DeepSeek的融資轉(zhuǎn)折并非單一因素驅(qū)動，而是多重壓力交織下的必然結(jié)果。這些壓力來自技術(shù)迭代、算力需求、市場競爭和戰(zhàn)略節(jié)奏等多個維度，共同構(gòu)成了梁文鋒不得不面對的現(xiàn)實困境。

技術(shù)迭代的沉重包袱是首要壓力。下一代旗艦?zāi)Ｐ蚔4的發(fā)布一再推遲，原本定在春節(jié)前后發(fā)布，推到2月，再推到3月，目前的口徑是4月下旬。從公開信息來看，延期背后至少有三層原因交織：技術(shù)路線本身發(fā)生質(zhì)變、身份包袱壓力、國產(chǎn)芯片深度適配的挑戰(zhàn)。V4要做的已經(jīng)不再是一個刷benchmark的基礎(chǔ)模型，而是萬億參數(shù)MoE架構(gòu)、原生多模態(tài)、百萬token上下文、全新的Engram條件記憶機(jī)制的系統(tǒng)級工程，訓(xùn)練驗證復(fù)雜度陡然上了一個臺階。

更深層的壓力來自身份包袱。DeepSeek立身靠的是“十分之一成本做到頂級”這個故事。V4如果只是性能微增卻推高了推理成本，支撐估值和聲譽的故事就會出現(xiàn)裂痕。某種程度上，一個不夠驚艷的V4，反而不如不發(fā)。

此外，國產(chǎn)芯片的深度適配成為獨立巨型工程。多方信源在4月初披露，V4將全面運行在華為昇騰950PR芯片上，有望成為首個完全跑在國產(chǎn)算力上的旗艦大模型。戰(zhàn)略價值極高，但這本身直接吃掉了大量研發(fā)帶寬。

到2026年4月，DeepSeek已有15個月沒有大版本更新。而這期間，OpenAI迭代四五輪，Anthropic連推Claude 4.5/4.6/4.7，國內(nèi)同行如智譜、月之暗面、字節(jié)也在應(yīng)用層狂飆突進(jìn)。所有人都在加速，只有DeepSeek靜悄悄。

梁文鋒本人也曾坦言國產(chǎn)AI模型訓(xùn)練效率的差距：“我們估計，國內(nèi)最好的水平和國外最好的相比，模型結(jié)構(gòu)和訓(xùn)練動力學(xué)上可能有一倍的差距，光這一點我們要消耗兩倍的算力才能達(dá)到同樣效果。另外數(shù)據(jù)效率上可能也有一倍差距，也就是我們要消耗兩倍的訓(xùn)練數(shù)據(jù)和算力，才能達(dá)到同樣的效果。合起來就要多消耗4倍算力。”這種客觀存在的技術(shù)差距，使得DeepSeek在追求技術(shù)領(lǐng)先的同時，必須面對更高的算力成本。

值得注意的是，在R1爆紅后，DeepSeek的用戶量和并發(fā)請求量呈指數(shù)級增長，對算力基礎(chǔ)設(shè)施的需求急劇攀升。2026年初，DeepSeek甚至經(jīng)歷了一場大規(guī)模服務(wù)中斷，網(wǎng)頁端與App全面卡頓，“DeepSeek崩了”相關(guān)話題迅速沖上多個平臺熱搜。

與此同時，巨頭們正在以“千億級”規(guī)模加碼算力基建。阿里巴巴宣布未來三年投入3800億元建設(shè)云和AI硬件基礎(chǔ)設(shè)施；字節(jié)跳動2025年資本開支計劃高達(dá)1500億元，同比大增88%。相比之下，靠母公司幻方量化的資金支撐已明顯力不從心。

此外，前文提到的核心團(tuán)隊頻頻被大廠高薪挖走，也造成了DeepSeek不得不獲取更多的錢，來留住現(xiàn)有的團(tuán)隊，保持技術(shù)競爭力，畢竟在這個AI人才稀缺的當(dāng)下，大廠對AI人才的需求與現(xiàn)有的人才供應(yīng)差距很大。如果沒有足夠有吸引力的“未來”（包括薪資、股權(quán)等），是留不住人才的，這點從過去兩年AI人才市場的流動趨勢已經(jīng)可以看出。

融資后的DeepSeek“路在何方”？

若DeepSeek成功獲得外部融資，這筆資金將為其在技術(shù)研發(fā)、市場拓展和商業(yè)變現(xiàn)等多個關(guān)鍵領(lǐng)域注入強(qiáng)大動力，進(jìn)而對整個AI行業(yè)格局產(chǎn)生深遠(yuǎn)影響。然而，融資只是開始，DeepSeek面臨的挑戰(zhàn)依然嚴(yán)峻。

技術(shù)研發(fā)的深度與廣度拓展將是融資后的首要方向。DeepSeek有望利用融資資金進(jìn)一步加大對人工智能技術(shù)的研發(fā)投入。一方面，公司可能會持續(xù)優(yōu)化現(xiàn)有模型，不斷提升其性能和智能化水平。另一方面，DeepSeek可能會加大對前沿技術(shù)的研究探索，如具身智能、AI Agent生態(tài)等領(lǐng)域。

這個過程中，其V4模型發(fā)布后，業(yè)界的反響將成為關(guān)鍵考驗。據(jù)報道，DeepSeek V4大模型將徹底重構(gòu)技術(shù)架構(gòu)，核心引入mHC（多路殘差混合連接）與Engram（AI記憶模塊）兩項黑科技，聚焦代碼生成、推理效率與邊緣部署三大能力，技術(shù)路徑從“堆參數(shù)”轉(zhuǎn)向“雙軸稀疏+記憶-計算分離”。市場預(yù)計，DeepSeek新模型訓(xùn)練成本再降50%，若實現(xiàn)完全開源或?qū)⑼苿有袠I(yè)API價格減少60%。這將是DeepSeek證明自己依然保持技術(shù)領(lǐng)先優(yōu)勢的重要機(jī)會。

市場拓展的全球化布局是第二戰(zhàn)略重點。憑借充足的資金，DeepSeek將有能力在全球范圍內(nèi)積極拓展市場，提升品牌知名度和市場份額。在國內(nèi)市場，DeepSeek可能會進(jìn)一步加強(qiáng)與各行業(yè)企業(yè)的合作，深入挖掘行業(yè)需求，為金融、醫(yī)療、教育、制造業(yè)等領(lǐng)域提供更加定制化的人工智能解決方案。實際上，DeepSeek已經(jīng)在多個行業(yè)展現(xiàn)出應(yīng)用潛力：廣汽集團(tuán)將自主研發(fā)的ADiGO SENSE端云一體大模型與DeepSeek-R1完成深度融合；重慶農(nóng)商行企業(yè)微信上線基于DeepSeek模型的智能助手進(jìn)行風(fēng)險評估和欺詐監(jiān)測；智云健康將DeepSeek-R1模型接入自研醫(yī)療人工智能系統(tǒng)“智云大腦”；網(wǎng)易有道借助DeepSeek-R1優(yōu)化個性化答疑功能；中控技術(shù)實現(xiàn)了工業(yè)APP的智能構(gòu)建。

在國際市場，DeepSeek可能會借鑒國際科技巨頭的市場拓展經(jīng)驗，采取本地化策略，根據(jù)不同國家和地區(qū)的市場特點和用戶需求，推出針對性的產(chǎn)品和服務(wù)。當(dāng)然，這個過程中還需要面對地緣政治的考驗。

此外，融資后，公司將有更多資源用于探索多元化的商業(yè)變現(xiàn)模式，實現(xiàn)技術(shù)價值的最大化。除了現(xiàn)有的API調(diào)用收費、私有化部署等商業(yè)模式外，DeepSeek可能會加強(qiáng)技術(shù)授權(quán)業(yè)務(wù)，將其先進(jìn)的人工智能技術(shù)授權(quán)給其他企業(yè)使用。

然而，商業(yè)化轉(zhuǎn)型并非易事。梁文鋒曾明確表示擔(dān)憂外部干預(yù)可能讓DeepSeek變成“另一個商業(yè)機(jī)器”，而非技術(shù)革新的先鋒。高估值融資后，投資人可能要求快速增長或上市，迫使DeepSeek犧牲開源模式或長期研發(fā)計劃。如何在保持技術(shù)理想與滿足商業(yè)回報之間找到平衡，將是DeepSeek管理層需要解決的核心矛盾。

DeepSeek的轉(zhuǎn)折，從來不是梁文鋒一個人的“理想妥協(xié)”，而是整個國產(chǎn)AI行業(yè)的縮影。在AI這場殘酷的長期競賽中，技術(shù)理想主義需要商業(yè)現(xiàn)實的支撐，獨立自主需要開放合作的補(bǔ)充，前沿探索需要生態(tài)建設(shè)的協(xié)同。DeepSeek的融資之路，正是這種復(fù)雜平衡的開始。

（文｜Leo張ToB雜談，作者｜張申宇，編輯丨蓋虹達(dá)）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.