網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

剛剛，梁文鋒被曝史上首次融資！DeepSeek V4徹底擺脫英偉達(dá)

2026-04-18 09:30:05　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：Aeneas 好困

【新智元導(dǎo)讀】今早AI圈炸了！從不融資的DeepSeek首度開(kāi)口：尋求100億美元估值，籌集3億美元。V4即將來(lái)襲，萬(wàn)億參數(shù)+華為昇騰加持，連老黃都慌了！

今早，AI圈都被這個(gè)消息震撼了。

外媒The Information曝出，DeepSeek正尋求首次外部融資！

打破「從不融資」鐵律的DeepSeek，這次尋求以不低于100億美元的估值，籌集至少3億美元的資金。

在極其燒錢(qián)的AI大模型開(kāi)發(fā)競(jìng)賽中，DeepSeek也需要充實(shí)資金彈藥庫(kù)了。

曾經(jīng)的DeepSeek，堅(jiān)決不融資

對(duì)沖基金巨頭幻方量化旗下的DeepSeek，在R1引起硅谷和華爾街軒然大波后，多次拒絕了國(guó)內(nèi)頂級(jí)風(fēng)投和科技巨頭的投資意向。

DeepSeek這次選擇啟動(dòng)融資，意味著梁文鋒終于做出了巨大的轉(zhuǎn)變。

此前，作為技術(shù)理想主義者的他，一直希望保持DeepSeek的獨(dú)立性，不受商業(yè)壓力的干擾。

上一次發(fā)布新一代模型，還是在2025年DeepSeek R1爆火時(shí)。如今，DeepSeek已經(jīng)讓全行業(yè)等了一年半。

如果此次融資成功，DeepSeek就可以擁有更多算力，同時(shí)還能開(kāi)出更高薪酬，防止頂尖研究者流失。

不過(guò)，由于DeepSeek「中國(guó)初創(chuàng)公司」的身份，一些美國(guó)風(fēng)險(xiǎn)投資人態(tài)度會(huì)比較謹(jǐn)慎。

DeepSeek V4的發(fā)布時(shí)間一再推遲，同時(shí)AI圈的競(jìng)爭(zhēng)環(huán)境已經(jīng)大變樣。

如今全球的各大頂尖模型都在快速迭代，中美兩國(guó)的科技巨頭們正憑借財(cái)大氣粗的優(yōu)勢(shì)不斷占領(lǐng)高位。

或許，這種壓力終于促使DeepSeek轉(zhuǎn)變了融資策略。

V4，一場(chǎng)萬(wàn)億參數(shù)的硬仗

按照The Information的說(shuō)法，V4原定今年2月亮相，但已跳票多次。

路透在4月初給出的最新時(shí)間窗口是「未來(lái)幾周內(nèi)」。

從目前已知信息來(lái)看，V4的規(guī)模和野心遠(yuǎn)超前代。

參數(shù)量躍升至萬(wàn)億級(jí)別。

V4采用MoE架構(gòu)，總參數(shù)約1萬(wàn)億，但每個(gè)token僅激活約370億參數(shù)，推理成本與V3持平。這個(gè)設(shè)計(jì)思路延續(xù)了DeepSeek一貫的效率優(yōu)先哲學(xué)。

來(lái)源網(wǎng)絡(luò)的爆料圖

上下文窗口擴(kuò)展到100萬(wàn)token。

V4引入了一套名為Engram的條件記憶架構(gòu)，實(shí)現(xiàn)了對(duì)超長(zhǎng)上下文的恒定時(shí)間檢索。據(jù)內(nèi)部測(cè)試，在100萬(wàn)token長(zhǎng)度下的信息召回率達(dá)到97%，遠(yuǎn)超V3在128K上下文時(shí)的表現(xiàn)。

原生多模態(tài)。

據(jù)FT報(bào)道，V4將是DeepSeek首個(gè)原生多模態(tài)模型，支持文本、圖像和視頻生成。此前DeepSeek的模型一直以純文本為主，而其他旗艦?zāi)Ｐ驮缫褤肀Ф嗄B(tài)。

代碼能力大幅強(qiáng)化。

V4從立項(xiàng)之初就以代碼生成為核心目標(biāo)。內(nèi)部benchmark顯示SWE-bench成績(jī)超過(guò)80%，HumanEval達(dá)到90%。據(jù)稱(chēng)V4能處理整個(gè)代碼倉(cāng)庫(kù)級(jí)別的復(fù)雜bug修復(fù)，在長(zhǎng)上下文代碼推理上的表現(xiàn)將超越Claude和GPT系列。

此外，還有爆料稱(chēng)，V4預(yù)計(jì)將分兩個(gè)版本發(fā)布。

完整版超萬(wàn)億參數(shù)，針對(duì)高級(jí)推理和復(fù)雜代碼任務(wù)優(yōu)化，面向華為昇騰芯片；輕量版約2000億參數(shù)，面向通用對(duì)話和API服務(wù)，可在其他國(guó)產(chǎn)芯片上運(yùn)行。

開(kāi)源方面，V4計(jì)劃以Apache 2.0協(xié)議開(kāi)放權(quán)重，延續(xù)DeepSeek一貫的開(kāi)源策略。

什么時(shí)候能用上？多個(gè)信源指向4月底。

3月9日，一個(gè)名為「V4 Lite」的版本曾短暫出現(xiàn)在DeepSeek平臺(tái)上隨后被撤下。

4月初，又有開(kāi)發(fā)者發(fā)現(xiàn)API節(jié)點(diǎn)上出現(xiàn)了V4 Lite的測(cè)試版本，推理速度提升30%，128K上下文的信息召回率從45%跳到了94%。

DeepSeek近日還在內(nèi)蒙古烏蘭察布發(fā)布了服務(wù)器運(yùn)維工程師和交付經(jīng)理的招聘崗位，這是該公司首次公開(kāi)招聘算力基礎(chǔ)設(shè)施相關(guān)的駐場(chǎng)人員。

種種跡象表明，V4已經(jīng)不在實(shí)驗(yàn)室里了，而是在為大規(guī)模部署做最后準(zhǔn)備。

老黃最不想看到的事正在發(fā)生

V4延期的核心原因，跟模型本身關(guān)系不大。真正的難點(diǎn)，是一場(chǎng)底層硬件的大遷移。

DeepSeek之前所有模型都基于英偉達(dá)芯片訓(xùn)練。但V4走了一條不同的路。

據(jù)路透報(bào)道，V4將運(yùn)行在華為最新的昇騰芯片上。

DeepSeek的工程師們花了大量時(shí)間解決V4對(duì)華為芯片的適配問(wèn)題，重寫(xiě)核心代碼，從英偉達(dá)的CUDA生態(tài)遷移到華為的CANN架構(gòu)。

這是一個(gè)技術(shù)決策，也是一個(gè)戰(zhàn)略信號(hào)。

DeepSeek刻意沒(méi)有給英偉達(dá)和AMD提前提供V4做優(yōu)化適配，而是將早期訪問(wèn)權(quán)限獨(dú)家給了國(guó)產(chǎn)芯片廠商。

如果V4在華為芯片上跑出有競(jìng)爭(zhēng)力的性能，它將是全球第一個(gè)不依賴(lài)英偉達(dá)的前沿AI模型。

老黃本人對(duì)此也不淡定。

他在近期采訪中直言，DeepSeek基于華為平臺(tái)的新模型「對(duì)美國(guó)來(lái)說(shuō)將是一個(gè)糟糕的結(jié)果」。

言下之意是，一旦AI模型被優(yōu)化為在中國(guó)硬件上跑得最好，美國(guó)芯片的護(hù)城河就不再牢固。

3億美元，脫離英偉達(dá)生態(tài)？

如今，即便是以「花小錢(qián)辦大事」著稱(chēng)的DeepSeek，也無(wú)法僅靠一家持續(xù)輸血。

據(jù)斯坦福大學(xué)2026年度AI指數(shù)報(bào)告，截至今年3月，美國(guó)頂級(jí)模型與中國(guó)最強(qiáng)競(jìng)品之間的性能差距僅剩2.7個(gè)百分點(diǎn)。差距越小，每一步追趕的邊際成本越高。

就在本月，OpenAI剛以3000億美元估值完成400億美元融資，相比之下，3億美元也算不得天文數(shù)字。

V4真正的賭注，在于它要證明前沿AI可以完全脫離英偉達(dá)生態(tài)獨(dú)立運(yùn)轉(zhuǎn)。

3億美元，押的就是這一把。

參考資料：

https://www.theinformation.com/articles/chinas-deepseek-raising-money-first-time-10-billion-plus-valuation?rc=epv9gi

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.