![]()
新智元報(bào)道
編輯:Aeneas 好困
【新智元導(dǎo)讀】今早AI圈炸了!從不融資的DeepSeek首度開(kāi)口:尋求100億美元估值,籌集3億美元。V4即將來(lái)襲,萬(wàn)億參數(shù)+華為昇騰加持,連老黃都慌了!
今早,AI圈都被這個(gè)消息震撼了。
外媒The Information曝出,DeepSeek正尋求首次外部融資!
打破「從不融資」鐵律的DeepSeek,這次尋求以不低于100億美元的估值,籌集至少3億美元的資金。
在極其燒錢(qián)的AI大模型開(kāi)發(fā)競(jìng)賽中,DeepSeek也需要充實(shí)資金彈藥庫(kù)了。
![]()
曾經(jīng)的DeepSeek,堅(jiān)決不融資
對(duì)沖基金巨頭幻方量化旗下的DeepSeek,在R1引起硅谷和華爾街軒然大波后,多次拒絕了國(guó)內(nèi)頂級(jí)風(fēng)投和科技巨頭的投資意向。
DeepSeek這次選擇啟動(dòng)融資,意味著梁文鋒終于做出了巨大的轉(zhuǎn)變。
此前,作為技術(shù)理想主義者的他,一直希望保持DeepSeek的獨(dú)立性,不受商業(yè)壓力的干擾。
上一次發(fā)布新一代模型,還是在2025年DeepSeek R1爆火時(shí)。如今,DeepSeek已經(jīng)讓全行業(yè)等了一年半。
如果此次融資成功,DeepSeek就可以擁有更多算力,同時(shí)還能開(kāi)出更高薪酬,防止頂尖研究者流失。
不過(guò),由于DeepSeek「中國(guó)初創(chuàng)公司」的身份,一些美國(guó)風(fēng)險(xiǎn)投資人態(tài)度會(huì)比較謹(jǐn)慎。
DeepSeek V4的發(fā)布時(shí)間一再推遲,同時(shí)AI圈的競(jìng)爭(zhēng)環(huán)境已經(jīng)大變樣。
如今全球的各大頂尖模型都在快速迭代,中美兩國(guó)的科技巨頭們正憑借財(cái)大氣粗的優(yōu)勢(shì)不斷占領(lǐng)高位。
或許,這種壓力終于促使DeepSeek轉(zhuǎn)變了融資策略。
V4,一場(chǎng)萬(wàn)億參數(shù)的硬仗
按照The Information的說(shuō)法,V4原定今年2月亮相,但已跳票多次。
路透在4月初給出的最新時(shí)間窗口是「未來(lái)幾周內(nèi)」。
從目前已知信息來(lái)看,V4的規(guī)模和野心遠(yuǎn)超前代。
參數(shù)量躍升至萬(wàn)億級(jí)別。
V4采用MoE架構(gòu),總參數(shù)約1萬(wàn)億,但每個(gè)token僅激活約370億參數(shù),推理成本與V3持平。這個(gè)設(shè)計(jì)思路延續(xù)了DeepSeek一貫的效率優(yōu)先哲學(xué)。
![]()
來(lái)源網(wǎng)絡(luò)的爆料圖
上下文窗口擴(kuò)展到100萬(wàn)token。
V4引入了一套名為Engram的條件記憶架構(gòu),實(shí)現(xiàn)了對(duì)超長(zhǎng)上下文的恒定時(shí)間檢索。據(jù)內(nèi)部測(cè)試,在100萬(wàn)token長(zhǎng)度下的信息召回率達(dá)到97%,遠(yuǎn)超V3在128K上下文時(shí)的表現(xiàn)。
![]()
原生多模態(tài)。
據(jù)FT報(bào)道,V4將是DeepSeek首個(gè)原生多模態(tài)模型,支持文本、圖像和視頻生成。此前DeepSeek的模型一直以純文本為主,而其他旗艦?zāi)P驮缫褤肀Ф嗄B(tài)。
代碼能力大幅強(qiáng)化。
V4從立項(xiàng)之初就以代碼生成為核心目標(biāo)。內(nèi)部benchmark顯示SWE-bench成績(jī)超過(guò)80%,HumanEval達(dá)到90%。據(jù)稱(chēng)V4能處理整個(gè)代碼倉(cāng)庫(kù)級(jí)別的復(fù)雜bug修復(fù),在長(zhǎng)上下文代碼推理上的表現(xiàn)將超越Claude和GPT系列。
此外,還有爆料稱(chēng),V4預(yù)計(jì)將分兩個(gè)版本發(fā)布。
完整版超萬(wàn)億參數(shù),針對(duì)高級(jí)推理和復(fù)雜代碼任務(wù)優(yōu)化,面向華為昇騰芯片;輕量版約2000億參數(shù),面向通用對(duì)話和API服務(wù),可在其他國(guó)產(chǎn)芯片上運(yùn)行。
開(kāi)源方面,V4計(jì)劃以Apache 2.0協(xié)議開(kāi)放權(quán)重,延續(xù)DeepSeek一貫的開(kāi)源策略。
什么時(shí)候能用上?多個(gè)信源指向4月底。
3月9日,一個(gè)名為「V4 Lite」的版本曾短暫出現(xiàn)在DeepSeek平臺(tái)上隨后被撤下。
4月初,又有開(kāi)發(fā)者發(fā)現(xiàn)API節(jié)點(diǎn)上出現(xiàn)了V4 Lite的測(cè)試版本,推理速度提升30%,128K上下文的信息召回率從45%跳到了94%。
DeepSeek近日還在內(nèi)蒙古烏蘭察布發(fā)布了服務(wù)器運(yùn)維工程師和交付經(jīng)理的招聘崗位,這是該公司首次公開(kāi)招聘算力基礎(chǔ)設(shè)施相關(guān)的駐場(chǎng)人員。
種種跡象表明,V4已經(jīng)不在實(shí)驗(yàn)室里了,而是在為大規(guī)模部署做最后準(zhǔn)備。
老黃最不想看到的事正在發(fā)生
V4延期的核心原因,跟模型本身關(guān)系不大。真正的難點(diǎn),是一場(chǎng)底層硬件的大遷移。
DeepSeek之前所有模型都基于英偉達(dá)芯片訓(xùn)練。但V4走了一條不同的路。
據(jù)路透報(bào)道,V4將運(yùn)行在華為最新的昇騰芯片上。
DeepSeek的工程師們花了大量時(shí)間解決V4對(duì)華為芯片的適配問(wèn)題,重寫(xiě)核心代碼,從英偉達(dá)的CUDA生態(tài)遷移到華為的CANN架構(gòu)。
這是一個(gè)技術(shù)決策,也是一個(gè)戰(zhàn)略信號(hào)。
DeepSeek刻意沒(méi)有給英偉達(dá)和AMD提前提供V4做優(yōu)化適配,而是將早期訪問(wèn)權(quán)限獨(dú)家給了國(guó)產(chǎn)芯片廠商。
如果V4在華為芯片上跑出有競(jìng)爭(zhēng)力的性能,它將是全球第一個(gè)不依賴(lài)英偉達(dá)的前沿AI模型。
老黃本人對(duì)此也不淡定。
他在近期采訪中直言,DeepSeek基于華為平臺(tái)的新模型「對(duì)美國(guó)來(lái)說(shuō)將是一個(gè)糟糕的結(jié)果」。
言下之意是,一旦AI模型被優(yōu)化為在中國(guó)硬件上跑得最好,美國(guó)芯片的護(hù)城河就不再牢固。
![]()
3億美元,脫離英偉達(dá)生態(tài)?
如今,即便是以「花小錢(qián)辦大事」著稱(chēng)的DeepSeek,也無(wú)法僅靠一家持續(xù)輸血。
據(jù)斯坦福大學(xué)2026年度AI指數(shù)報(bào)告,截至今年3月,美國(guó)頂級(jí)模型與中國(guó)最強(qiáng)競(jìng)品之間的性能差距僅剩2.7個(gè)百分點(diǎn)。差距越小,每一步追趕的邊際成本越高。
就在本月,OpenAI剛以3000億美元估值完成400億美元融資,相比之下,3億美元也算不得天文數(shù)字。
V4真正的賭注,在于它要證明前沿AI可以完全脫離英偉達(dá)生態(tài)獨(dú)立運(yùn)轉(zhuǎn)。
3億美元,押的就是這一把。
參考資料:
https://www.theinformation.com/articles/chinas-deepseek-raising-money-first-time-10-billion-plus-valuation?rc=epv9gi
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.