網易首頁 > 網易號 > 正文申請入駐

美國華裔女院士李飛飛：低成本成功復刻Deepseek，性能媲美頂級AI

2026-03-22 12:32:58　來源: 聊歷史的阿稼

河南舉報

分享至

2025年1月的AI圈簡直是熱鬧得不行，國產Deepseek剛在27號登陸美國地區手機應用商店，直接把穩坐榜首的ChatGPT擠了下去，連帶美國多支科技股都跌得慘兮兮，特朗普都公開表態說Deepseek的出現給整個美國相關產業敲響了警鐘。大家還在熱議Deepseek怎么這么能打時，另一則消息直接把整個全球AI圈炸翻了。李飛飛團隊搞出的新模型，性能跟Deepseek差不離，成本居然低到普通人想都不敢想的地步。

之前AI圈大伙都有個共識，要搞出能打的頂級大模型，就得砸錢砸算力砸數據，動輒幾百萬上千萬美元往里扔，小團隊連入門的門檻都摸不到。Deepseek之前就靠性價比出圈，被大伙叫AI界的價格屠夫，已經逼得不少科技公司坐不住了。誰能想到李飛飛團隊比他還狠，花了不到50美元就搞出差不多性能的s1-32B模型。這事可不是隨便吹的，有公開論文佐證，還有業內專家實打實測過，一點水分都沒有。

李飛飛是斯坦福大學的教授，也是美國科學院院士，在AI領域摸爬滾打了幾十年，是圈內公認的行業大佬。他們團隊搞這個模型也不是憑空造出來的，是站在阿里通義千問Qwen2.5-32B的成熟模型基礎上做的監督微調。等于說已經有現成的地基，不用自己從打地基開始蓋樓，省了超多時間和成本。很多人第一反應都是不信，50美元連個好點的顯卡都買不到，怎么可能做出來大模型？

他們沒搞那些動輒上億條的海量數據，反而花功夫篩了1000個問題做成小型數據集，名字叫s1K。別小看這1000個問題，含金量拉滿，團隊先是從16個不同來源攢了近6萬個問題，覆蓋數學、量子力學、腦筋急轉彎足足50個領域。之后卡著難度、多樣性、質量三個標準一點點摳，最后只留下1000個推理鏈路長、難度高的問題，每個都配了詳細的推理過程和標準答案。等于說用的都是精華中的精華，一點沒用的廢料都沒有。

他們還搞了個叫“預算強制”的小技術，專門用來控制模型的思考時間。說白了就是給模型設了個思考的時間上限，想太久就強制停下來答題，想的時間不夠就提醒它再捋捋思路。這么操作下來，既能保證推理的質量，又能把算力成本壓到最低。最后算下來，訓練的時候只用了16個英偉達H100 GPU，全程只跑了26分鐘。

按當時的GPU租金來算，這部分的開銷加起來還不到50美元。對比一下其他頂級大模型，動不動就要上百個GPU跑好幾天甚至幾周，成本早就沖到百萬美元以上了，這個成本低得跟白撿似的。也有人說他們這是“作弊”，50美元復刻Deepseek根本不可能，這話其實也得掰扯清楚才不會有誤解。這50美元只算了微調時候的GPU租金，沒算通義千問模型本身的訓練成本。

通義千問之前訓練的時候已經砸了大量的人力物力，李飛飛團隊是在這個已經成型的成熟模型基礎上做優化。相當于你買了現成的洗好切好的食材，只需要下鍋炒一下就能上桌，食材本身的成本沒算在炒菜的錢里。還有人吹這個s1-32B模型性能已經超過Deepseek和OpenAI的o1模型，這話也不準確。實測下來，它在競賽數學問題上比o1-preview高27%，和Deepseek的R1、普通版o1性能差不多，但是還沒超過滿血版的o1和正式版的Deepseek-R1。

業內專家也說，李飛飛團隊最厲害的地方不是復刻了Deepseek，是找到了一條低成本提升模型性能的路子。他們相當于給整個行業指了條明路，用高質量的小數據集加簡單的技術優化，就能讓普通模型的性能漲一大截，不用再死磕海量數據和高額算力。之前AI行業完全是資本堆出來的，大公司拼了命砸錢比算力比數據，小團隊根本活不下去，現在倒好，沒錢也能搞出能打的頂級AI了。不少人都說這是AI成本革命的又一個里程碑，搞不好要改寫整個AI行業的游戲規則。

現在s1模型已經開源了，越來越多的團隊都跟著學這種玩法，基于現成的開源模型做微調，成本直接砍了一大截。現在通義千問的衍生模型數量已經破了9萬，就兩款視覺模型的全球下載量都超過3200萬次，開源大模型的生態越來越熱鬧。那些大科技公司也都改了策略，不再傻乎乎一味砸錢，都轉頭去搞效率提升了。整個行業的風向一下子就變了，不再是比誰砸的錢多，而是比誰的思路巧效率高。

的李彥宏之前就說過，AI推理成本每年能降90%，比摩爾定律猛多了，以后AI肯定會越來越普及。谷歌CEO也說，過去18個月AI處理數據的成本降了97%，以后智能技術的獲取門檻只會越來越低。這事也不是跟普通人沒關系的冷門科技新聞，實打實會影響到我們以后的生活。以后說不定小工作室甚至個人都能搞出自己想用的AI模型，不用再被成本卡脖子。

以后低成本AI會滲透到更多行業，不管是醫療、教育還是自動駕駛，這些領域的門檻都會往下掉，我們能享受到的便利也會越來越多。李飛飛作為華裔院士，能在AI領域搞出這種突破性的成果，不少華人都覺得特別驕傲。她沒靠資本堆出來的優勢，全靠技術創新打破了行業的壟斷，讓AI的發展回歸到技術本身的賽道上。這種靠巧勁破局的思路，也給很多國內的AI團隊做了很好的示范。

之后肯定會有更多團隊借鑒這種思路搞研發，AI行業的競爭也會越來越卷。行業卷起來對普通消費者肯定是好事，不管是產品價格還是服務質量，都會往更利好我們的方向走。咱們普通人就等著享受技術進步帶來的紅利就行，以后AI的玩法說不定還會有更多驚喜。整個AI行業的普惠時代，說不定比我們預想的要來得早得多。

參考資料：人民網 2025年全球開源大模型生態發展白皮書

中國科學報李飛飛團隊低成本大模型研發成果解析

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.