2025年1月的AI圈簡直是熱鬧得不行,國產Deepseek剛在27號登陸美國地區手機應用商店,直接把穩坐榜首的ChatGPT擠了下去,連帶美國多支科技股都跌得慘兮兮,特朗普都公開表態說Deepseek的出現給整個美國相關產業敲響了警鐘。大家還在熱議Deepseek怎么這么能打時,另一則消息直接把整個全球AI圈炸翻了。李飛飛團隊搞出的新模型,性能跟Deepseek差不離,成本居然低到普通人想都不敢想的地步。
![]()
之前AI圈大伙都有個共識,要搞出能打的頂級大模型,就得砸錢砸算力砸數據,動輒幾百萬上千萬美元往里扔,小團隊連入門的門檻都摸不到。Deepseek之前就靠性價比出圈,被大伙叫AI界的價格屠夫,已經逼得不少科技公司坐不住了。誰能想到李飛飛團隊比他還狠,花了不到50美元就搞出差不多性能的s1-32B模型。這事可不是隨便吹的,有公開論文佐證,還有業內專家實打實測過,一點水分都沒有。
李飛飛是斯坦福大學的教授,也是美國科學院院士,在AI領域摸爬滾打了幾十年,是圈內公認的行業大佬。他們團隊搞這個模型也不是憑空造出來的,是站在阿里通義千問Qwen2.5-32B的成熟模型基礎上做的監督微調。等于說已經有現成的地基,不用自己從打地基開始蓋樓,省了超多時間和成本。很多人第一反應都是不信,50美元連個好點的顯卡都買不到,怎么可能做出來大模型?
他們沒搞那些動輒上億條的海量數據,反而花功夫篩了1000個問題做成小型數據集,名字叫s1K。別小看這1000個問題,含金量拉滿,團隊先是從16個不同來源攢了近6萬個問題,覆蓋數學、量子力學、腦筋急轉彎足足50個領域。之后卡著難度、多樣性、質量三個標準一點點摳,最后只留下1000個推理鏈路長、難度高的問題,每個都配了詳細的推理過程和標準答案。等于說用的都是精華中的精華,一點沒用的廢料都沒有。
![]()
他們還搞了個叫“預算強制”的小技術,專門用來控制模型的思考時間。說白了就是給模型設了個思考的時間上限,想太久就強制停下來答題,想的時間不夠就提醒它再捋捋思路。這么操作下來,既能保證推理的質量,又能把算力成本壓到最低。最后算下來,訓練的時候只用了16個英偉達H100 GPU,全程只跑了26分鐘。
按當時的GPU租金來算,這部分的開銷加起來還不到50美元。對比一下其他頂級大模型,動不動就要上百個GPU跑好幾天甚至幾周,成本早就沖到百萬美元以上了,這個成本低得跟白撿似的。也有人說他們這是“作弊”,50美元復刻Deepseek根本不可能,這話其實也得掰扯清楚才不會有誤解。這50美元只算了微調時候的GPU租金,沒算通義千問模型本身的訓練成本。
通義千問之前訓練的時候已經砸了大量的人力物力,李飛飛團隊是在這個已經成型的成熟模型基礎上做優化。相當于你買了現成的洗好切好的食材,只需要下鍋炒一下就能上桌,食材本身的成本沒算在炒菜的錢里。還有人吹這個s1-32B模型性能已經超過Deepseek和OpenAI的o1模型,這話也不準確。實測下來,它在競賽數學問題上比o1-preview高27%,和Deepseek的R1、普通版o1性能差不多,但是還沒超過滿血版的o1和正式版的Deepseek-R1。
![]()
業內專家也說,李飛飛團隊最厲害的地方不是復刻了Deepseek,是找到了一條低成本提升模型性能的路子。他們相當于給整個行業指了條明路,用高質量的小數據集加簡單的技術優化,就能讓普通模型的性能漲一大截,不用再死磕海量數據和高額算力。之前AI行業完全是資本堆出來的,大公司拼了命砸錢比算力比數據,小團隊根本活不下去,現在倒好,沒錢也能搞出能打的頂級AI了。不少人都說這是AI成本革命的又一個里程碑,搞不好要改寫整個AI行業的游戲規則。
現在s1模型已經開源了,越來越多的團隊都跟著學這種玩法,基于現成的開源模型做微調,成本直接砍了一大截。現在通義千問的衍生模型數量已經破了9萬,就兩款視覺模型的全球下載量都超過3200萬次,開源大模型的生態越來越熱鬧。那些大科技公司也都改了策略,不再傻乎乎一味砸錢,都轉頭去搞效率提升了。整個行業的風向一下子就變了,不再是比誰砸的錢多,而是比誰的思路巧效率高。
![]()
的李彥宏之前就說過,AI推理成本每年能降90%,比摩爾定律猛多了,以后AI肯定會越來越普及。谷歌CEO也說,過去18個月AI處理數據的成本降了97%,以后智能技術的獲取門檻只會越來越低。這事也不是跟普通人沒關系的冷門科技新聞,實打實會影響到我們以后的生活。以后說不定小工作室甚至個人都能搞出自己想用的AI模型,不用再被成本卡脖子。
以后低成本AI會滲透到更多行業,不管是醫療、教育還是自動駕駛,這些領域的門檻都會往下掉,我們能享受到的便利也會越來越多。李飛飛作為華裔院士,能在AI領域搞出這種突破性的成果,不少華人都覺得特別驕傲。她沒靠資本堆出來的優勢,全靠技術創新打破了行業的壟斷,讓AI的發展回歸到技術本身的賽道上。這種靠巧勁破局的思路,也給很多國內的AI團隊做了很好的示范。
![]()
之后肯定會有更多團隊借鑒這種思路搞研發,AI行業的競爭也會越來越卷。行業卷起來對普通消費者肯定是好事,不管是產品價格還是服務質量,都會往更利好我們的方向走。咱們普通人就等著享受技術進步帶來的紅利就行,以后AI的玩法說不定還會有更多驚喜。整個AI行業的普惠時代,說不定比我們預想的要來得早得多。
參考資料:人民網 2025年全球開源大模型生態發展白皮書
中國科學報 李飛飛團隊低成本大模型研發成果解析
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.