337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

全球最大游戲博主「偷師」DeepSeek,爆改國產大模型干翻 ChatGPT

0
分享至

全球最大游戲博主 PewDiePie,又整活了。

他靠著「偷師」DeepSeek、清華大學發布的技術文檔,用一堆魔改顯卡成功微調出一個自己的 AI 模型,而這個模型在編程基準測試中的表現,竟然超越了 GPT-4 和 Gemini 2.5 Pro。


但就在幾個月前,他對 AI 的了解還跟普通人沒什么兩樣。 PewDiePie 本名為菲利克斯·謝爾貝格(Felix Kjellberg),坐擁逾 1.1 億 YouTube 訂閱,近年來逐漸淡出游戲直播圈,反而把大量時間放在了 AI 領域。


轉折點出現在去年 11 月。他發布《STOP. Using AI Right now》,展示如何從零搭建一套帶搜索、記憶和語音輸出的個人 AI 助手。

這次的新視頻,他更進一步——從數據收集到模型微調,完整記錄了一個 AI 小白是如何微調出一個能媲美頂流 AI 的模型。


差點燒掉兩次房子,頂流網紅微調大模型打敗 GPT-4

PewDiePie 坦言,在開始這個項目之前,他對機器學習、模型訓練和代碼編程幾乎一無所知。但他的邏輯很簡單:

不懂就學,一步一步來。

他選用阿里旗下開源的 Qwen 2.5(32B 參數版)作為底座模型,目標是在一個名為 Aider Polyglot 的編程基準測試上超越 ChatGPT。


選擇這個 benchmark 也有來由:他在之前視頻里曾用 Aider 這個工具搭建自己的網頁 UI,對它并不陌生。

這個測試涵蓋六種編程語言,而彼時 ChatGPT 的得分約為 18.2%,Qwen 2.5 在默認格式下僅有 8%。但他發現,換用「whole form」格式后可提升至 16%。

所謂「whole form」,是指模型修改代碼時會把整段代碼從頭重寫一遍,而不是只改動需要修改的部分——這意味著,只要解決格式問題,超越 ChatGPT 并非遙不可及。


而且格式只是外部設置,模型本身的能力才是真正的瓶頸。要從根本上提升,唯一的路是微調訓練——而訓練,需要數據。他由此開始了漫長的數據工程。

他嘗試了幾乎所有能想到的數據來源:挖掘 60TB 的開放代碼數據集 The Stack,爬取 GitHub 公開倉庫,以及讓大模型批量合成訓練樣本。


最初他收集了約 10 萬條訓練數據,整個過程混亂不堪,多個 LLM 同時跑數據處理、測試、增強。

但數據質量始終是問題。

合成數據看起來格式完美,打開一看卻全是錯誤。他為此搭建了一套「驗證框架」來過濾垃圾數據,卻因為框架本身的邏輯缺陷,反而讓更多垃圾數據蒙混過關。

第一次正式訓練跑完,模型成績沒有提升,反而更差了。他沒有放棄,調整后重訓,結果還是更差。這個循環持續了數月。


修復了測試框架之后,benchmark 終于能正常跑起來,最高跑到 16%,但 要超過 ChatGPT 的 18.2%,還有距離。


這時,一篇來自清華大學聯合阿里巴巴、莫納什大學的研究成果《Towards Widening The Distillation Bottleneck for Reasoning Models》的技術論文,帶給了他新的靈感。

簡單來說,就是既然直接抄大模型的長思維鏈會把小模型帶偏,那就別直接抄。改成自己造訓練數據,而且造得更像人做題時的過程。


論文地址:https://arxiv.org/html/2503.01461v1

硬件方面的折磨則更具戲劇性。

為了加入「推理鏈」提升模型表現,他需要更大量的算力持續運轉。某次重啟后,GPU 突然開始冒煙,煙霧彌漫整個房間,他關機檢查,發現其中一塊 GPU 已經損毀。

翻了購買記錄才發現,這塊出問題的來自不同工廠。其實也不意外——他這套系統用的也是從中國買的魔改版 RTX 4090顯卡。


后來他又發現,自己一直在用額定 1500W 的電源線,實際運行功率卻超過 2000W。換線之后,電腦仍頻繁崩潰,他索性把浴室的電路「借」過來接入機器,并把 GPU 功耗從 450W 壓到 175W,只為不讓家里的電網隨時跳閘。


他在視頻里打趣說,為了一切順利,他甚至給整套系統舉行了開光儀式。

算力和數據的雙重折磨之下,他開始調用 DeepSeek API 來合成約 1.5 萬條高質量推理樣本。這些樣本數量雖少,卻是他精心篩選的「精華數據」,每一條都附有詳細的逐步推理過程。用這批數據完成監督微調后,基準測試成績達到 19.6%,在數值上超越了 ChatGPT。


但他隨即發現自己忘記做數據污染檢查,即驗證訓練數據是否與測試集重疊。

檢查后確認存在少量污染,他決定清洗數據、重頭再來。這一次,他還意外發現自己此前一直在用 Qwen 的通用版本,而非專為代碼優化的版本。換用正確模型、配合完整清潔數據集重訓后,成績跳升至 25%。


隨后他修復了基準測試本身的 Bug,即 C++和 JavaScript 題目未被正確執行的問題,修復后重跑,成績升至 36%。


經過最后一輪后訓練,純凈去污染版本的最終成績定格在 39.1%,超越了 GPT-4-mini 及 Gemini 2.0 Pro 等多個早期主流模型。


值得一提的是,整個微調過程中,PewDiePie 多次強調 DeepSeek 技術文檔對他的幫助。在他看來,DeepSeek 不僅公開了模型權重,還發布了詳盡的訓練流程文檔,將數據處理、推理增強等核心方法細節和盤托出。

而從 DeepSeek 的訓練文檔,到 Qwen 2.5 的開源底座,再到清華團隊關于推理鏈蒸餾的論文——一個對 AI 幾乎一無所知的內容創作者,能夠在數月內完成從零到擊敗頂流模型的跨越,并不只是個人努力的故事,更繞不開中國 AI 研究對整個開源社區持續的實質性貢獻。

AI 焦慮時代,普通人該如何自處

視頻發布后,社交媒體上的反應截然不同。

一種是純粹的震撼。X 網友 @birdabo 在社交媒體上寫道:「PewDiePie 剛剛訓練了自己的 LLM,他的模型在編碼基準測試中超過了 DeepSeek V2.5、LLaMA-4 和 GPT-4o。什么鬼?!?/p>


另一位用戶 @CryptoElara 則表示:「太瘋狂了,Pewds?!挂灿腥苏{侃:「從我的世界到機器學習!」,暗指 PewDiePie 曾以《我的世界》等游戲內容起家,如今卻在折騰大語言模型的訓練流程。


技術博主 @nrehiew_更是寫道,他從未想象過 DeepSeek R1 論文會出現在 PewDiePie 的視頻里,而更令他意外的是,PewDiePie 在整個過程中展現出的嚴謹程度,甚至比某些正式論文還要高。


值得一提的是,這種看似「不務正業」的深度投入,恰恰需要一種大多數人難以企及的前提——當下 AI 行業的知識迭代速度,已經快到了幾乎需要全職跟進才能不掉隊的程度。

互聯網上流傳著一句半開玩笑的推論:只有無業狀態的人,才能真正追上 AI 領域的所有動態。

PewDiePie 年收入峰值超過 1500 萬美元,早在訂閱量爆發期就已實現財務自由,他可以花數月時間折騰一套 GPU、燒毀設備再重來,完全沒有來自工作和收入的外部壓力。

OpenClaw 之父 Peter Steinberger 也有著類似的處境。他長期保持對新技術的深度探索,同樣是建立在早期創業變現所帶來的時間自由之上的。


一方面,AI 工具的門檻確實大幅降低,讓普通人得以以更低的門檻觸碰以前只有頂尖工程師才能涉足的領域;另一方面,真正能沉下心來深度學習 AI、并將其轉化為生產力的人,往往還是少數人。

那么,對于沒有辦法辭職全職研究 AI 的普通人,這個時代究竟該怎么應對?《華爾街日報》近期采訪了多位 AI 領域領導者,詢問他們對子女教育和職業規劃的建議,或許能提供一些參考。

Anthropic 聯合創始人 Daniela Amodei: 她認為,AI 無法取代的,恰恰是人與人之間的連接能力,比如共情、溝通和善意。隨著 AI 在職場中越來越普遍,這些人類特質反而會愈加珍貴。她甚至認為,自己會引導孩子多社交,更深入地理解自己與他人相處的獨特方式。

賓夕法尼亞大學沃頓商學院教授 Ethan Mollick:需要整合多種技能的綜合型職業,在 AI 時代反而更具韌性。以醫生為例,診斷只是工作的一部分,AI 或許能在某些環節上輔助甚至超越人類,但整體職業所需的判斷力、責任感和人際能力,并不會因此消失。

微軟首席科學家 Jaime Teevan:傳統文科教育在這個時代的價值,被嚴重低估。她還觀察到,與 AI 打交道已經不再是確定性的指令輸入,而是基于自然語言的意圖表達和批判性提問,這與人文學科的訓練高度契合。

這幾位處于 AI 行業核心位置的人,給出的建議卻不約而同地指向了一個反直覺的方向:在一個技術迭代極快的時代,真正的護城河不是最新的技術棧,而是那些慢變量,比如溝通、判斷、好奇心和接受失敗的能力。


包括 PewDiePie 也在視頻末尾分享了他最深的體會,他說自己在整個項目中學會了一件事:要預期失敗,甚至要擁抱失敗。他的模型在最終跑出 39.1% 之前,經歷了無數次越訓越差的循環,每一次他都幾乎要放棄。

但正是這些失敗,讓他逐漸理解了 AI 訓練的底層邏輯。他說,這種心態才是「能把你帶到遠方的東西」。而這個道理,顯然不只適用于訓練微調 AI。

附上 YouTube 視頻地址:
https://www.youtube.com/watch?v=aV4j5pXLP-I

歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取,解鎖更多 AI 新知

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
何穗分享婚后日常!逛街買花工作都在北京,為照顧兒子體質變差了

何穗分享婚后日常!逛街買花工作都在北京,為照顧兒子體質變差了

不甜的李子
2026-03-21 23:07:06
惹眾怒!張本兄妹改名風波再升級,韓媒狠批:這就是“創氏改名”

惹眾怒!張本兄妹改名風波再升級,韓媒狠批:這就是“創氏改名”

東方不敗然多多
2026-03-20 20:38:25
1982年血色使館:中國外交官唐健生為了生存殺光了所有同事

1982年血色使館:中國外交官唐健生為了生存殺光了所有同事

阿校談史
2026-03-20 11:03:27
金晨新西蘭度假被偶遇!鼻梁塌陷、鼻形怪異,與網友合影被贊溫柔

金晨新西蘭度假被偶遇!鼻梁塌陷、鼻形怪異,與網友合影被贊溫柔

陌識
2026-03-19 14:35:36
德國總理:如果事前得知美以對伊朗開戰,德國會提出反對

德國總理:如果事前得知美以對伊朗開戰,德國會提出反對

環球網資訊
2026-03-19 08:36:10
蔣介石說:世上只有兩人能取代我,一個是毛主席,另一個被我殺了

蔣介石說:世上只有兩人能取代我,一個是毛主席,另一個被我殺了

兵鑒史
2026-03-22 01:58:11
00后潮汕女孩逆襲成頂流,這“黑裙殺性感身材”真實?

00后潮汕女孩逆襲成頂流,這“黑裙殺性感身材”真實?

娛樂領航家
2026-03-12 19:00:07
99%的夫妻都不知道的性生活“爽”點,其實在這里

99%的夫妻都不知道的性生活“爽”點,其實在這里

精彩分享快樂
2026-03-17 07:10:03
牛!烏克蘭英雄在地下掩體里堅持作戰了471天

牛!烏克蘭英雄在地下掩體里堅持作戰了471天

老馬拉車莫少裝
2026-03-21 00:10:44
家族業力毀了幾代人幸福,35歲女子三姐妹全離異,年入百萬照樣分

家族業力毀了幾代人幸福,35歲女子三姐妹全離異,年入百萬照樣分

青梅侃史啊
2026-03-20 22:12:20
不管你信不信,女性過63歲后,基本都有如下8個現狀,要學會接受

不管你信不信,女性過63歲后,基本都有如下8個現狀,要學會接受

岐黃傳人孫大夫
2026-03-21 23:00:03
中俄印三角崩盤!普京緊急推動新三角,中方攤牌:不解決死穴免談

中俄印三角崩盤!普京緊急推動新三角,中方攤牌:不解決死穴免談

愛下廚的阿釃
2026-03-22 00:04:16
從魔鬼主場工體全身而退,這一次為申花站出來的是誰

從魔鬼主場工體全身而退,這一次為申花站出來的是誰

上觀新聞
2026-03-21 22:28:06
2013年,康熙傳位遺詔問世,揭秘了真實的雍正奪位之謎

2013年,康熙傳位遺詔問世,揭秘了真實的雍正奪位之謎

談古論今歷史有道
2026-03-21 12:45:03
馬筱梅為汪寶兒開號,不介意孩子出鏡看的開,小小年紀有商業價值

馬筱梅為汪寶兒開號,不介意孩子出鏡看的開,小小年紀有商業價值

阿褲趣聞君
2026-03-21 21:49:00
巴拿馬這回真傻了!搶了港口才發現,全世界沒人敢接盤

巴拿馬這回真傻了!搶了港口才發現,全世界沒人敢接盤

小舟談歷史
2026-03-21 09:21:49
為嫁給美國人,56歲南京大媽奔赴美國,2年后嫁給70歲美國老頭

為嫁給美國人,56歲南京大媽奔赴美國,2年后嫁給70歲美國老頭

情感藝術家
2026-03-08 22:07:38
兩國可能合并,一旦成功將變成超級大國,恐終結美國一家獨大局面

兩國可能合并,一旦成功將變成超級大國,恐終結美國一家獨大局面

現代小青青慕慕
2026-03-15 09:34:25
烏多卡想開了,但危機還沒解除!

烏多卡想開了,但危機還沒解除!

風子說個球
2026-03-21 14:38:47
伊朗總統最新發聲

伊朗總統最新發聲

澎湃新聞
2026-03-21 11:02:05
2026-03-22 05:23:00
AppSo incentive-icons
AppSo
讓智能手機更好用的秘密
6208文章數 26797關注度
往期回顧 全部

科技要聞

宇樹招股書拆解,人形機器人出貨量第一!

頭條要聞

伊朗發射3800公里射程的導彈 最令美軍戰栗的細節披露

頭條要聞

伊朗發射3800公里射程的導彈 最令美軍戰栗的細節披露

體育要聞

誰在決定字母哥未來?

娛樂要聞

田栩寧終于涼了?出軌風波影響惡劣

財經要聞

通脹警報拉響,加息潮要來了?

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

態度原創

教育
數碼
家居
時尚
軍事航空

教育要聞

南師附中舉行2026年31公里步行者行動

數碼要聞

炸鍋!國產存儲芯片再突破!手機固態價格大跳水,內存自由要來了

家居要聞

時空交織 空間綺夢

這個趨勢好適合亞洲人!不用花大錢也能跟

軍事要聞

特朗普:正考慮逐步降級對伊朗的軍事行動

無障礙瀏覽 進入關懷版