01、何以出色
DeepSeek之所以表現出色,簡單來說是模型的自我強化。
是這樣的:
- 1 首先,訓練一個基礎模型;
- 2 然后,讓基礎模型按照一定的標準輸出內容(編程和數學方向);
- 3 接著,根據事先設置好的優秀答案,讓模型參照著自己給自己評分;
- 4 再接著,根據評分、也參照優秀答案,自己調整參數,再次輸出。
- 重復3和4,直到模型的輸出符合優秀答案。
![]()
這個過程就相當于:
- 小龍女教楊過武功,教了一些古墓派基礎招式、內功心法、跟人決斗時的方法……楊過學會了,古墓派傳人的基礎模型有了。
- 然后,小龍女讓楊過以取勝為目的,用古墓派武功找趙志敬決斗(按照標準輸出);
- 接著,決斗完是勝是負很明顯——楊過自己就能給自己評分(評分)。
- 再接著,楊過根據現實,調整自己,再次決斗。(調整參數)
- 經過n輪調整,楊過贏了。
這就是強化學習,也是自我學習的過程。
在第一個階段,生成基本模型,大家都差不多——
- 老師演示、喂資料;
- 學生識別、記憶、練習。
第二個階段,DeepSeek調用算力,進行了自我強化——
不足,我就思考,根據思考結果去調整,我努力接近優秀。
如此,模型整體提升得非常快。
就像那個下象棋的“狗”,總是會自我迭代。
![]()
02、對應到學數學
在第一個階段,喂資料學習。
相當于老師講課,老師傳授招式。
學生收集老師所講的內容,按照老師說的做——比如對概念的理解上,做題的方式上。
做錯了,老師提醒你回到正確的方式上來。
只要老師好,老師的知識面廣,學生整體的表現還是不錯的。
比如,中考、高考。
題型就那么多,考綱上的內容也就那么多,該講的老師都會講到。
只要你都記住了,也能考出好成績。
問題是【遺忘】。
遺忘無疑是學習的大敵,記性好的、領悟能力強的孩子就非常沾光。
所以,在這個體系內,這種孩子效率就高。
但只要你肯下功夫,別人一小時搞會的,你用一天,夠勤奮你也不至于太差。
![]()
還有一種方式,對應DeepSeek第二階段的學習。
上課老師喂資料,該講的都講了。
老師就給你題目做。
數學題因為都有現成的答案,做完對不對一目了然。
你自己立馬就能得到反饋,而且反饋是自己給自己的:
- 對了多少,差在哪里;
- 如何更接近正確答案,你去思考;
- 思考完調整,調整后繼續輸出,繼續去找反饋……如此往復。
- 最終你出了好成績。
第一種比較依賴老師,也需要大量的重復性工作——去記憶、去按正確方法練習;
第二種弱化老師,讓學生自我學習——一通百通,練習比較少、提升卻很快。
主打一個【自我調整,越來越接近優秀】。
![]()
03、對應自身
不知道你發現沒:
兩個階段,一個被動一個主動。
如果你想短時間內提升數學成績,你需要主動的強化學習。
當你主動,你內耗就沒有了。
不會說這個老師不好,那個老師方式不適合你的。
也會主動放棄許多邊邊角角的事情。
你就自我強化、專注于自己的發展。
只要你對一件事說了我愿意,你就打開了頂級天賦。
然后,上課認真聽也好,自學也好,你把概念掌握牢固,這是必須的——要有個基礎模型。
接著你就去做題:
- 在具體題目上,看看自己離正確答案有多遠,不斷朝正確答案迭代。
- 在整體數學成績上,看看自己離100分有多遠,不斷去調整自己,最終達到100分。
主動的自我強化,就是自我教育——
哪里好發揮哪里,哪里不行迭代哪里。
屬于帶著腦袋來上學。你說快不快?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.