337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

Andrej Karpathy 的 2025 LLM 總結

0
分享至

關于訓練范式的變化、benchmark 的失效、Cursor、Claude Code、VibeCoding、LLMGUI

1. RLVR
RLVR成為繼Pretraining、Supervised Finetuning、RLHF之后的新訓練階段。通過在數學/代碼等可驗證環境中訓練,LLM自發習得推理策略,學會分解問題和多步求解。與傳統微調不同,RLVR允許長時間優化,提供高能力/成本比,吞噬了原本用于預訓練的算力。2025年能力進步主要來自更長的RL運行。

2. Ghosts vs. Animals
LLM的優化目標與人類神經網絡截然不同,造就了鋸齒狀智能,既是天才博學者又是易受騙的小學生。RLVR導致LLM在可驗證領域能力飆升但整體參差不齊。Benchmark因可驗證性易被針對優化,"在測試集上訓練"成新藝術。

3. Cursor
Cursor揭示LLM應用的新形態:為垂直領域編排多個LLM調用,進行context engineering,提供專用GUI和自主性滑塊。爭議在于這個應用層有多"厚"。他認為LLM實驗室培養通用人才,而LLM應用通過私有數據、傳感器和反饋將其激活為特定領域的專業團隊。

4. Claude Code
Claude Code是LLM Agent的首個成功展示,循環串聯工具使用和推理。關鍵是它運行在本地電腦而非云端。OpenAI錯將agent部署在云容器中,但在能力參差的過渡期,本地運行與開發者協作更合理。CC以CLI形式呈現,讓AI從網站變成"生活"在電腦上的精靈,這是全新交互范式。

5. Vibe coding將改造軟件并改變職位描述
Vibe coding讓編程不再是專業人士專屬,普通人也能使用。它還讓專業人士編寫更多原本不會寫的軟件,代碼變得免費、臨時、可丟棄。

6. Nano banana / LLM GUI
Nano banana預示LLM GUI雛形。正如計算機從命令行演進到GUI,LLM也應從純文本聊天進化到視覺輸出。人們不喜歡讀文本,它緩慢費力。Nano banana展示了文本生成、圖像生成和世界知識融合的聯合能力。

來源:x.com/karpathy/status/2002118205729562949


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
麻將、關系、性生活是縣城的底色!

麻將、關系、性生活是縣城的底色!

黯泉
2026-03-28 15:09:09
最后一天取消訪華,不到72小時,韓國政府宣布:對中國加稅

最后一天取消訪華,不到72小時,韓國政府宣布:對中國加稅

環球Talk
2026-03-28 12:55:12
41歲單親媽媽因“涉黑”被羈押821天后無罪釋放,申請國家賠償僅13天就被叫停,法院認定無罪警方又以騙貸為由再立案,檢察院回應

41歲單親媽媽因“涉黑”被羈押821天后無罪釋放,申請國家賠償僅13天就被叫停,法院認定無罪警方又以騙貸為由再立案,檢察院回應

大風新聞
2026-03-28 12:10:12
張雪峰為什么配享太廟

張雪峰為什么配享太廟

黔有虎
2026-03-28 17:25:42
百度和高德地圖對比怎樣?網友的評論真是讓我有了選擇

百度和高德地圖對比怎樣?網友的評論真是讓我有了選擇

侃神評故事
2026-02-22 11:45:03
張雪峰窮人思維很嚴重?身家5億騎電驢,吃外賣,400元自助餐嫌貴

張雪峰窮人思維很嚴重?身家5億騎電驢,吃外賣,400元自助餐嫌貴

魔都姐姐雜談
2026-03-28 13:06:09
供應“告急”!100多家化工廠暫停報價!

供應“告急”!100多家化工廠暫停報價!

北方農資周刊
2026-03-28 09:07:32
特斯拉全新SUV曝光!

特斯拉全新SUV曝光!

電動知家
2026-03-28 18:35:20
現實版鋼鐵俠:烏克蘭戰斗機器人獨守陣地45天,斃敵43人

現實版鋼鐵俠:烏克蘭戰斗機器人獨守陣地45天,斃敵43人

史政先鋒
2026-03-28 15:09:53
馬斯克賭對了?全球首個數字生命問世,人類或將脫離肉體實現永生

馬斯克賭對了?全球首個數字生命問世,人類或將脫離肉體實現永生

思思夜話
2026-03-27 13:26:40
以軍參謀長說以軍常規部隊已崩潰

以軍參謀長說以軍常規部隊已崩潰

財聯社
2026-03-28 21:44:13
太原鬧市區一高層建筑突發大火26死傷:可怕畫面曝出,目擊者發聲

太原鬧市區一高層建筑突發大火26死傷:可怕畫面曝出,目擊者發聲

博士觀察
2026-03-28 22:50:47
打!賠光1770億也要打!以色列最新民調:75%民眾要求打到底

打!賠光1770億也要打!以色列最新民調:75%民眾要求打到底

硯底沉香
2026-03-28 15:45:02
伊朗武裝部隊發言人:伊朗正在制定戰爭結束條件

伊朗武裝部隊發言人:伊朗正在制定戰爭結束條件

財聯社
2026-03-28 04:50:19
“特朗普被內塔尼亞胡坑了”,萬斯把鍋甩得這么響 | 京釀館

“特朗普被內塔尼亞胡坑了”,萬斯把鍋甩得這么響 | 京釀館

新京報評論
2026-03-28 19:40:57
崩得最徹底的專業,網友哭訴:孩子600多分進的,如今找不到工作

崩得最徹底的專業,網友哭訴:孩子600多分進的,如今找不到工作

黯泉
2026-03-28 20:41:06
“華人神探”李昌鈺辭世:去年確診腦瘤,去世前兩天剛完成新書初稿

“華人神探”李昌鈺辭世:去年確診腦瘤,去世前兩天剛完成新書初稿

大風新聞
2026-03-28 15:20:15
好友曝張雪峰遺容狀態!化了妝像歐巴,黑眼圈遮不住,薛之謙發文

好友曝張雪峰遺容狀態!化了妝像歐巴,黑眼圈遮不住,薛之謙發文

阿纂看事
2026-03-28 18:44:03
廣東:堅決擁護黨中央決定

廣東:堅決擁護黨中央決定

新京報政事兒
2026-03-27 22:17:04
老登們別再玩命運動了!日本人不跑馬拉松、少去健身房,卻活成全球最長壽

老登們別再玩命運動了!日本人不跑馬拉松、少去健身房,卻活成全球最長壽

日本物語
2026-03-27 21:09:48
2026-03-29 02:36:49
歸藏的AI工具箱 incentive-icons
歸藏的AI工具箱
關注人工智能、LLM 、 AI 圖像視頻和設計
280文章數 38關注度
往期回顧 全部

科技要聞

華為盤古大模型負責人王云鶴確認離職

頭條要聞

美媒:和歐盟"外長"發生激烈交鋒 魯比奧"顯然很惱火"

頭條要聞

美媒:和歐盟"外長"發生激烈交鋒 魯比奧"顯然很惱火"

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

陳牧馳陳冰官宣得子 曬一家三口握拳照

財經要聞

臥底"科技與狠活"培訓:化工調味劑泛濫

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態度原創

旅游
本地
藝術
公開課
軍事航空

旅游要聞

泰安市岱岳區:賞梨花 看村晚 萬畝梨園迎客來

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

藝術要聞

不可思議的芭蕾之美,竟讓人屏息凝視!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美軍中東基地損失最新披露

無障礙瀏覽 進入關懷版