337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

RAG神話破滅?斯坦福頂尖團隊新研究:合成數據訓練效果反超,成本大降

0
分享至


在大模型商業化落地的進程中,醫療、金融等高精尖垂直領域,始終面臨著一個核心難題:既要嚴控回答準確率、杜絕AI幻覺,又要控制部署成本,適配更多實際應用場景。長期以來,業內早已形成定論,檢索增強生成(RAG)是破解這一難題的最優方案,甚至成為行業默認的標準答案。

直到2026年3月,一支集結了全球頂尖院校力量的科研團隊,用一項重磅研究成果,徹底打破了這一固化格局。

斯坦福大學教授、NLP領域頂級學者、麥克阿瑟天才獎得主、大模型常識推理與對齊領域領軍人物Yejin Choi,聯合斯坦福大學副教授James Zou,帶領來自斯坦福大學的Seungju Han、Konwoo Kim、Suhas Kotha、麻省理工學院(MIT)的Chanwoo Park、華盛頓大學的Benjamin Newman、Jaehun Jung多位青年科研骨干,在arXiv平臺發布最新論文《Synthetic Mixed Training: Scaling Parametric Knowledge Acquisition Beyond RAG》,用嚴謹詳實的實驗數據,完成了一次對傳統技術路線的顛覆。

這支科研夢之隊,在大量對照實驗中,揭開了一個被行業長期忽視的真相:

傳統合成數據效果不及RAG,從來不是數據本身存在缺陷,而是使用方式存在誤區。

該研究通過改良訓練模式、優化數據配比,團隊成功盤活合成數據潛力,實現了對主流RAG方案的反超,為大模型垂直領域適配,開辟了一條低成本、高效率的全新路徑。


被低估的合成數據:常年淪為配角,并非能力不足

談及大模型落地垂直領域,RAG技術早已占據不可撼動的地位。通俗來講,RAG就像是為大模型配備了一座隨身外部知識庫,遇到模糊不清的問題、專業性極強的知識點,模型無需依賴自身有限的預訓練記憶,而是實時檢索外部資料,邊查證邊作答,最大限度降低幻覺出錯率,這也是它能牢牢占據金融、醫療等高精準度賽道的核心原因。

與之相對,合成數據訓練,一直被視作RAG的輔助手段。業內普遍認為,依靠合成數據微調的模型,知識儲備有限、性能提升存在天花板,即便大量堆砌數據、更換更強的生成模型,效果也始終無法趕超RAG,兩者之間仿佛存在一道難以逾越的鴻溝。

這支頂尖團隊最初也遭遇了同樣的瓶頸。在多輪測試中,單純使用合成問答對、或是僅用合成文檔訓練模型,性能提升都極為緩慢,即便加大數據投放量,效果也會快速觸頂,甚至比成熟RAG方案低4.6%。

經過反復復盤實驗,團隊終于找準了問題癥結:

單一類型的合成數據訓練,只能讓模型習得片面能力,無法實現知識與能力的融合。 合成問答對擅長訓練模型的推理邏輯、知識調用技巧,卻無法讓模型牢牢掌握專業細節; 合成文檔能填充垂直領域干貨,卻難以教會模型靈活運用知識。二者單打獨斗,自然無法突破性能上限。

針對這一核心短板,團隊徹底摒棄傳統單一訓練模式,提出兩大關鍵改良策略——合成混合訓練(SMT,Synthetic Mixed Training)聚焦重寫(Focal Rewriting),徹底釋放了合成數據的潛力。

SMT實現破局:讓AI從“開卷查資料”轉向“閉卷記知識”

如果把RAG比作開卷考試,允許隨時翻閱資料作答,那么SMT合成混合訓練,就是讓AI在訓練階段完成系統學習,把知識點內化成本身記憶,依靠自身實力應對各類問題。

SMT的核心邏輯簡潔卻直擊要害:將合成問答對與合成文檔按1:1比例混合,共同用于模型微調訓練。

兩類數據形成完美互補,問答對負責錘煉模型的推理能力、解題思路,文檔負責灌輸專業領域知識,讓AI既懂邏輯方法,又有扎實儲備,擺脫片面學習的局限。

為了進一步提升訓練效率,避免模型耗費精力在冗余、重復的無效信息上,團隊還配套推出聚焦重寫技術。這項技術相當于為AI劃定核心考點,引導生成的文檔緊扣關鍵問題展開,剔除無關內容,讓模型集中吸收高價值知識點,大幅提升學習效率。


這套組合策略,交出了亮眼的成績單。論文實驗數據顯示,在長文本理解(QuALITY)、醫療專業問答(LongHealth)、金融分析研判(FinanceBench)三大權威測試場景中,通過SMT與Focal Rewriting組合策略微調的模型,實現了對傳統RAG的超越,在QuaLITY數據集上領先幅度高達4.4%。更具實用價值的是,將SMT訓練后的模型與RAG結合使用,性能可在原有基礎上再提升9.1%,實現雙重增效。



該技術對中小參數模型格外友好,8B及以下的輕量模型,僅需少量高質量合成數據,就能達到甚至超越傳統RAG的效果,無需堆砌海量算力,不用搭建復雜的檢索系統,大幅降低了企業落地門檻,讓中小廠商也能輕松布局垂直領域AI。

不止技術逆襲:改寫大模型行業競爭邏輯

SMT的價值,遠不止實驗室里的性能突破,更攪動了整個大模型行業的發展格局,打破了行業多年來“唯參數論、唯算力論”的慣性思維。

過去幾年,大模型行業陷入粗放式內卷,各大機構盲目比拼模型參數規模、投入算力大小,誤以為硬件越強,模型性能就越優。可隨著算力投入不斷加大,邊際效益持續遞減,這種野蠻生長的模式早已走到瓶頸。

SMT用實踐證明,精細化的數據處理與科學訓練,遠比盲目擴張硬件更具價值。不必執著于超大參數模型,不必耗費巨額算力成本,只要用對合成數據、優化訓練方式,就能實現質的性能飛躍,為行業開辟了輕量化發展的新路線。


與此同時,SMT進一步豐富了大模型落地體系。它并非要取代RAG,而是與RAG形成互補。RAG更適合知識需要實時更新的場景,SMT則適配離線環境、邊緣設備等無法聯網檢索的場景,二者靈活搭配,能覆蓋更多應用需求,適配更廣泛的行業場景。

當然,這項新技術仍有完善空間。


目前SMT在70B以上超大模型上的適配效果,還需更多實驗驗證,合成數據的質量管控、多樣性把控也有待進一步優化。但實驗中呈現的穩定增長趨勢,已經充分證明,合成數據訓練擁有巨大的挖掘空間與落地潛力。

結語:大模型行業,邁入精細化發展新階段

從RAG一家獨大,到合成數據成功逆襲,這場技術路線的革新,本質上是大模型行業從野蠻擴張走向深耕細作的重要標志。

Yejin Choi團隊的這項研究,不僅推翻了“合成數據弱于RAG”的行業共識,更為行業指明了新方向:比起堆砌參數、比拼算力,打磨數據質量、優化訓練模式,才是未來競爭的核心著力點。

對于企業而言,深耕高質量合成數據、布局高效訓練方法,將成為下一階段搶占市場的核心競爭力。對于整個行業來說,多元技術路線并行融合,將推動大模型落地更靈活、成本更親民、應用更廣泛,徹底告別粗放內卷,邁向效率與質量并重的高質量發展時代。

(本文首發鈦媒體APP,作者 | 硅谷Tech-news,編輯 | 趙虹宇)

聲明:包含AI生成內容

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
一點別同情她!被教練性侵27次,卻在奧運賽場上,把隊友撞出賽道

一點別同情她!被教練性侵27次,卻在奧運賽場上,把隊友撞出賽道

來科點譜
2026-02-27 07:42:10
退休黨員注意!黨費就按這個標準,別亂交、別多交

退休黨員注意!黨費就按這個標準,別亂交、別多交

娛樂的硬糖吖
2026-03-29 18:01:00
越鬧越大!968人死亡震動全球,美國開始后撤,以色列提出新要求

越鬧越大!968人死亡震動全球,美國開始后撤,以色列提出新要求

流史歲月
2026-03-27 12:25:03
成都“牽手門”事件女主現今狀況曝光,太慘了......

成都“牽手門”事件女主現今狀況曝光,太慘了......

許三歲
2026-03-17 07:34:05
訂單已排到2030年!震驚歐美國家,中國趁此機會突圍上位

訂單已排到2030年!震驚歐美國家,中國趁此機會突圍上位

春風笑語
2026-03-28 08:28:33
教師大局已定:2026年全國教師隊伍將迎來四大新變化

教師大局已定:2026年全國教師隊伍將迎來四大新變化

戶外阿毽
2026-03-27 12:30:20
中美會談后,特朗普宣布中國將再購2000萬噸大豆

中美會談后,特朗普宣布中國將再購2000萬噸大豆

時間最美的安排
2026-03-30 03:30:08
小學生入學年齡將調整?9月1日起幼兒園入學年齡有新變化

小學生入學年齡將調整?9月1日起幼兒園入學年齡有新變化

一口娛樂
2026-03-29 04:00:36
你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

夜深愛雜談
2026-02-21 21:37:02
我正給岳母支付318000手術費,突然收到妻子發來離婚協議:離婚吧

我正給岳母支付318000手術費,突然收到妻子發來離婚協議:離婚吧

奶茶麥子
2026-03-29 10:50:42
1980年,退休后韓先楚與子女合影,韓先楚長相普通但妻子貌美如花

1980年,退休后韓先楚與子女合影,韓先楚長相普通但妻子貌美如花

TVB的四小花
2026-03-29 18:48:46
鐘楚曦馬爾代夫度假,大尺度泳衣大秀好身材,大長腿太吸睛!

鐘楚曦馬爾代夫度假,大尺度泳衣大秀好身材,大長腿太吸睛!

圓夢的小老頭
2026-03-02 22:32:57
心臟決定壽命!建議:別太節儉,多吃這3種食物,讓心臟變年輕

心臟決定壽命!建議:別太節儉,多吃這3種食物,讓心臟變年輕

阿龍美食記
2026-03-23 20:16:13
崩盤!克洛普欽點巨星徹底沉淪,已成利物浦新凱塔

崩盤!克洛普欽點巨星徹底沉淪,已成利物浦新凱塔

瀾歸序
2026-03-30 03:37:13
克雷桑聚餐遭質疑!京媒:職業球員能喝這個?澤卡、馬德魯加在列

克雷桑聚餐遭質疑!京媒:職業球員能喝這個?澤卡、馬德魯加在列

建哥說體育
2026-03-29 18:58:38
釋永信“開光”真相大白,過程不堪入目,易中天也有牽扯

釋永信“開光”真相大白,過程不堪入目,易中天也有牽扯

尋墨閣
2026-03-25 11:39:10
近兩個月跌幅最多的5只股票,有的已跌65%,還有比它們跌得慘的嗎

近兩個月跌幅最多的5只股票,有的已跌65%,還有比它們跌得慘的嗎

有范又有料
2026-03-29 14:49:06
淺色系穿搭!這個組合讓你在健身房瞬間吸引眼球!

淺色系穿搭!這個組合讓你在健身房瞬間吸引眼球!

獨角showing
2025-12-31 21:08:57
??谂加雠苣袖浿疲献恿x又美又瘦,把旁邊的白鹿襯得又矮又壯

??谂加雠苣袖浿疲献恿x又美又瘦,把旁邊的白鹿襯得又矮又壯

后世的君子
2026-03-29 19:10:16
一天被毀21臺梅卡瓦!美媒:以軍遭遇40年來最大損失,瀕臨崩潰!

一天被毀21臺梅卡瓦!美媒:以軍遭遇40年來最大損失,瀕臨崩潰!

軍機Talk
2026-03-29 14:03:41
2026-03-30 05:44:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
131496文章數 862029關注度
往期回顧 全部

科技要聞

馬斯克承認xAI"建錯了",11位創始人均離職

頭條要聞

伊朗議長:美航母遭受巨大損失 我們絕不接受屈辱

頭條要聞

伊朗議長:美航母遭受巨大損失 我們絕不接受屈辱

體育要聞

絕殺衛冕冠軍后,他單手指天把勝利獻給父親

娛樂要聞

汪峰定律再現!李榮浩喊話單依純侵權

財經要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達/華為新一代座艙

態度原創

家居
教育
游戲
時尚
健康

家居要聞

曲線華爾茲 現代簡約

教育要聞

建議給家長放春秋假,否則的話,學生放春秋假就失去意義

《超級肉肉男孩3D》發售/《海賊王》艾爾巴夫篇開播| 下周玩什么

來到1980的周也,好毛利蘭

干細胞抗衰4大誤區,90%的人都中招

無障礙瀏覽 進入關懷版