337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

大模型“想太多干太少”?國內AI團隊祭出多個技術大招,破解成本困局

0
分享至


智東西
作者 云鵬
編輯 漠影

當前,“龍蝦”火爆全球,從消費者到企業,紛紛開始“養龍蝦”,但在部分提高效率的同時,這種AI智能體所帶來的問題也同樣突出。

除了數據安全,處理復雜任務分分鐘燒掉海量Token的問題也困擾不少用戶,干活一時爽,一看賬單傻眼。


海外有用戶曝出,他只是問了一句“你好”,模型進行大量思考直接燒掉數十美元。

如果說個人場景尚且可以靈活處理,但企業級AI應用落地,則必須要面對高Token消耗帶來的成本挑戰。

OpenClaw這類Agent其實只是AI的“手腳”,背后的模型才是真正的“大腦”,要解決高消耗高成本的問題,仍然要從核心的模型入手。

當前企業在Agent模型底座的選擇上面臨著“兩難困境”,想要高智能,就必須面對成倍Token消耗,以及推理延遲的增加,而選擇低成本,則往往需要犧牲模型能力。

對企業來說,任何無效Token消耗都是真金白銀的流失,因此在當下,模型效率已經成為決定企業智能的核心要素。

近來,國內AI大模型團隊YuanLab.ai發布并開源了Yuan3.0 Ultra多模態基礎大模型,在國內外引起較高關注。


發布當天,其在GitHub上公布了完整的模型權重、代碼和技術報告:


「開源地址 」

GitHub項目:
https://github.com/Yuan-lab-LLM/Yuan3.0-Ultra
論文鏈接:
https://arxiv.org/abs/2601.14327

值得一提的是,這是當前業界僅有的三個萬億級開源多模態大模型之一,其最核心的創新之處在于通過LAEP技術——基于學習的自適應專家剪枝,在不破壞功能結構的情況下剪除冗余,實現了33%的參數減少,且訓練速度還暴漲了49%,輸出時間縮短14%的同時準確率提高16%。

可以說是真正的魚和熊掌兼得,成本和智能“既要又要”。

從檢索增強生成、多模態文檔理解、表格數據分析、內容摘要與工具調用等任務,Yuan3.0 Ultra在多個企業級AI常常面對的核心場景和難點方面表現突出。


在YuanLab.ai團隊看來,效率不是成本優化的“可選項”,而是模型能力的“組成部分”,他們的目標就是讓企業能以更少的算力開銷,產生更大的智能。

Yuan3.0 Ultra證明了旗艦級智能可以通過更高效、更經濟、更可控的方式實現,可以說給企業Agent落地提供了核心能力支撐。

一、三項關鍵技術創新背后,如何實現“有效思考”與“極致降本”?

26年初,YuanLab.ai團隊就已經發布了Yuan3.0 Flash模型,聚焦推理端效率,減少無效token消耗,通過RIRM、RAPO等核心技術創新打破了“高智能必須高Token消耗”的悖論,驗證了“更少算力,并不意味著更弱能力”。

而這次發布的Yuan 3.0 Ultra旗艦模型,進一步裁除冗余專家,讓模型結構更加精煉,通過LAEP、LFA、RIRM等技術實現了“不需要無節制堆算力就能獲得更強智能”。

整體來看,Yuan 3.0 Ultra從預訓練架構、注意力機制到推理范式,進行了全鏈路技術創新。基于“有效思考”技術體系,其實現了“有效規模”的進一步突破,可以說解決了大模型“參數虛高、算力浪費、落地困難”的痛點。

具體來看,其核心突破點之一是自適應專家裁剪算法(LAEP),簡單來說,專家不需要更多,而在于更有效。

如果把MoE架構大模型比作一個百人研發團隊,其核心優勢本該是“專業分工、高效協作”,但在真實的工程實踐中,卻出現了嚴重的“團隊管理失控”。

MoE大模型普遍存在預訓練專家負載嚴重不均衡的問題,訓練穩定階段最高與最低專家負載差異可達近500倍。

少數專家承擔了絕大多數計算任務,而大量低貢獻專家長期處于低負載狀態,造成算力資源的嚴重浪費,也導致模型參數虛高、利用效率低下,企業落地成本居高不下。


▲預訓練過程中各層專家token分布的演化趨勢(左列)及穩定階段負載分布(右列)

簡單來說:少數幾個專家干了絕大多數的活,部分專家全程“摸魚”。

行業主流MoE模型(Mixtral、DeepSeek-V3)普遍依賴輔助損失函數來約束專家利用率,“精度與均衡不可兼得”。

YuanLab.ai團隊研發了自適應專家裁剪算法(LAEP),基于MoE模型預訓練過程中自然形成的專家功能專一化規律,動態識別并剔除低貢獻冗余專家,對模型結構進行自適應裁剪與專家重排。

具體來說,就是“多勞多得”、“按勞分配”,計算資源傾斜給價值和貢獻更高的專家。

這一過程類比人類大腦學習過程中對神經連接的優化重組——保留高效信息處理通路,削弱低效連接,在維持甚至強化模型專業化能力的同時,提升算力利用效率。

從實際效果來看,預訓練初始1515B參數優化至1010B,參數規模減少33.3%;預訓練算力效率提升49%、單次推理僅激活68.8B參數;性能方面也處于頭部陣營。


▲Yuan3.0 Ultra采用LAEP+專家重排機制有效提升機制訓練效率

核心突破點之二,是語義建模能力升級,基于LFA技術強化長上下文語義關聯能力。

在企業實際應用中,模型常常需要處理圖文混排的財報、多頁技術文檔、跨文檔知識檢索等復雜任務。這類場景對長上下文語義關聯能力要求極高——模型必須能從大量信息中精準捕捉關鍵內容,忽略無關干擾。

為此,Yuan3.0 Ultra引入了局部過濾注意力機制(Localized Filtering-based Attention,LFA),實現對語義關聯的精準篩選與強化,有效過濾無效注意力干擾,提升模型對長上下文、復雜語義關系的建模能力,從而更準確地理解各種信息來源的脈絡。

從實際效果來看,面對企業級場景中長上下文的圖文混排文檔解析、跨文檔知識檢索、多步驟Agent推理等需求,模型在長文本、復雜結構信息處理中都能保持較高準確率。

核心突破點之三,是升級“有效思考”范式,利用RIRM+RAPO技術體系,減少無效Token。這也是聚焦推理階段另一核心浪費——大模型“過度反思”。

在Agent連續任務鏈中,大模型常常陷入“過度反思”——明明已經得出正確答案,卻還要反復推敲,導致Token消耗成倍增加,響應延遲拉長。這種無效反思在復雜任務中尤為突出,是企業級AI落地的一大成本黑洞。

Yuan3.0 Ultra從強化學習層面入手,通過RIRM+RAPO兩大技術創新根治這一頑疾:

反思抑制獎勵機制(RIRM)就是在萬億參數規模的大規模強化學習中,對反思次數引入精細化獎勵約束,教導模型在復雜企業級任務中,獲得可靠答案后主動停止無效反思,同時保留深度推理能力,從根本上修正“過度思考”行為。


▲采用優化后的RIRM訓練Yuan3.0 Ultra的動態過程,訓練準確率在整個訓練過程中呈現穩步上升趨勢,平均響應長度隨著訓練的進行逐漸下降

反思感知自適應策略優化算法(RAPO)則針對萬億級MoE模型強化學習訓練不穩定、效率低的行業難題,完成了算法架構的深度優化,進一步提升大規模MoE模型的訓練穩定性與訓練效率。

總體來看,LAEP決定了模型“用多少有效參數去學”、LFA決定了模型“如何精準捕捉有效信息”、RAPO保障了模型“如何穩定高效地學習”、RIRM明確了模型“推理到什么程度該停”。

YuanLab.ai團隊一系列底層模型架構創新,讓萬億級旗艦模型實現了“企業用得起、用得好、能落地”。

二、吃透企業AI應用核心場景,五項關鍵能力出眾

諸多技術創新加持下,Yuan3.0 Ultra在大部分核心企業場景中都有出色表現,用團隊的話來說,Yuan3.0 Ultra從設計階段就針對企業真實應用場景進行能力構建,是一個能夠驅動復雜智能體(Agent)的“核心引擎。

檢索增強生成(RAG)領域,Yuan3.0 Ultra在ChatRAG、DocMatix等評測中取得領先成績,可以精準定位并利用企業私域知識。

ChatRAG涵蓋長文本檢索、短文本與結構化檢索及維基百科檢索,Yuan3.0 Ultra在這項測試中的平均準確率68.2%,10項任務中9項位居首位。


在企業實際業務中,大量關鍵信息存在于技術方案、財報報告、行業研究材料等文檔中,這些內容通常包含圖文混排結構、復雜表格以及跨頁面信息關聯,是企業構建知識體系過程的難點。

多模態復雜表格理解評測MMTab覆蓋表格問答、事實核查、長文本表格處理等多個任務類型,Yuan3.0 Ultra在這一測試中以62.3%的平均準確率超越Claude Opus 4.6和Gemini 3.1 Pro。


高質量總結生成方面,企業內部知識通常分散在文檔庫、知識庫系統以及業務數據庫中,信息來源復雜且結構不統一,要在這樣的環境中獲取有效信息,不僅需要檢索能力,還需要對多源內容進行語義整合與綜合分析。

在文本摘要生成評測SummEval中,Yuan3.0 Ultra平均精度62.8%,表現出色。這一測試從詞匯重疊、語義相似度與事實一致性三個維度綜合評估摘要質量,是智能體應用中歷史信息壓縮能力的重要參考。


精通多步驟工具調用與協作,為自動化執行復雜任務打下堅實基礎,是Agent應用關鍵能力,在智能體工具調用方面,Yuan3.0 Ultra表現均衡,在工具調用評測BFCL V3中平均得分67.8%。


這一測試包含靜態函數選擇、動態實時執行、多輪上下文維護、相關性檢測與無關調用拒絕等維度評估真實工具調用能力。

最后,在企業運營場景中,大量業務決策依賴數據庫查詢、報表分析以及跨系統數據整合,在這些場景下,企業往往需要將業務問題轉化為數據庫查詢,并結合數據結果進行分析與總結。

在考察數據庫查詢語句生成能力的Text-to-SQL評測中,Yuan3.0 Ultra在Spider 1.0及BIRD評測上表現出色。

從綜合測試結果來看,Yuan3.0 Ultra是真正能打的企業大模型。

結語:提升單位算力真實智能密度,打破企業兩難困境

“龍蝦”的火爆讓我們看到了AI給個人和企業帶來的巨大價值潛力,但同樣也讓我們看到了讓AI真正能“干好活”,落地在企業場景所必然要面對的挑戰。

從Flash到Ultra,YuanLab.ai團隊一直在向著這一方向發力,直指企業核心痛點,其技術創新目標很明確:提升單位算力所產生的真實智能密度,讓大模型的能力可以真正轉化為企業可落地、可負擔、可穩定使用的業務價值。

此次Yuan3.0 Ultra推動大模型從“能力展示”走向“規模化落地”,打破了困擾行業已久的成本效率困境。這是YuanLab.ai團隊對下一代基礎大模型結構的又一次探索實踐,給業界MoE大模型結構創新、預訓練算力效率提升提供了新的路徑。

面向未來,AI必將更加深入地與企業業務相結合,在更多真實場景中落地,而底層模型技術的迭代仍將是核心驅動力,YuanLab.ai團隊不僅給技術的探索提供了新思路,也給企業提供了用好AI的更優解。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
蘇聯“人猿雜交”實驗:5名女孩與11只猩猩參與,結局如何?

蘇聯“人猿雜交”實驗:5名女孩與11只猩猩參與,結局如何?

談史論天地
2026-02-28 13:35:18
最新研究:早餐加一物,降低全身炎癥、癌癥風險!愛吃的人賺到了

最新研究:早餐加一物,降低全身炎癥、癌癥風險!愛吃的人賺到了

DrX說
2026-03-23 14:00:13
高三男孩喀納斯湖失蹤,母親守岸7天后直言放棄,意外竟在此時發生

高三男孩喀納斯湖失蹤,母親守岸7天后直言放棄,意外竟在此時發生

古怪奇談錄
2025-10-16 10:53:42
遲遲等不到中企復工,巴拿馬強援出山!已正式介入?中方要警惕

遲遲等不到中企復工,巴拿馬強援出山!已正式介入?中方要警惕

小冠說娛
2026-03-25 22:54:52
美國提出世貿組織改革方案

美國提出世貿組織改革方案

參考消息
2026-03-26 20:56:19
18年后王晶才敢說,陳冠希電腦里的秘密,不是修出來的

18年后王晶才敢說,陳冠希電腦里的秘密,不是修出來的

西樓知趣雜談
2026-02-26 22:32:58
太可恨!飛機一落地上海,女孩立馬報案!更多年輕受害人浮出水面……

太可恨!飛機一落地上海,女孩立馬報案!更多年輕受害人浮出水面……

環球網資訊
2026-03-26 21:48:04
伊朗一對“情侶”躲進谷倉中擁吻,被發現時,已經吻了2800年

伊朗一對“情侶”躲進谷倉中擁吻,被發現時,已經吻了2800年

北海史記
2026-03-26 13:31:29
美智庫:美若出兵攔中國收臺,解放軍30分鐘內能將美軍事基地夷平

美智庫:美若出兵攔中國收臺,解放軍30分鐘內能將美軍事基地夷平

南權先生
2026-03-25 15:28:41
紀實:浙江幼師幼兒園潛伏22年,警察曝光真實身份,家長很后怕

紀實:浙江幼師幼兒園潛伏22年,警察曝光真實身份,家長很后怕

談史論天地
2026-03-01 09:49:38
電影《挽救計劃》高口碑熱映 以跨文明協作詮釋守望相助溫暖內核

電影《挽救計劃》高口碑熱映 以跨文明協作詮釋守望相助溫暖內核

封面新聞
2026-03-26 18:56:02
Altman發感謝信,16000名被裁程序員集體破防

Altman發感謝信,16000名被裁程序員集體破防

Ping值焦慮
2026-03-25 17:02:40
張雪峰對蘇州的綜合貢獻曝光!5年納稅8.5億,間接經濟拉動28億

張雪峰對蘇州的綜合貢獻曝光!5年納稅8.5億,間接經濟拉動28億

談史論天地
2026-03-26 07:45:53
破防!小縣城殯儀館大屏流出,中年人扎堆離世,網友:還爭什么?

破防!小縣城殯儀館大屏流出,中年人扎堆離世,網友:還爭什么?

川渝視覺
2026-03-23 19:26:44
寶馬X3坐不住了!給出7.89萬優惠,網友:這次學聰明了

寶馬X3坐不住了!給出7.89萬優惠,網友:這次學聰明了

汽車網評
2026-03-26 21:26:34
太強了!復出首秀28+6+4,帶隊爆砍157分,禁賽越禁越強

太強了!復出首秀28+6+4,帶隊爆砍157分,禁賽越禁越強

體育新角度
2026-03-26 18:57:24
陜西男子用2條毒蛇泡酒,12年后打開本想品嘗美酒,誰知釀成慘劇

陜西男子用2條毒蛇泡酒,12年后打開本想品嘗美酒,誰知釀成慘劇

紅豆講堂
2025-03-26 10:05:43
陳慧琳”太豐滿了,穿抹胸都兜不住好身材,我感慨自律女人真美

陳慧琳”太豐滿了,穿抹胸都兜不住好身材,我感慨自律女人真美

章眽八卦
2026-03-08 15:36:53
單場定生死!世預賽歐附加賽半決賽:藍衣軍團救贖,黑馬暗掀驚濤

單場定生死!世預賽歐附加賽半決賽:藍衣軍團救贖,黑馬暗掀驚濤

側身凌空斬
2026-03-26 13:04:09
30萬!不是工資,是汪峰每個月要給的撫養費

30萬!不是工資,是汪峰每個月要給的撫養費

小光侃娛樂
2026-03-25 16:45:05
2026-03-27 02:39:01
智東西 incentive-icons
智東西
聚焦智能變革,服務產業升級。
11443文章數 117016關注度
往期回顧 全部

科技要聞

美團發布外賣大戰后成績單:虧損超200億

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發聲!稱姐姐受身邊人挑撥

財經要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

態度原創

本地
數碼
游戲
公開課
軍事航空

本地新聞

救命,這只醬板鴨已經在我手機復仇了一萬遍

數碼要聞

英特爾發Q1.26版Arc Pro專業顯卡驅動,支持B70 / B65顯卡

PS1大IP游戲藏私貨!成人手繪與盜版馬里奧ROM塞滿

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

擔心特朗普突然停戰 以總理下令48小時盡力摧毀伊設施

無障礙瀏覽 進入關懷版