337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

句子級溯源+生成式歸因,C2-Cite重塑大模型可信度

0
分享至



在人工智能快速發(fā)展的今天,大語言模型已經(jīng)深入到我們工作和生活的方方面面。然而,如何讓AI生成的內(nèi)容更加可信、可追溯,一直是學術(shù)界和工業(yè)界關(guān)注的焦點問題。想象一下,當你向ChatGPT提問時,它不僅給出答案,還能像學術(shù)論文一樣標注每句話的信息來源——這就是"溯源大語言模型"要解決的核心問題。

北郵百家AI團隊聯(lián)合小米大模型團隊提出的溯源大模型C2-Cite,首創(chuàng)上下文感知的歸因生成技術(shù),不僅能讓大模型在生成內(nèi)容時自動標注精準的信息來源,更能確保生成內(nèi)容與引用的外部知識高度語義對齊,實現(xiàn)每一處表述都有溯源依據(jù)、與參考來源深度協(xié)同,從根本上解決大模型生成內(nèi)容的可信度問題。該工作已被國際頂級會議WSDM 2026收錄。C2-Cite針對現(xiàn)有歸因模型存在的關(guān)鍵缺陷,通過引入"上下文感知"機制,讓引用標記從被動的占位符轉(zhuǎn)變?yōu)閹в猩舷挛恼Z義的特殊令牌,顯著提升了引用質(zhì)量和模型回答準確性。



  • 論文標題:

C2-Cite:Contextual-Aware Citation Generation for Attributed Large Language Models

  • 論文鏈接:

https://github.com/BAI-LAB/c2cite/blob/main/paper_wsdm_c2cite.pdf

  • 代碼倉庫:

https://github.com/BAI-LAB/c2cite

引言

在信息爆炸的時代,大語言模型雖然能夠生成流暢的文本,但"幻覺"問題(即生成虛假或不準確的內(nèi)容)始終困擾著研究者。為了增強模型輸出的可信度,研究人員提出了歸因技術(shù)——在生成內(nèi)容中添加明確的引用標記(如[1]、[2]),將每句話鏈接到具體的信息源。然而現(xiàn)有歸因模型存在顯著缺陷:

1.技術(shù)路徑存在固有局限:上下文學習歸因(P-ICL/I-ICL)依賴提示工程或迭代檢索,耗時且泛化性弱;指令微調(diào)歸因過度依賴高質(zhì)量訓(xùn)練數(shù)據(jù),缺乏對引用上下文的主動關(guān)聯(lián),大大削弱大模型的溯源能力;事后歸因(Post-Hoc)采用兩階段處理,難以精確到句子級別,缺乏內(nèi)在歸因能力。

2.引用標記淪為“通用占位符”:現(xiàn)有模型未賦予引用標記(如 [i])上下文語義,僅將其視為無意義符號,導(dǎo)致引用與所指內(nèi)容脫節(jié)、知識整合效果差;

3.引用質(zhì)量與回答準確性失衡:部分模型雖能提升引用精準度,但會破壞回答的語義連貫性和正確性;另一部分模型則因引用混亂,難以支撐回答可信度;

這些問題導(dǎo)致現(xiàn)有模型要么引用錯誤/ 虛構(gòu)、溯源失效,要么回答邏輯斷裂、準確性下滑,難以同時滿足 “引用可信” 與 “回答有效” 的核心需求。

C2-Cite溯源機制

為解決上述缺陷,北郵百家AI團隊聯(lián)合小米提出上下文感知的溯源大模型框架(C2-Cite),核心思路是通過“上下文語義融入” 讓引用標記從被動占位符轉(zhuǎn)變?yōu)閹в忻鞔_語義指向的主動知識指針,具體包含三大關(guān)鍵組件:

1.上下文感知嵌入機制(Contextual-Aware Embedding):將多令牌引用標記(如“[i]”)標準化為單一引用符號令牌(如“?>”),并通過均值池化計算對應(yīng)檢索文檔的語義嵌入,替換傳統(tǒng)無意義占位符嵌入,使引用標記攜帶所指文檔的語義信息;

2.上下文引用對齊機制Contextual Citation Alignment:引入引用路由器(二進制分類器)區(qū)分默認令牌與引用令牌,分別優(yōu)化兩類令牌的損失函數(shù)—— 默認令牌采用交叉熵損失保證回答流暢性,引用令牌通過語義相似度匹配實現(xiàn)與檢索文檔的精準對齊;

3.上下文注意力增強機制:通過距離衰減系數(shù)和注意力約束,放大后續(xù)生成令牌對先前引用令牌的關(guān)注度,維持引用與內(nèi)容的語義連貫性,避免因引用插入導(dǎo)致回答邏輯斷裂。

模型最終損失函數(shù)為默認損失、引用對齊損失、路由器損失與注意力增強損失的加權(quán)和,確保引用質(zhì)量與回答準確性的協(xié)同優(yōu)化。



實驗

研究團隊在ALCE基準測試的三個數(shù)據(jù)集(ASQA、ELI5、QAMPARI)上進行了全面評估,對比了多種主流歸因方法

3.1 主實驗結(jié)果



實驗結(jié)果令人振奮:

  • 引用質(zhì)量大幅提升:C2-Cite++在引用F1分數(shù)上平均提升5.8%
  • 回答準確性顯著增強:在回答正確性指標上平均提升17.4%
  • 泛化能力強:在不同質(zhì)量的訓(xùn)練數(shù)據(jù)(SynSciQA 系列)上均表現(xiàn)穩(wěn)定,即使使用普通訓(xùn)練數(shù)據(jù)也能超越依賴高質(zhì)量數(shù)據(jù)的傳統(tǒng)微調(diào)模型。

3.2 效率分析

在保證效果的同時,C2-Cite++還展現(xiàn)出卓越的計算效率。吞吐量(每秒處理樣本數(shù))測試顯示,相比需要多輪迭代的方法(如Blueprint),C2-Cite++實現(xiàn)了最高的處理速度,在實際應(yīng)用中具有明顯優(yōu)勢。



3.3溯源生成模型中注意力模式的轉(zhuǎn)變

注意力熱力圖可視化,直觀展示了C2-Cite的工作機制。在原生LLM中,引用符號前后的句子幾乎沒有交互;而在C2-Cite中,后續(xù)句子對前文的注意力顯著增強,形成了緊密的語義連接。這種"跨引用的語義橋梁"正是模型生成高質(zhì)量溯源內(nèi)容的關(guān)鍵。



總結(jié)

C2-Cite框架通過"上下文感知"這一核心理念,成功解決了現(xiàn)有歸因大語言模型的關(guān)鍵痛點:

  • 從符號到語義:將引用標記從被動占位符轉(zhuǎn)化為主動知識指針
  • 精準對齊:通過路由機制確保引用編號與文檔內(nèi)容的準確匹配
  • 語義連貫:利用注意力增強保持引用前后內(nèi)容的流暢性
  • 雙重優(yōu)化:同時提升引用質(zhì)量和回答準確性,而非顧此失彼

最后,僅僅優(yōu)化訓(xùn)練數(shù)據(jù)是不夠的,大模型的溯源能力需設(shè)計有效的學習機制。相比于復(fù)雜的數(shù)據(jù)合成流程,C2-Cite通過其"上下文感知"的設(shè)計思想,在內(nèi)容生成的過程依賴可靠的引用知識庫,為構(gòu)建更加可靠、透明的AI溯源系統(tǒng)提供了重要的技術(shù)路徑。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
瞞天過海40年!李嘉誠成最大贏家,日產(chǎn)百萬桶,把石油全賣給中國

瞞天過海40年!李嘉誠成最大贏家,日產(chǎn)百萬桶,把石油全賣給中國

阿鳧愛吐槽
2026-03-24 00:54:18
表面是藝人,實際上家世顯赫的4位上海明星,背景強大令人想不到

表面是藝人,實際上家世顯赫的4位上海明星,背景強大令人想不到

地理三體說
2026-03-15 18:54:53
黃河壺口瀑布:你喊“媽”可以,但說她“要錢”就不行

黃河壺口瀑布:你喊“媽”可以,但說她“要錢”就不行

難得君
2026-03-23 09:27:50
網(wǎng)壇史詩級對決:挽救8賽點,搶七11-13,衛(wèi)冕冠軍倒下

網(wǎng)壇史詩級對決:挽救8賽點,搶七11-13,衛(wèi)冕冠軍倒下

格斗社
2026-03-24 17:24:12
生育大局已定:不出意外的話,從2026年起新生人口將迎來3大變化

生育大局已定:不出意外的話,從2026年起新生人口將迎來3大變化

江江食研社
2026-03-24 03:30:08
毛主席鉛筆字揭秘!這7個字震撼人心,真相讓人淚目!

毛主席鉛筆字揭秘!這7個字震撼人心,真相讓人淚目!

書畫相約
2026-03-24 08:35:27
伊朗繼續(xù)發(fā)動打擊!“股神”再現(xiàn)?特朗普宣布“暫停攻擊”前5分鐘,有人15億美元做多美股2億美元做空原油,隨后美股大漲油價跳水

伊朗繼續(xù)發(fā)動打擊!“股神”再現(xiàn)?特朗普宣布“暫停攻擊”前5分鐘,有人15億美元做多美股2億美元做空原油,隨后美股大漲油價跳水

每日經(jīng)濟新聞
2026-03-24 14:16:08
47:37!美國投票結(jié)果出來了,特朗普大失所望!

47:37!美國投票結(jié)果出來了,特朗普大失所望!

達文西看世界
2026-03-23 12:41:44
早上一碗燕麥,全天都在和饑餓感作斗爭——哈佛研究顛覆你的認知

早上一碗燕麥,全天都在和饑餓感作斗爭——哈佛研究顛覆你的認知

富貴說
2026-03-19 13:50:28
突發(fā)公告:將正式停止服務(wù),全部下線!巔峰期曾有1億人在用

突發(fā)公告:將正式停止服務(wù),全部下線!巔峰期曾有1億人在用

Thurman在昆明
2026-03-24 06:07:08
亡人在陰間最缺什么?孟婆告誡:別只燒紙,這三樣才是真正關(guān)鍵

亡人在陰間最缺什么?孟婆告誡:別只燒紙,這三樣才是真正關(guān)鍵

千秋文化
2025-11-21 09:35:38
馬杜羅之子首度公開父親在監(jiān)獄近況:周四再出庭,鍛煉不能停

馬杜羅之子首度公開父親在監(jiān)獄近況:周四再出庭,鍛煉不能停

紅星新聞
2026-03-24 12:33:10
罰裁判、改紅牌,新賽季足協(xié)敲山震虎!泰山隊被針對的證據(jù)鏈齊了

罰裁判、改紅牌,新賽季足協(xié)敲山震虎!泰山隊被針對的證據(jù)鏈齊了

體壇小鵬
2026-03-24 09:46:42
安切洛蒂:巴西世界杯名單目前還有四到五個空缺位置

安切洛蒂:巴西世界杯名單目前還有四到五個空缺位置

懂球帝
2026-03-24 12:21:17
東航MU5735周年祭,面對詢問,民航局回復(fù):相關(guān)信息不予公開

東航MU5735周年祭,面對詢問,民航局回復(fù):相關(guān)信息不予公開

干史人
2026-02-26 11:05:04
遺憾!張雪峰心臟驟停搶救無效去世!親友證實,留下11歲女兒

遺憾!張雪峰心臟驟停搶救無效去世!親友證實,留下11歲女兒

電競瓜皮
2026-03-24 22:15:14
周恩來晚年含淚揭秘,當年若非毛主席深夜提燈來,歷史或?qū)⒏膶?>
    </a>
        <h3>
      <a href=鶴羽說個事
2026-03-18 21:47:42
浙江一女子搬家后32克重金項鏈不見,在閨蜜陪同下報警,民警偵查發(fā)現(xiàn)就是閨蜜偷的

浙江一女子搬家后32克重金項鏈不見,在閨蜜陪同下報警,民警偵查發(fā)現(xiàn)就是閨蜜偷的

大象新聞
2026-03-24 21:45:13
20歲女生長期開燈睡覺胖到200斤

20歲女生長期開燈睡覺胖到200斤

觀威海
2026-03-24 09:35:51
美媒:五角大樓考慮調(diào)3000名空降兵支援對伊朗戰(zhàn)事,或用于奪取哈爾克島;這支部隊具備在18小時內(nèi)部署至全球任何地點的能力

美媒:五角大樓考慮調(diào)3000名空降兵支援對伊朗戰(zhàn)事,或用于奪取哈爾克島;這支部隊具備在18小時內(nèi)部署至全球任何地點的能力

瀟湘晨報
2026-03-24 18:30:43
2026-03-25 00:48:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12588文章數(shù) 142592關(guān)注度
往期回顧 全部

科技要聞

年僅41歲,教育名師張雪峰猝然離世

頭條要聞

張雪峰因心源性猝死搶救無效去世 終年41歲

頭條要聞

張雪峰因心源性猝死搶救無效去世 終年41歲

體育要聞

NBA最強左手射手,是個右撇子

娛樂要聞

張雪峰經(jīng)搶救無效不幸去世 年僅41歲

財經(jīng)要聞

特朗普再TACO 可以押注伊朗局勢降級?

汽車要聞

尚界Z7雙車預(yù)售22.98萬起 問界M6預(yù)售26.98萬起

態(tài)度原創(chuàng)

本地
健康
數(shù)碼
手機
公開課

本地新聞

春日吃花第一站——云南

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

榮耀平板PC應(yīng)用新增剪映專業(yè)版App,支持大屏多軌剪輯等功能

手機要聞

OPPO A6X手機現(xiàn)身中國電信終端產(chǎn)品庫,至高8GB+256GB規(guī)格

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版