337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

北大團隊提出CPL++框架,實現視覺定位模型的自知之明和自我糾錯

0
分享至



本文是北京大學彭宇新教授團隊在視覺定位方向的最新研究成果,相關論文已被頂級國際期刊 IEEE TPAMI 接收。為視覺定位模型賦予「自知之明」能力 —— 通過自監督的關聯校正與驗證模塊,在訓練過程中動態識別、衰減并糾正錯誤的監督信號。大量實驗證明,讓模型學會「自我糾錯」,是突破弱監督視覺定位瓶頸的有效途徑。



  • 論文標題:Confidence-aware Pseudo-label Self-Correction for Weakly Supervised Visual Grounding
  • 論文鏈接:https://ieeexplore.ieee.org/document/11433810/
  • 開源代碼:https://github.com/oceanflowlab/CPL
  • 實驗室網址:http://mipl.pku.edu.cn

背景與動機

視覺定位(Visual Grounding)旨在根據自然語言查詢準確定位圖像中的目標區域。然而,全監督方法嚴重依賴密集的「圖像 - 文本 - 物體框」細粒度標注,這在處理大規模復雜場景時面臨巨大的標注成本挑戰。因此,僅利用「圖像 - 文本」進行訓練的弱監督視覺定位受到了廣泛關注。

現有弱監督方法通常將該任務視為一個目標檢索過程,依賴跨模態匹配分數或重構損失來挑選候選區域。但語言描述的高層抽象概念與圖像區域的像素級特征之間存在著巨大的「異構鴻溝」,這使得跨模態匹配往往極不可靠。模型在訓練中一旦學到了這些錯誤的「偽關聯」,就會陷入錯誤傳播和累積的死循環。此前的無監督方法嘗試用模板生成偽查詢,但生成的句子生硬且缺乏多樣性,同樣忽略了錯誤關聯對模型的嚴重影響。

針對這一難題,北京大學彭宇新教授團隊提出了置信度感知的偽標簽學習框架(CPL)及其進階版 CPL++,通過引入大模型生成多樣化描述,并結合「自監督關聯驗證」機制,讓模型在訓練過程中學會動態發現并糾正自己的錯誤,實現弱監督視覺定位性能的提升。

技術方案

本文提出的 CPL 框架不僅能過濾錯誤的區域 - 文本關聯,更能利用模型自身在訓練中不斷增強的定位能力,動態地「糾正」這些錯誤標簽。其核心亮點包含以下幾個方面:



圖 1. 置信度感知的偽標簽學習框架 CPL

1. 高質量偽查詢生成與單模態匹配

由于跨模態匹配的困難,本文轉換思路,利用單模態內的匹配構造偽標簽。如上圖所示,CPL 框架提出了三條互補的生成管線(啟發式增強 Heuristic+、以對象為中心描述 Object-Centric、以關系為中心描述 Relation-Aware),為圖像中的每個候選區域生成描述性強、真實且多樣化的偽查詢文本。隨后,模型在文本特征空間內計算真實查詢與偽查詢之間的單模態相似度,挑選最匹配的區域作為初始偽標簽,從而避開了跨模態對齊帶來的挑戰。

2. 靜態跨模態驗證模塊



雖然 CPL 取得了顯著效果,但其驗證模塊是孤立于定位模型之外的「靜態」評估,不僅無法在訓練中動態發揮作用,更缺乏對錯誤關聯的「糾正」機制。為此,研究團隊進一步擴展得到 CPL++ 框架,在以下核心方面進行了自監督升級。



圖 2. 置信度感知的偽標簽學習框架的進階版本 CPL++

3. 自監督關聯校正與動態偽標簽優化

為了糾正錯誤的「區域 - 查詢」關聯,CPL++ 進一步引入了自監督關聯校正模塊。首先,模型不僅僅依賴檢測器的置信度,而是結合了查詢文本中的類別、屬性和空間關系,構建了一個高質量的語義感知候選池。其綜合評分函數定義為:



該評估函數綜合性地結合了查詢文本和候選區域在類別、屬性、空間關系上的匹配程度,并結合檢測器的置信度,對「區域 - 查詢」偽標簽提供了全面、可靠的評估手段,用于發現可能錯誤的「區域 - 查詢」關聯,過濾得到高質量的偽查詢候選池,用于訓練模型。





4. 自監督關聯驗證





這種自監督驗證機制巧妙融合了強大的靜態預訓練模型的先驗知識與不斷動態進化的定位模型的能力,降低了誤差傳播的風險。

實驗結果

本文在弱監督視覺定位領域的五大數據集(RefCOCO、RefCOCO+、RefCOCOg、ReferItGame、Flickr30K Entities)上進行了全面評估。

CPL 基礎框架在這五個數據集的測試集上超越現有的弱監督與無監督方法。具備自糾錯能力的 CPL++ 框架在 CPL 的基礎上進一步實現了 2.78%、5.81%、1.08%、2.03% 和 2.55% 的絕對性能提升。CPL++ 框架將弱監督方法與全監督方法之間的性能差距縮小,展現了偽標簽自校正機制的巨大潛力。



表 1:RefCOCO、RefCOCO+、RefCOCOg 數據集結果



表 2:ReferItGame、Flickr30K Entities 數據集結果

為了進一步直觀展示模型生成偽標簽的實際效果,圖 3 中給出了偽標簽的可視化結果,可以看出,CPL 能夠為圖像候選區域生成描述準確、句式豐富且包含復雜交互關系的高質量偽查詢,提供了高度互補的多樣化監督信息。此外,圖 4 展示了自監督關聯校正模塊的動態糾錯全過程:從圖 4(a)中最初建立的初步偽查詢關聯,到圖 4(b)中經過單模態匹配后可能產生的偏差關聯,最終在校正模塊的干預下,圖 4(c)中模型的預測框被成功糾正并精準鎖定到了與圖 4(d)中的真實文本完全對應的正確目標區域上。這些案例證明了 CPL++ 框架在動態識別并修正錯誤監督信號方面的強大能力。



圖 3:CPL 框架偽標簽可視化



圖 4:CPL++ 框架自監督關聯校正可視化

總結

本文提出了一種弱監督視覺定位框架 CPL++ 。該框架不僅通過單模態匹配建立了更可靠的初始區域 - 文本關聯,更重要的是,它為模型賦予了「自知之明」能力 —— 通過自監督的關聯校正與驗證模塊,在訓練過程中動態識別、衰減并糾正錯誤的監督信號。大量實驗證明,讓模型學會「自我糾錯」,是突破弱監督視覺定位瓶頸的有效途徑。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
一輛20萬的新車,卡扣斷了,修不起;89元的零件 逼人換13萬電池包

一輛20萬的新車,卡扣斷了,修不起;89元的零件 逼人換13萬電池包

娛樂圈的筆娛君
2026-04-20 02:07:08
20歲女孩兩年內花上千萬元打賞主播,致父親企業瀕臨破產

20歲女孩兩年內花上千萬元打賞主播,致父親企業瀕臨破產

上游新聞
2026-04-20 18:40:11
黎姿普吉島過復活節,大方穿泳裝秀身材,54歲的少女感藏不住

黎姿普吉島過復活節,大方穿泳裝秀身材,54歲的少女感藏不住

吃青菜長高
2026-04-18 06:59:11
“最牛后媽”火了!離婚后15歲女兒不要親爸要后媽,法院判決亮了

“最牛后媽”火了!離婚后15歲女兒不要親爸要后媽,法院判決亮了

菁媽育兒
2026-04-20 14:40:08
馬德里賽簽表公布:三前賽會冠軍能擋辛納五連冠嗎?

馬德里賽簽表公布:三前賽會冠軍能擋辛納五連冠嗎?

網球之家
2026-04-20 22:23:48
官宣!成都中考2026年新政出爐 今年新增14所高中招生

官宣!成都中考2026年新政出爐 今年新增14所高中招生

封面新聞
2026-04-20 20:28:02
親戚對你提過什么過分要求  看網友評論 這真是人說出來的話嘛

親戚對你提過什么過分要求 看網友評論 這真是人說出來的話嘛

侃神評故事
2026-04-20 07:45:03
演員何潤東回應穿項羽鎧甲亮相蘇超:14年后受邀過來,內心滿是感動,等下去逛項王故里

演員何潤東回應穿項羽鎧甲亮相蘇超:14年后受邀過來,內心滿是感動,等下去逛項王故里

極目新聞
2026-04-19 10:17:37
冉瑩穎錄制《姐姐當家2》,臉癟下巴尖模樣大變,暴瘦20斤不敢認

冉瑩穎錄制《姐姐當家2》,臉癟下巴尖模樣大變,暴瘦20斤不敢認

阿庫財經
2026-04-17 23:06:04
阿森納別慌!1-2后仍領先3分,曼城后6場對4強隊,英超爭冠有變數

阿森納別慌!1-2后仍領先3分,曼城后6場對4強隊,英超爭冠有變數

體育知多少
2026-04-20 07:23:09
阿森納1-2,賽后阿爾特塔信心滿滿的表態引熱議,球迷:其實慌了

阿森納1-2,賽后阿爾特塔信心滿滿的表態引熱議,球迷:其實慌了

側身凌空斬
2026-04-20 02:32:20
老蔣得知毛岸英犧牲,半夜支開宋美齡,向兒子蔣經國吐露心聲

老蔣得知毛岸英犧牲,半夜支開宋美齡,向兒子蔣經國吐露心聲

歷史點行
2026-04-09 23:52:43
王思聰罕曬國外豪宅,可以俯瞰洛杉磯全景和海景!疑要賣房套現!

王思聰罕曬國外豪宅,可以俯瞰洛杉磯全景和海景!疑要賣房套現!

娛樂團長
2026-04-20 15:48:00
真的是原初黑洞?天文界估計要轟動了!科學家發現不得了的黑洞

真的是原初黑洞?天文界估計要轟動了!科學家發現不得了的黑洞

心中的麥田
2026-04-20 19:28:11
黎筍長子曾坦言:越南當年敢打中國有3個原因,結果發現全是錯覺

黎筍長子曾坦言:越南當年敢打中國有3個原因,結果發現全是錯覺

顧史
2026-04-18 09:17:19
快檢查自家陽臺!有人家里已大量出現,官方提醒:千萬別摸

快檢查自家陽臺!有人家里已大量出現,官方提醒:千萬別摸

環球網資訊
2026-04-18 16:23:18
長期不上班的人是什么狀態?網友:吵架抓不住重點

長期不上班的人是什么狀態?網友:吵架抓不住重點

夜深愛雜談
2026-03-24 20:29:07
若沒有此人,中國歷史或將改寫!晚年離休后享受什么待遇?

若沒有此人,中國歷史或將改寫!晚年離休后享受什么待遇?

史之銘
2026-04-19 15:49:20
澳華人美女網紅走光照瘋傳!靠成人平臺吸粉百萬,怒買數十套房,實現“經濟自由”!

澳華人美女網紅走光照瘋傳!靠成人平臺吸粉百萬,怒買數十套房,實現“經濟自由”!

澳洲紅領巾
2026-04-20 13:44:46
問界急了!小改款不到40天直接換代,M9這是被極氪9X逼瘋了嗎?

問界急了!小改款不到40天直接換代,M9這是被極氪9X逼瘋了嗎?

沙雕小琳琳
2026-04-20 14:55:57
2026-04-20 22:56:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12813文章數 142633關注度
往期回顧 全部

科技要聞

HUAWEI Pura X Max發布 售價10999元起

頭條要聞

歐洲或再迎一位親俄領導人 曾與澤連斯基發生公開沖突

頭條要聞

歐洲或再迎一位親俄領導人 曾與澤連斯基發生公開沖突

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經要聞

利潤暴跌7成,字節到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態度原創

教育
藝術
手機
本地
軍事航空

教育要聞

關注!海淀這所學校不再具備辦學資格

藝術要聞

王羲之《換鵝帖》尚在人間,驚艷無比!

手機要聞

REDMI新品發布會前瞻,手機、平板、筆記本都有

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

軍事要聞

特朗普:美艦向伊朗貨船開火炸出個洞

無障礙瀏覽 進入關懷版