337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

Nat Commun | 我們能精確測量“理解”嗎?基于文本嵌入的真實世界學習追蹤

0
分享至


認知神經科學前沿文獻分享


基本信息

Title:Text embedding models yield detailed conceptual knowledge maps derived from short multiple-choice quizzes

發表時間:2026-3-24

發表期刊:Nature Communications

影響因子:15.7

獲取原文:

1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



研究背景

假設一位老師能夠擁有一張完整的、可視化的“知識地圖”,上面精確標注了某個學生對所有概念的掌握程度,教育的效率將會發生怎樣的改變?


在現實中,我們評估學習效果的手段通常非常單一:給出一套測試題,計算正確率,最后得出一個分數(比如85分或B+)。然而,這種單一維度的指標犧牲了大量關鍵信息。兩個同樣考了85分的學生,可能在知識盲區上完全不同:一個是沒掌握某個核心概念,另一個則是對三個邊緣概念一知半解。傳統的實驗室記憶研究往往側重于信息的“編碼”與“提取”,難以區分機械記憶與真正的概念理解;而真實世界中的學習,其核心恰恰在于將新信息編織進已有的概念網絡中。

那么,我們能否從最常見的評估工具(如幾道簡單的選擇題)中,榨取出現實且高分辨率的認知狀態信息?

近期發表在《Nature Communications》上的一項研究提出了一種全新的計算框架。研究者借助自然語言處理(NLP)中的文本嵌入模型將真實的在線課程(可汗學院的物理講座)與隨堂測試題映射到同一個高維語義空間中。這篇工作不僅成功追蹤了學習者在觀看視頻前后的動態知識軌跡,還證明了我們完全可以通過極少量的測試,精準預測個體對特定概念的理解程度。


研究核心總結

為了在真實學習場景中驗證這一框架,研究者讓50名參與者觀看了兩段可汗學院的科普視頻(《四種基本作用力》和《恒星的誕生》),并在觀看前、兩段視頻之間以及觀看后,分別完成了包含13道選擇題的簡短測試。基于這些行為數據,研究者得出了以下核心發現。

一、文本嵌入模型能精準匹配測試題與課程的“高光時刻”

要評估學生學到了什么,首先需要量化課程本身的內容。研究者沒有依賴人工標注,而是使用主題模型(LDA)對視頻的自動生成字幕進行了分析。他們將字幕切分為重疊的滑動窗口,提取出潛在的語義主題,從而將整段視頻轉化為一條在15維“主題空間”中隨時間移動的軌跡。

更有趣的是,當研究者將測試題的文本也投入這個模型時,發現模型能夠自動識別出每道題目究竟在考察視頻哪一分哪一秒的內容。盡管題目和字幕往往使用了完全不同的詞匯和句式,但它們在深層概念空間中的坐標高度重合。這意味著,模型超越了表面的“詞匯匹配”,真正抓住了概念的語義關聯。


Fig 1. 實驗范式。參與者交替進行三次包含13道選擇題的測驗和觀看兩段可汗學院的物理講座視頻。測驗題目涵蓋了講座1、講座2以及一般物理常識。


Fig 2. 課程內容的建模過程。研究者將講座字幕分解為重疊的文本滑動窗口,利用主題模型將其轉化為高維語義空間中的軌跡,并將測試題也映射到同一共享空間中。
二、僅用少量題目即可估算“逐秒級”的動態知識軌跡

既然題目和課程時間點被映射到了同一個空間,研究者提出了一種巧妙的算法:利用參與者在某幾道題上的正確率,結合這些題目與課程各個時間點在語義空間中的距離(相關性),來反推參與者對課程每一秒內容的掌握程度。

結果顯示,這種估算極其敏銳。在觀看《四種基本作用力》之前,參與者對該視頻內容的知識估值很低;但觀看之后(測驗2和測驗3),對應內容的知識估值顯著躍升,且這種提升具有高度的內容特異性:他們只在剛剛看過的概念區域表現出知識增長。


Fig 3. 講座與測試題的主題重疊度。條形圖展示了不同主題在講座時間點和測試題中的權重變異性,證明模型在粗粒度上成功捕捉了講座與對應問題集之間的概念一致性。


Fig 4. 每道測試題捕捉了講座的哪些部分?時間序列圖顯示了具體某道題目的主題向量與視頻各個時間點主題向量的相關性,證明題目在時間線上具有高度的特異性。
三、語義空間中的知識具有“平滑性”與預測力

如果這個高維空間真的反映了人類組織知識的方式,那么它應該具備預測能力。研究者使用廣義線性混合模型(GLMM)發現,基于某幾個問題估算出的特定坐標點的“知識水平”,能夠極其可靠地預測參與者能否答對該坐標點附近的另一道陌生題目。

此外,研究者還計算了知識在語義空間中的衰減率。他們發現,如果一個學生掌握了概念A,那么他掌握概念A附近其他概念的概率會隨著語義距離的增加而平滑下降。這種“平滑性”證明了概念學習不是孤立的,理解一個概念自然會輻射到相關的概念網絡。


Fig 5. 逐秒估算學習者對講座內容的掌握程度。曲線展示了在不同測驗階段,參與者對講座每一刻所呈現內容的加權正確率估值,清晰反映了觀看視頻帶來的知識躍升。


Fig 6. 利用估算的知識預測對未知題目的解答成功率。模型結果表明,無論是在單次測驗內部,還是跨越不同講座的內容,特定坐標的知識估值都能顯著預測參與者答對該區域題目的概率。
四、繪制可視化的二維“知識與學習地圖”

為了更直觀地展示學習成果,研究者將高維的主題空間降維投影到了二維平面上,生成了可視化的“知識地圖”(反映特定時刻懂了什么)和“學習地圖”(反映兩次測驗之間學到了什么)。

在這些地圖上,未受訓前的區域是一片暗淡;而隨著視頻的播放,地圖上對應講座軌跡的特定區域被依次“點亮”。這種地圖不僅能展示群體的學習軌跡,理論上也可以為每個個體生成專屬的認知畫像,讓教育者一眼看出學生的知識盲區和優勢所在。


Fig 7. 知識在文本嵌入空間中隨距離平滑衰減。圖表顯示,以某道答對或答錯的題目為中心,隨著語義距離的增加,參與者答對周圍題目的比例逐漸趨近于其整體平均水平。


Fig 8. 知識與學習的幾何形態映射。二維地圖直觀展示了參與者在三次測驗中的知識狀態分布(A),以及相鄰兩次測驗之間知識的動態增長區域(B),星號標注了特定坐標點對應的核心詞匯云(C)。


研究意義

這項研究在理論與應用層面都提供了重要的啟發。

在理論層面,它為“概念學習”提供了一個可計算的幾何框架。研究證實了人類的真實世界知識在語義空間中是連續且平滑的:我們并非像往硬盤里存文件那樣孤立地記憶知識點,而是以概念網絡的形式進行理解。

在方法學與應用層面,這項工作展示了如何從現有的、最基礎的教育評估工具(如選擇題)中提取出高維度的認知狀態信息。它不需要復雜的腦機接口或冗長的一對一面試,僅靠自然語言處理模型和少量測試題,就能實現對學習過程的高精度追蹤。值得注意的是,研究者發現針對特定領域訓練的輕量級主題模型(如LDA),在區分具體課程概念時,反而比龐大的通用大語言模型(如BERT)表現得更精準,這為未來開發垂直領域的教育AI提供了重要參考。

當然,該研究也有其邊界。當前的文本嵌入模型主要捕捉概念間的“語義相似度”,但尚未包含更復雜的知識圖譜結構(如概念間的因果關系或先決條件依賴)。盡管如此,這種將抽象認知狀態可視化的嘗試,已經為未來的個性化自適應教育系統打開了一扇極具潛力的大門。

分享人:飯鴿兒

審核:PsyBrain 腦心前沿編輯部

你好,這里是「PsyBrain 腦心前沿

專注追蹤全球認知神經科學的最尖端突破

視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級大刊

每日速遞「深度解讀」與「前沿快訊

科研是一場探索未知的長跑,但你無需獨行。歡迎加入PsyBrain 學術社群,和一群懂你的同行,共同丈量腦與心智的無垠前沿。

點擊卡片進群,歡迎你的到來

一鍵關注,點亮星標 ? 前沿不走丟!


一鍵分享,讓更多人了解前沿

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
國乒消息:王皓或做出新決定,3人表現不合格,馬龍心疼王楚欽

國乒消息:王皓或做出新決定,3人表現不合格,馬龍心疼王楚欽

郝小小看體育
2026-04-14 00:41:18
善惡有報,移居英國僅2年,57歲吳秀波再迎噩耗,步入李易峰后塵

善惡有報,移居英國僅2年,57歲吳秀波再迎噩耗,步入李易峰后塵

有范又有料
2025-12-17 14:54:06
做好準備,終局要來了

做好準備,終局要來了

隔壁老投
2026-04-13 14:38:43
6月1日起,全國4.5億司機都要變!公安部:不卡時間,專盯狀態!

6月1日起,全國4.5億司機都要變!公安部:不卡時間,專盯狀態!

今日搞笑分享
2026-04-14 03:41:46
10萬億窟窿!比恒大更坑的民企來了,曾力壓許家印,位居第一

10萬億窟窿!比恒大更坑的民企來了,曾力壓許家印,位居第一

孤單是寂寞的毒
2026-03-04 15:38:03
你最接近生理極限的一次經歷是什么?網友分享讓人目瞪口呆!

你最接近生理極限的一次經歷是什么?網友分享讓人目瞪口呆!

夜深愛雜談
2026-04-09 19:39:13
41歲男子威脅女鄰居發生關系,事后女子為自證清白,讓他再來一次

41歲男子威脅女鄰居發生關系,事后女子為自證清白,讓他再來一次

丫頭舫
2026-04-10 21:54:02
公安局查獲特務密碼本無法破解,周總理看了一眼:這不是一首歌嗎

公安局查獲特務密碼本無法破解,周總理看了一眼:這不是一首歌嗎

云霄紀史觀
2026-04-14 02:13:04
紀委怎么鎖定貪腐?答案很樸素:從細節開始

紀委怎么鎖定貪腐?答案很樸素:從細節開始

細說職場
2026-04-12 11:07:30
非國家工作人員受賄行賄入罪門檻降低!5月1日將迎最嚴反腐新規

非國家工作人員受賄行賄入罪門檻降低!5月1日將迎最嚴反腐新規

新快報新聞
2026-04-13 20:40:09
蘋果今年秋天的牌,比我想象的還要大——iPhone18Pro爆料全解析

蘋果今年秋天的牌,比我想象的還要大——iPhone18Pro爆料全解析

明美無限
2026-04-13 17:29:38
鐵拳下的俘虜——黎巴嫩真主黨戰士生擒以色列士兵

鐵拳下的俘虜——黎巴嫩真主黨戰士生擒以色列士兵

陌上桃花開的
2026-04-11 19:41:36
兩性關系:你信與不信,女性過了60,多半都有如下六個方面的需求

兩性關系:你信與不信,女性過了60,多半都有如下六個方面的需求

娛樂洞察點點
2026-04-13 16:49:59
82!82場全勤啊!火箭探花秀史詩級進化

82!82場全勤啊!火箭探花秀史詩級進化

籃球實戰寶典
2026-04-13 15:03:36
建議中老年人,別心疼錢,常吃3種“健腿菜”,腿腳不乏,精神足

建議中老年人,別心疼錢,常吃3種“健腿菜”,腿腳不乏,精神足

秀廚娘
2026-04-13 15:38:11
老黃悶聲搞了個128GB怪物,筆記本內存天花板塌了

老黃悶聲搞了個128GB怪物,筆記本內存天花板塌了

碼上閑敘
2026-04-13 09:09:49
研究表明:性生活越頻繁,射精和勃起問題越少!

研究表明:性生活越頻繁,射精和勃起問題越少!

黯泉
2026-04-05 20:40:12
寧波奉化一汽車零配件生產廠房起火,火情已被控制,知情人稱系電焊點著了廢料

寧波奉化一汽車零配件生產廠房起火,火情已被控制,知情人稱系電焊點著了廢料

瀟湘晨報
2026-04-13 17:36:24
早上為什么不建議吃饅頭?忠告:不止饅頭,這5類食物,盡量少吃

早上為什么不建議吃饅頭?忠告:不止饅頭,這5類食物,盡量少吃

白話電影院
2026-04-05 22:37:36
Kimi大量正臉照流出!身高1米8、嘴凸不像林志穎,下半張臉像媽媽

Kimi大量正臉照流出!身高1米8、嘴凸不像林志穎,下半張臉像媽媽

傲傲講歷史
2026-04-14 01:58:50
2026-04-14 05:24:49
PsyBrain腦心前沿
PsyBrain腦心前沿
追蹤腦科學新動態,聚焦認知與神經新研究
306文章數 15關注度
往期回顧 全部

科技要聞

"抄作業"近四年,馬斯克版微信周五上線

頭條要聞

上海女子2個月內結2次婚 生下的孩子卻是第3個男人的

頭條要聞

上海女子2個月內結2次婚 生下的孩子卻是第3個男人的

體育要聞

一支球隊不夠爛,也是一種悲哀

娛樂要聞

初代“跑男團”合體,鄧超、鹿晗缺席

財經要聞

談判未完全關閉?3國力促美伊重啟談判

汽車要聞

不止命名更純粹 領克10/10+要做純電操控新王

態度原創

藝術
旅游
房產
健康
本地

藝術要聞

你絕對想不到!這位美女畫家的夏天竟如此夢幻!

旅游要聞

“一站式”賞花

房產要聞

6000億投資盛宴,全球巨頭齊聚,海南又要干件大事!

干細胞抗衰4大誤區,90%的人都中招

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

無障礙瀏覽 進入關懷版