337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

規模化人工判斷:Dropbox 如何借助大語言模型優化 RAG 系統標注

0
分享至


作者 | Sergio De Simone

譯者 | 明知山

為提升 Dropbox Dash 生成回復的相關性,Dropbox 工程師開始 采用大語言模型輔助人工標注,這一做法在識別用于生成回復的文檔方面發揮了關鍵作用。他們的方案也為各類基于檢索增強生成(RAG)的系統提供了極具價值的參考。

正如 Dropbox 首席工程師 Dmitriy Meyerzon 所言,文檔檢索質量是 RAG 系統的瓶頸——這類系統需要從海量文檔庫中篩選出相關內容,再將其輸入給大語言模型。

企業搜索索引中存在數百萬份文檔,超大型企業更是多達數十億份,因此 Dash 只能將檢索到的極少部分文檔傳給大語言模型。這使得搜索排序質量——以及用于訓練排序的相關性標注數據——對最終答案的效果至關重要。

這意味著搜索排序模型的質量直接影響最終生成答案的質量。Dash 采用監督學習技術訓練排序模型,會根據文檔滿足查詢需求的程度,對查詢 - 文檔對進行標注。這種方法的主要難點,在于如何生成大量高質量的相關性標注數據。

為解決純人工標注的局限(成本高、速度慢、一致性差),Dropbox 引入了一種補充方案:利用大語言模型大規模生成相關性判斷。這種方法成本更低、一致性更強,且能輕松擴展到大型文檔集。但大語言模型并非完美的評估者,因此在使用其判斷結果進行訓練前,必須先對其效果進行評估。

在實際應用中,利用大語言模型進行相關性評估需要一套自動化與人工監督相結合的標準化流程。

這種被稱為“人工校準的大語言模型標注”的方法十分簡潔:先由人工標注一小批高質量數據集,用于校準大語言模型評估器;再由大語言模型生成數十萬乃至數百萬條標注,將人工工作量放大約 100 倍。需要注意的是,大語言模型并不會取代排序系統——若在查詢時直接用其進行排序,速度過慢且會受上下文長度限制。

評估步驟包括:將大語言模型生成的相關性評分與人工判斷進行對比,測試對象為訓練集中未出現的查詢 - 文檔對子集。評估還重點關注最難修正的錯誤——即大語言模型判斷與用戶行為不一致的情況,例如用戶點擊了模型評分較低的文檔或跳過了模型評分較高的文檔,這類錯誤能提供最強的學習信號。

還有一個重要的考量:上下文往往是判斷相關性的關鍵。例如在 Dropbox 內部,“diet sprite”指的是一款內部性能工具,而非飲料。為解決這一問題,研究人員讓大語言模型進行額外檢索、獲取上下文并理解內部術語,這顯著提升了標注的準確性。

根據在 Dropbox Dash 上的實踐經驗,Meyerzon 表示,這種方法能夠讓大語言模型在大規模場景下持續放大人工判斷,成為優化 RAG 系統的有效手段。

https://www.infoq.com/news/2026/03/dropbox-scaling-human-judgement/

聲明:本文為 InfoQ 翻譯,未經許可禁止轉載。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
80年陳云建議陳錫聯辭職,陳錫聯猛拍桌:讓我干啥,我絕無二話!

80年陳云建議陳錫聯辭職,陳錫聯猛拍桌:讓我干啥,我絕無二話!

抽象派大師
2026-03-25 12:04:28
回加拿大生活的大山,60歲須發皆白很滄桑,重慶妻子仍風韻猶存

回加拿大生活的大山,60歲須發皆白很滄桑,重慶妻子仍風韻猶存

素衣讀史
2026-03-25 21:05:22
真不能怪祖院長,就曾醫生這顏值、這才華和魅力,誰遭的住?

真不能怪祖院長,就曾醫生這顏值、這才華和魅力,誰遭的住?

吃瓜局
2025-11-11 16:23:49
場上效果很不理想,湖人鋒線大閘到了季后賽估計還是很難出場?

場上效果很不理想,湖人鋒線大閘到了季后賽估計還是很難出場?

稻谷與小麥
2026-03-27 01:18:15
“14天12板”!000908,復牌后上演“地天板”

“14天12板”!000908,復牌后上演“地天板”

大眾證券報
2026-03-26 17:58:54
馬筱梅曬汪寶滿月宴,六菜一湯很低調,張蘭未參加,小心思太明顯

馬筱梅曬汪寶滿月宴,六菜一湯很低調,張蘭未參加,小心思太明顯

阿庫財經
2026-03-27 00:01:45
15戰14勝,加時掀翻東部第一!新鷹王27+8+12證明賤賣特雷楊有理

15戰14勝,加時掀翻東部第一!新鷹王27+8+12證明賤賣特雷楊有理

鍋子籃球
2026-03-26 11:25:55
巴薩舊將:當時赫萊布知道自己要離隊,他往功能飲料里兌酒喝

巴薩舊將:當時赫萊布知道自己要離隊,他往功能飲料里兌酒喝

懂球帝
2026-03-26 06:43:09
外媒:40%的消費者希望中國品牌汽車進入美國市場

外媒:40%的消費者希望中國品牌汽車進入美國市場

環球網資訊
2026-03-24 13:45:12
伊朗再獲重大勝利!美國,又被打慘了!

伊朗再獲重大勝利!美國,又被打慘了!

大嘴說天下
2026-03-26 19:32:16
15名津巴布韋人被俄羅斯騙去烏克蘭當炮灰戰死,當局怒揭殘酷真相

15名津巴布韋人被俄羅斯騙去烏克蘭當炮灰戰死,當局怒揭殘酷真相

老馬拉車莫少裝
2026-03-27 00:00:37
伊朗抓捕14名叛國分子

伊朗抓捕14名叛國分子

財聯社
2026-03-26 20:04:13
路透社:歐盟警告越南,敢用中國5G,就讓外資撤光!

路透社:歐盟警告越南,敢用中國5G,就讓外資撤光!

泠泠說史
2026-03-26 18:06:17
白宮堅稱美伊仍在談判,威脅伊朗“切勿誤判”;伊朗外長:美國談論“談判”無異于承認“失敗”,伊朗放聲開新戰線

白宮堅稱美伊仍在談判,威脅伊朗“切勿誤判”;伊朗外長:美國談論“談判”無異于承認“失敗”,伊朗放聲開新戰線

每日經濟新聞
2026-03-26 17:08:49
菲總統候選人莫雷諾:如果當選,我會讓菲律賓成為下一個新加坡!

菲總統候選人莫雷諾:如果當選,我會讓菲律賓成為下一個新加坡!

小丸說故事
2026-03-17 14:23:29
柯文哲被判重刑,黃國昌蔣萬安回應,賴清德又盯上鄭麗文?

柯文哲被判重刑,黃國昌蔣萬安回應,賴清德又盯上鄭麗文?

DS北風
2026-03-26 17:58:06
電影《挽救計劃》高口碑熱映 以跨文明協作詮釋守望相助溫暖內核

電影《挽救計劃》高口碑熱映 以跨文明協作詮釋守望相助溫暖內核

封面新聞
2026-03-26 18:56:02
智能麻將桌殺到:傳統麻將館真的要被“取代”了?

智能麻將桌殺到:傳統麻將館真的要被“取代”了?

生活新鮮市
2026-03-20 06:28:56
原油飆漲!黃金、白銀下跌,美股突變!特朗普威脅!霍爾木茲海峽,最新消息!

原油飆漲!黃金、白銀下跌,美股突變!特朗普威脅!霍爾木茲海峽,最新消息!

證券時報e公司
2026-03-26 22:23:23
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
2026-03-27 02:16:49
InfoQ incentive-icons
InfoQ
有內容的技術社區媒體
12207文章數 51820關注度
往期回顧 全部

科技要聞

美團發布外賣大戰后成績單:虧損超200億

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發聲!稱姐姐受身邊人挑撥

財經要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

態度原創

本地
藝術
游戲
教育
健康

本地新聞

救命,這只醬板鴨已經在我手機復仇了一萬遍

藝術要聞

北京大興機場和青島膠東機場“撞臉”,長得像就是抄襲?

PS1大IP游戲藏私貨!成人手繪與盜版馬里奧ROM塞滿

教育要聞

精準研判,提質增效丨我校召開2026屆畢業生就業工作研判會

轉頭就暈的耳石癥,能開車上班嗎?

無障礙瀏覽 進入關懷版