網易首頁 > 網易號 > 正文申請入駐

規模化人工判斷：Dropbox 如何借助大語言模型優化 RAG 系統標注

2026-03-15 10:19:46　來源: InfoQ

北京舉報

分享至

作者 | Sergio De Simone

譯者 | 明知山

為提升 Dropbox Dash 生成回復的相關性，Dropbox 工程師開始采用大語言模型輔助人工標注，這一做法在識別用于生成回復的文檔方面發揮了關鍵作用。他們的方案也為各類基于檢索增強生成（RAG）的系統提供了極具價值的參考。

正如 Dropbox 首席工程師 Dmitriy Meyerzon 所言，文檔檢索質量是 RAG 系統的瓶頸——這類系統需要從海量文檔庫中篩選出相關內容，再將其輸入給大語言模型。

企業搜索索引中存在數百萬份文檔，超大型企業更是多達數十億份，因此 Dash 只能將檢索到的極少部分文檔傳給大語言模型。這使得搜索排序質量——以及用于訓練排序的相關性標注數據——對最終答案的效果至關重要。

這意味著搜索排序模型的質量直接影響最終生成答案的質量。Dash 采用監督學習技術訓練排序模型，會根據文檔滿足查詢需求的程度，對查詢 - 文檔對進行標注。這種方法的主要難點，在于如何生成大量高質量的相關性標注數據。

為解決純人工標注的局限（成本高、速度慢、一致性差），Dropbox 引入了一種補充方案：利用大語言模型大規模生成相關性判斷。這種方法成本更低、一致性更強，且能輕松擴展到大型文檔集。但大語言模型并非完美的評估者，因此在使用其判斷結果進行訓練前，必須先對其效果進行評估。

在實際應用中，利用大語言模型進行相關性評估需要一套自動化與人工監督相結合的標準化流程。

這種被稱為“人工校準的大語言模型標注”的方法十分簡潔：先由人工標注一小批高質量數據集，用于校準大語言模型評估器；再由大語言模型生成數十萬乃至數百萬條標注，將人工工作量放大約 100 倍。需要注意的是，大語言模型并不會取代排序系統——若在查詢時直接用其進行排序，速度過慢且會受上下文長度限制。

評估步驟包括：將大語言模型生成的相關性評分與人工判斷進行對比，測試對象為訓練集中未出現的查詢 - 文檔對子集。評估還重點關注最難修正的錯誤——即大語言模型判斷與用戶行為不一致的情況，例如用戶點擊了模型評分較低的文檔或跳過了模型評分較高的文檔，這類錯誤能提供最強的學習信號。

還有一個重要的考量：上下文往往是判斷相關性的關鍵。例如在 Dropbox 內部，“diet sprite”指的是一款內部性能工具，而非飲料。為解決這一問題，研究人員讓大語言模型進行額外檢索、獲取上下文并理解內部術語，這顯著提升了標注的準確性。

根據在 Dropbox Dash 上的實踐經驗，Meyerzon 表示，這種方法能夠讓大語言模型在大規模場景下持續放大人工判斷，成為優化 RAG 系統的有效手段。

https://www.infoq.com/news/2026/03/dropbox-scaling-human-judgement/

聲明：本文為 InfoQ 翻譯，未經許可禁止轉載。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

內存通脹“終結者”？谷歌公開最新極限壓縮算法

鈦媒體APP 2026-03-26 14:33:20
0 跟貼 0
微信聊天反復出現“對方正在輸入”，說明對方在干什么？

學申論的談妹 2026-03-26 16:15:26
64 跟貼 64

谷歌沖破內存墻！新算法內存占用暴砍83%，速度提升8倍！

智東西 2026-03-26 22:11:09
0 跟貼 0

CVPR 2026 | BiMotion：用 B 樣條曲線重新定義 3D 角色運動生成

機器之心Pro 2026-03-26 11:42:56
0 跟貼 0
Harness發威！Claude被榨干的秘訣公開了

智東西 2026-03-26 20:57:04
0 跟貼 0

52天75次發布，A司這場“產品大爆炸”太猛烈了

鈦媒體APP 2026-03-26 19:50:22
0 跟貼 0

一天蒸發6200億！谷歌算法黑科技擊潰存儲股，華爾街痛批市場“不懂技術”

每日經濟新聞 2026-03-26 19:00:13
18 跟貼 18
AI寫CUDA算子國產芯片不行？上交方法直線拉升，DeepSeek也適用

機器之心Pro 2026-03-26 15:59:24
0 跟貼 0

烏克蘭向中國泄露，俄烏戰場核心數據，俄羅斯徹底慌了

羅離生活說 2026-03-24 14:15:38
0 跟貼 0
MeshCoder：大語言模型驅動，點云到可編輯結構化物體代碼的革新

機器之心Pro 2025-11-10 15:28:58
0 跟貼 0
紐約時報：許多美國官員從未去過中國應該去中國看看

環球網資訊 2026-03-26 00:05:09
1983 跟貼 1983
萬科物業“AI智能客服”落地：大語言模型進社區 24小時響應解民憂

樂居地產 2026-03-26 00:32:03
0 跟貼 0
專業裝卸的運輸車，自帶移動的神器，壓根不需人工動手！

幽默雜貨鋪 2026-03-25 15:12:18
1 跟貼 1
烏克蘭從俄接收士兵遺體，俄烏間這驚人數據，烏是俄38倍還多

月亮姐侃生活 2026-03-26 09:01:40
1 跟貼 1
清華、西交聯合開源發布Cheers : 更簡潔、更高效統一多模態路線

機器之心Pro 2026-03-26 14:20:02
0 跟貼 0
在線等：如何優雅地分走鵝廠這600+萬？

量子位 2026-03-26 16:24:03
0 跟貼 0
國外引進的機器，比魯智深還魯智深，效率比人工高出幾十倍！

霓裳愛說生活 2026-03-24 11:22:13
0 跟貼 0
原來商場里瑞士卷，都是機器切割的，開始還以為人工操作！

歡樂二愣子俱樂部 2026-03-25 16:51:36
1 跟貼 1
去年總共賣出10萬斤田螺，總收入是70萬，拋棄成本賺30萬

鄉野東哥之鄉村丁東 2026-03-23 18:28:46
4 跟貼 4
真實體驗，15年油車用戶換電車，哪好哪差？

閆闖說車 2026-03-26 15:12:29
0 跟貼 0
美媒稱美考慮將援助烏克蘭的武器轉至中東

新華社 2026-03-26 20:05:17
1577 跟貼 1577
船過閘門船嫂熟練應對，看似平淡無奇，背后卻是百年技術的沉淀！

趣笑小行星 2026-03-26 09:41:30
1 跟貼 1
高考錄取數據為何第二年才公布？張雪峰老師欲言又止！

錦升體娛 2026-03-26 06:16:04
3 跟貼 3
黃天鵝致歉！

魯中晨報 2026-03-26 22:05:34
3 跟貼 3
中原消費金融為催收“買”借款人手機號碼三大運營商均中標或涉買賣個人信息惹爭議

信網 2026-03-26 19:12:37
402 跟貼 402
ModelY自動打方向撞護欄，業內：買特斯拉還想要數據，你做夢

三金搞笑 2026-03-26 20:09:14
1 跟貼 1
收評：滬指跌1.09% 全市場成交額不足2萬億元

證券時報 2026-03-26 15:22:10
835 跟貼 835
這位女生的投籃技術真是太厲害了

愛笑無厘頭 2026-03-26 10:28:55
8 跟貼 8
“根本不敢上路”！深圳男子買全新百萬豪車，修了15次還是壞的！很多車主受害

南方都市報 2026-03-26 09:26:45
127 跟貼 127
CarPlay 史詩級加強，痛點終于解決！

黑貓科技迷 2026-03-26 23:53:32
0 跟貼 0
上海一三甲醫院候診屏出現"照顧號"引熱議院方回應

上游新聞 2026-03-26 15:33:08
128 跟貼 128
10元/斤，最近這一口“鮮貨”正肥！杭州一攤主：一天上百斤不夠賣

環球網資訊 2026-03-25 13:22:33
432 跟貼 432
10篇深度、1個專題頁，雷科技用AI發布了全球首個蘋果50年專題

雷科技 2026-03-26 19:14:31
0 跟貼 0
千萬粉絲大V，微博賬號被禁止關注

第一財經資訊 2026-03-26 12:19:47
53 跟貼 53
五角大樓制定對伊朗“最后一擊”方案，地面部隊或將出動

桂系007 2026-03-26 23:57:15
1 跟貼 1
泰國征兵廣告用張凌赫做海報：想像“武安侯”一樣帥氣騎馬嗎？今年四月報名參軍選擇騎兵部隊

閃電新聞 2026-03-26 17:45:38
260 跟貼 260
《長征組歌》響徹“上海之春”，廖昌永石倚潔同臺放歌

澎湃新聞 2026-03-26 23:04:27
2 跟貼 2
生死12分鐘！廣東一男子踢球時心臟驟停一群醫生沖上前接力心肺復蘇救回一命

閃電新聞 2026-03-26 11:46:05
102 跟貼 102
單日耗7000萬！字節漫劇反超真人短劇

新浪財經 2026-03-27 00:41:57
0 跟貼 0
火車站“老師兒！出租車在這乘坐”標語引熱議，網友稱一看就是山東濟南，車站工作人員：在當地這是尊稱

極目新聞 2026-03-26 12:06:40
147 跟貼 147

手機 / 數碼

房產 / 家居

規模化人工判斷：Dropbox 如何借助大語言模型優化 RAG 系統標注

美團發布外賣大戰后成績單：虧損超200億

特朗普：伊朗允許10艘油輪通行霍爾木茲海峽

特朗普：伊朗允許10艘油輪通行霍爾木茲海峽

申京努力了，然而杜蘭特啊

劉曉慶妹妹發聲！稱姐姐受身邊人挑撥

油價"馴服"特朗普？一到100美元就TACO

一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

態度原創

救命，這只醬板鴨已經在我手機復仇了一萬遍

北京大興機場和青島膠東機場“撞臉”，長得像就是抄襲？

PS1大IP游戲藏私貨!成人手繪與盜版馬里奧ROM塞滿

精準研判，提質增效丨我校召開2026屆畢業生就業工作研判會

轉頭就暈的耳石癥，能開車上班嗎？