![]()
2023年Q3,亞馬遜內(nèi)部測試組發(fā)現(xiàn)個詭異現(xiàn)象:用戶搜"防水藍牙音箱",前10個結(jié)果里有4個是充電寶,2個是耳機收納盒。推薦系統(tǒng)的點擊率暴跌23%,退貨率卻漲了17%。
這不是推薦算法"不懂你",是數(shù)學工具選錯了戰(zhàn)場。
向量搜索的瓶頸:當"相似"變成"近似"
傳統(tǒng)推薦系統(tǒng)把商品和用戶都變成高維向量(一種用數(shù)字列表表示特征的技術(shù)),靠計算夾角余弦找相似。這套方法在2018年前夠用,因為商品庫只有幾千萬SKU,用戶畫像也簡單。
但2020年后,電商的復(fù)雜度指數(shù)級爆炸。一件沖鋒衣同時屬于"戶外裝備""通勤穿搭""送禮清單"三個場景;一個用戶上午看露營帳篷,下午搜嬰兒推車——向量空間里的單點表示,根本抓不住這種多維交叉關(guān)系。
亞馬遜機器學習團隊負責人Alex Spiro在2023年 re:Invent 大會上打了個比方:「向量搜索像在二維地圖找餐廳,只能問"離我多近"。但用戶實際想問的是"適合約會、有露臺、人均200以內(nèi)、今晚有位"——這是四個獨立維度的同時約束。」
更麻煩的是"多模態(tài)"內(nèi)容。一張商品圖里,背景是雪山(場景)、主體是紅色(顏色)、模特穿L碼(尺碼)。向量模型把這些壓縮成一坨數(shù)字,查詢時只能整體匹配,無法單獨提取"紅色"或"L碼"做篩選。
結(jié)果?系統(tǒng)把"紅色羽絨服"和"紅色連衣裙"算成高度相似,因為它們的視覺向量確實很近。用戶罵罵咧咧關(guān)掉頁面。
張量分解:把"一團亂麻"拆成可組合的零件
張量(tensor)是向量的高維推廣。如果說向量是列表,矩陣是表格,張量就是Excel里帶多個工作簿的三維數(shù)據(jù)塊。
關(guān)鍵突破來自一種叫CP分解的數(shù)學操作:把一個龐大的多維張量,拆解成若干"因子矩陣"的乘積。每個因子對應(yīng)一個獨立維度——顏色、場景、價格帶、用戶意圖——查詢時可以自由組合。
Google Research 2022年的論文《Tensor-Train Decomposition for Large-Scale Recommendation》驗證了這條路:用張量替代向量表示用戶-商品交互,召回準確率提升34%,計算延遲反而下降18%。
亞馬遜在2023年底跟進。他們的新系統(tǒng)把商品屬性拆成12個獨立因子矩陣,用戶實時行為另建3個動態(tài)因子。查詢"防水藍牙音箱"時,系統(tǒng)不再匹配整體向量,而是分別檢索"防水等級""音頻設(shè)備""戶外場景"三個因子,再取交集。
內(nèi)部A/B測試數(shù)據(jù):搜索相關(guān)性評分從0.61拉到0.87,加購轉(zhuǎn)化率提升19%。
![]()
工程落地的暗礁:不是算不快,是拆不對
張量計算的理論優(yōu)勢很明顯,但電商場景有特殊的臟活。
第一是維度爆炸。12個因子矩陣,每個有5000個潛在特征,組合空間是5000^12——比宇宙原子數(shù)還多。必須做"稀疏化"剪枝:只保留實際出現(xiàn)過的屬性組合,把計算量壓到可控范圍。
第二是實時性矛盾。用戶滑動商品流時,行為數(shù)據(jù)每秒更新。因子矩陣如果全量重算,延遲扛不住。亞馬遜的解法是"增量更新":主干矩陣日級全量訓(xùn)練,用戶個人因子用在線梯度下降實時微調(diào)。
第三是解釋性黑洞。向量搜索至少能告訴你"這兩件商品向量夾角小",張量分解后的多因子交集,運營人員根本看不懂為什么推了這件。亞馬遜加了層"歸因翻譯":把因子權(quán)重映射回可讀的屬性標簽,輸出"推薦原因:防水場景匹配+近期瀏覽同類"。
Netflix的推薦團隊在2024年Q1技術(shù)博客中坦承,他們試過張量路線,最終退回改進版向量方案。原因很實在:「影視內(nèi)容的維度比商品少,用戶意圖也更單一(就是看片子),張量的復(fù)雜度收益覆蓋不了維護成本。」
行業(yè)擴散:從電商到工業(yè)質(zhì)檢的意外跳躍
張量計算在推薦系統(tǒng)的成功,正被復(fù)制到意想不到的領(lǐng)域。
西門子成都工廠的視覺質(zhì)檢系統(tǒng),原本用向量匹配缺陷圖片。但"劃痕"在金屬表面和塑料表面的視覺特征完全不同,向量模型經(jīng)常混淆。2024年改用張量分解后,把"缺陷類型""材質(zhì)""光照條件"拆成獨立因子,誤檢率從4.7%降到0.9%。
更前沿的是藥物分子篩選。輝瑞和MIT的合作項目用張量表示分子結(jié)構(gòu):原子類型是一維,化學鍵是另一維,三維空間坐標是第三維。傳統(tǒng)向量方法只能整體比較分子相似度,張量分解可以單獨優(yōu)化"與靶點結(jié)合能力"這一因子,把候選分子篩選效率提升40倍。
回到電商戰(zhàn)場,阿里國際站在2024年6月上線"多意圖搜索",底層同樣是張量架構(gòu)。他們的特殊挑戰(zhàn)是跨境場景:同一個英文query,美國用戶要的是"批發(fā)價",東南亞用戶要的是"免運費"——必須在因子層就把地域偏好拆開。
張量不是萬能藥。它的核心假設(shè)是"維度可分解",如果業(yè)務(wù)場景本身混沌糾纏(比如社交內(nèi)容的情緒+話題+人際關(guān)系),強行拆分反而失真。但在商品屬性清晰、用戶意圖可拆解的領(lǐng)域,這把數(shù)學手術(shù)刀正在重新劃定推薦系統(tǒng)的性能天花板。
亞馬遜搜索團隊在內(nèi)部復(fù)盤文檔里寫了一句挺實在的話:「我們花了18個月才搞明白,問題不是算法不夠聰明,是表示方法太懶了。」
當你的用戶下次搜"適合送女朋友的降噪耳機",系統(tǒng)能不能同時理解"降噪"是功能需求、"送女朋友"是場景約束、"適合"是價格暗示——這取決于你愿不愿意把一維的向量,展開成多維的張量。問題是,你的技術(shù)債允許你重構(gòu)底層嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.