很多產品經理把精力放在功能交互、算法選型上,卻忽視了一個更底層的問題:你的產品設計,能不能產生"有價值的數據"?這才是AI產品真正的護城河。
———— / BEGIN / ————
兩款相似的AI產品,三年后命運截然不同
2020年,國內幾乎同時出現了兩款AI智能簡歷助手,我姑且稱它們為A產品和B產品。
兩款產品起點相似:都是幫求職者優化簡歷、匹配崗位的AI工具,初期用戶體量差不多,融資規模也旗鼓相當,背后的算法團隊實力相當。
三年后,A產品成為行業頭部,月活破百萬,還孵化出了招聘SaaS業務。B產品則悄悄關閉了,幾乎沒有激起任何水花。
是A產品的算法更好嗎?不是,初期兩者都用的是同類開源模型。
是A產品更會做市場推廣嗎?也不是,B產品一度比A產品更激進。
核心差異,出在產品設計的一個決策上。
A產品在設計之初就想清楚了一件事:簡歷優化工具最有價值的數據,不是”用戶投了多少份簡歷”,而是”哪些簡歷修改行為,對應了后續的面試邀請”。于是他們把產品設計成了一個閉環:用戶投遞簡歷→跟蹤后續面試結果→記錄哪些修改帶來了正向反饋→反哺推薦模型。
B產品呢?他們的數據埋點邏輯是傳統的:”用戶打開次數、使用時長、功能點擊率。”這些數據能幫他們優化交互,但無法幫模型變得更聰明。
A產品積累的是有因果關系的訓練數據,B產品積累的是沒有閉環的行為日志。三年時間,這個差距被無限放大。
這個案例讓我意識到:AI產品的競爭,在產品設計階段就已經決定了勝負。 那個決定勝負的關鍵變量,叫做——數據設計。
![]()
什么是”數據設計”?大多數PM從沒認真想過這個問題
“數據設計”不是數據分析,不是埋點方案,也不是BI報表。
它是指:在產品功能設計階段,有意識地規劃這個功能將產生什么數據、這些數據有沒有訓練價值、數據能不能形成壁壘。
打個比方。你是一名廚師,要做一道菜。數據分析是”分析這道菜好不好吃”;數據埋點是”在廚房里安裝攝像頭”;而數據設計,是”在建廚房之前,就規劃好食材從哪里來、怎么儲存、怎么加工”。
大多數PM會做前兩件事,但很少認真做第三件。
數據設計有三個核心層次,PM必須都想清楚:
第一層:數據從哪里來(數據入口設計) 你的產品功能是否會產生有意義的用戶行為信號?用戶的哪些操作,能反映他們真實的需求和判斷?
第二層:數據長什么樣(數據結構設計) 采集到的原始數據,是否具備可訓練性?它是有標簽的還是無標簽的?是稀疏的還是稠密的?
第三層:數據能去哪里(數據流向設計) 這些數據最終能不能流回模型、形成反饋?還是采集了就躺在數據庫里睡大覺?
三層都想清楚,才叫完整的數據設計。只做其中一層,是大多數PM的現狀。
![]()
三個改變產品命運的數據設計決策
數據設計不是抽象的理念,它落地在產品經理每天都要做的功能決策上。以下三個決策點,決定了你的AI產品數據壁壘的高度。
決策一:你的產品”問用戶”,還是”讓用戶做”?
這是數據設計最根本的分叉點。
“問用戶”是指:通過調研問卷、評分彈窗、滿意度打分來獲取數據。這類數據看起來很直接,但有兩個致命缺陷:第一,用戶的表達和用戶的真實行為往往是兩回事;第二,這類數據量太少,很難驅動模型迭代。
“讓用戶做”是指:把數據采集內嵌在用戶的自然操作流程中,用戶的每一次使用行為本身就是數據。
以AI代碼助手為例。GitHub Copilot的數據設計有一個極其聰明的地方:他們不只看”用戶點了接受”,還會追蹤”用戶接受了AI建議之后,在接下來5分鐘內有沒有修改它”。如果用戶接受之后馬上修改,說明這條建議質量不高;如果用戶接受之后直接提交,說明質量很好。這個行為序列給了模型非常精準的質量信號,而整個過程中用戶什么都不需要額外做。
這就是“讓用戶做”的精髓:數據采集藏在用戶價值里,用戶毫無感知,但每一次操作都是高質量標注。
決策二:你設計的是”單次反饋”,還是”序列反饋”?
很多PM在設計數據采集邏輯時,只考慮”單次”:這次交互好不好,用戶滿意不滿意。
但AI模型真正需要的,是序列信號——用戶行為的前后文關系。
舉個例子:某AI客服產品,只采集”用戶是否點擊了滿意”。這是單次反饋。
但是,一個更聰明的設計是采集這樣的序列:用戶問了問題→AI給了答案→用戶追問了(說明沒答好)→AI給了第二個答案→用戶結束對話(說明這次答好了)→整個對話鏈構成一條訓練樣本。
前者只知道”結果”,后者同時知道”哪一步出了問題”。對模型訓練來說,后者的價值是前者的數十倍。
Netflix的推薦系統是這方面的經典案例。他們發現”用戶評分”這個信號其實很臟——用戶給的評分反映的是”用戶認為應該喜歡”,而不是”用戶真正喜歡”。所以Netflix更依賴”用戶的觀看行為序列”:看到哪里暫停了、第二天又繼續看了、看到一半關掉了——這些序列信號,比評分準確得多。
單次反饋給你一個點,序列反饋給你一條路。想清楚你需要的是點還是路,決定了你能訓練出什么樣的模型。
決策三:你的數據是”可積累的”,還是”用完即棄的”?
這個決策決定了你的產品有沒有時間維度的競爭優勢。
可積累的數據,是指隨著時間推移,數據價值會持續增長的數據。典型例子:用戶的歷史行為畫像、專業領域的標注語料、用戶與產品的長期交互記錄。這類數據有”飛輪效應”——積累越多,模型越好,產品越好用,用戶越多,數據積累越快。
用完即棄的數據,是指采集完成后就失去價值的數據。典型例子:實時流量數據、單次會話日志(沒有串聯)、沒有標簽的原始點擊流。這類數據可以用來做運營監控,但無法構筑數據壁壘。
某醫療AI公司是反面案例。他們花了大量資源采集了數百萬條患者問診對話,但因為沒有設計標注體系,這些數據全是無標簽的文本,幾乎無法用于模型精調。數百萬條數據,價值幾乎為零。后來他們花了比采集更多的成本回頭補標注,白白浪費了兩年時間。
采集之前先想清楚:這條數據,三年后還有價值嗎?如果答案是“不確定”,那它大概率是用完即棄的。
![]()
當數據設計出錯:三個代價慘重的真實案例
光說正面做法不夠,再來看看數據設計失誤會有多大代價。
案例一:某智能寫作工具
因為“問錯了問題”白白浪費18個月
這個產品上線后,設計了一套”用戶評分體系”:每次AI生成內容后,彈出1-5星評分。他們用這個評分數據訓練模型整整18個月,但產品質量幾乎沒有提升。
原因很簡單:用戶給AI打分,打的是”這段內容和我期待的有多接近”,但因為用戶自己也描述不清楚期待,評分高度隨機。更糟糕的是,評分彈窗影響了用戶體驗,大量用戶開始跳過,導致數據本身也有嚴重的選擇性偏差——只有對結果特別滿意或特別不滿意的人才打分。
他們問錯了問題,采集到的是噪音,而不是信號。
后來他們改變策略,轉而追蹤”用戶對生成內容的具體修改行為”,三個月后模型質量開始顯著提升。
案例二:某AI教育平臺
把“完課率”當成核心數據,越優化越糟糕
這個平臺用AI推薦學習路徑,核心優化目標是”完課率”(用戶完成課程的比例)。聽起來很合理,但問題出現了:模型為了優化完課率,開始推薦最簡單的課程——因為簡單的課完成率高。結果是,用戶確實都完課了,但完的都是沒什么挑戰性的內容,學習效果極差,用戶很快流失。
他們采集了正確的數據,但優化了錯誤的目標。 數據設計不只是設計”采集什么”,還要設計”優化什么”——這兩個問題必須同時想清楚。
案例三:某AI助手產品
數據被競爭對手“白嫖”
這個案例很特殊,但發人深省。某AI助手因為產品開放,用戶反饋數據(包括對話日志)通過API大量流出,被競爭對手用于訓練自己的模型。等他們意識到問題時,競爭對手已經用他們的數據完成了一輪模型迭代。
數據設計還包括數據的保護設計。 你辛苦采集的高質量數據,如果沒有好的訪問控制,可能會成為競爭對手的免費訓練集。
![]()
PM的數據設計能力,如何在日常工作中培養?
說了這么多理論和案例,最后落到一個最實際的問題:作為產品經理,我該怎么做?
在每次需求評審時,加一個“數據維度”的靈魂發問。
每當你在評審一個新功能時,強制自己問三個問題:
“這個功能上線后,會產生什么數據?”
“這些數據,能不能用來訓練或優化我們的模型?”
“如果不能,我們能不能調整設計,讓它產生更有價值的數據?”
把這三個問題變成需求文檔的標配章節,剛開始可能會覺得多余,但堅持三個月,你對數據的直覺會發生質變。
學會區分“行為數據”和“偏好數據”,并優先設計前者。
行為數據是用戶”做了什么”——點擊、修改、停留、復購。偏好數據是用戶”說他們喜歡什么”——評分、問卷、標簽選擇。
絕大多數情況下,行為數據比偏好數據更可靠、更有訓練價值。在功能設計時,優先思考”如何讓用戶的自然行為成為數據”,而不是”如何讓用戶主動告訴我他們的偏好”。
第三步:
建立“數據價值地圖”,定期復盤你的產品在采集什么。
每隔三個月,畫一張表格:列出你的產品正在采集的所有數據類型,評估每一類數據的”訓練價值”(高/中/低)和”積累趨勢”(增長/平穩/衰減)。
這張表會給你很多意外發現:有些數據采集成本極高但訓練價值極低;有些數據輕易可得卻從未被利用。定期做這個復盤,是提升數據設計能力的最快路徑之一。
![]()
產品經理,是AI產品數據戰爭的第一決策人
我在做AI產品的這幾年里,見過太多團隊把精力放在錯的地方:花幾個月時間選算法框架,花大價錢買算力,花無數會議討論模型架構——卻從來沒有認真坐下來想過:我們的產品,在產生什么樣的數據?這些數據,能不能讓我們的產品越來越聰明?
算法工程師可以選擇更好的模型,數據工程師可以優化數據管道,但只有產品經理,才能在設計階段決定產品能不能采集到有價值的數據。
這是一個只有PM才能做、也只有PM必須做好的決策。
AI產品的競爭,本質上是數據的競爭。而數據的競爭,在產品經理畫第一張原型圖的時候,就已經開始了。
本文來自作者:吳知
想要第一時間了解行業動態、面試技巧、商業知識等等等?加入產品經理進化營,跟優秀的產品人一起交流成長!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.