337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

在山谷中投喂AI的人:關于中國數據標注勞動的田野思考

0
分享至



文 _ 吳桐雨(浙江大學社會學系)

公眾在談論人工智能(AI)時,最常見的焦點仍是宏大而抽象的:會不會“失控”?會不會“取代人類”?倫理準則夠不夠用?……這些問題恢宏、正確,但也很容易把人帶到遠處,遠到幾乎讓我們都可以忽略AI也需要“吃飯”,也需要“練習”,也需要被一點一點教會關于人類社會的知識、價值和規范。

可當我和華東師范大學的夏冰青老師開始做關于數據標注勞動的田野調查時,我們發現AI并不是一個未來主義的詞。它不懸在天上,而是落在地上——落在中西部的山谷里,落在“易地扶貧搬遷社區”里,落在一個個工位、鼠標、耳機、計時器和返工單上。

那里的人被媒體稱作“訓練AI的老師”。這個說法不算錯,但也過于浪漫。更準確的說法應該是:他們在做一種把世界“翻譯成機器語言”的工作——把圖像、語音、文本這些原始材料,整理、分類、標記成算法可識別的訓練材料,供模型學習、糾錯、迭代。

在一線工程師的眼里,數據標注常常只是“訓練數據的供給”;在中西部的山谷里,它卻是一種更具體的日常——給一張照片拉框,框出“人”“車”“坑洼”;給一段錄音切片,切成可對齊的詞句;給一段對話打分,告訴機器哪些是依人類社會的價值判斷能夠得高分的回答;用無數次點擊,把一個本來模糊的世界打磨得更清晰。

我們的田野就是進入AI世界中這個“隱秘的角落”,在里面一走就走了五年,越走越發現:AI背后不是一條簡單的產業鏈,而是一張繃得很緊的網——沿海大廠的模型部門、產品經理的需求表、遠程平臺的任務分發與排名、縣城邊緣機房里的質檢與返工,全都被同一根線串起來。下面,我將從三個部分展開這張網:產業如何“內陸化”,性別如何進入數據標注這份工作,以及地方政府與地方管理者如何運用本土知識輔助大廠對于標注勞動的算法控制。

產業的落地:數據標注如何被“內陸化”

在我們調查的“易地扶貧搬遷社區”里面,聚合著從周邊山上搬下來的四五個村寨。社區書記最常掛在嘴邊的一句話是“要留得住人”。這不是一句口號,而是一串現實問題:人搬下山了,地沒了,手藝不值錢,年輕人往外跑,老人、孩子留在樓里。要讓人真的在這里安頓下來,就得給他們一份能按月拿到錢的工作——不一定多,但要穩;不一定體面,但要近。

2018 年,機會終于來敲門。社區開始和一家頭部科技公司(我們用B-Tech作為其化名)談合作。幾輪談判后,B-Tech把它的第一座“數據標注基地”放進了山谷:搬遷社區給出三年免租優惠,后續再補貼;水電網維護由社區承擔;公司承諾逐步提供崗位,并按社區要求優先招“處境困難的女性”——低學歷、中年、離異者先上。如果從外面看,這就是一筆“數字經濟招商”的常規交易。但走進去就會發現,這個基地更像一個夾層:它把沿海大廠的AI生產鏈條,硬生生地楔進了內陸一座山谷的日常。

然而,這一圖景與國際上對于AI數據產業和勞動的研究發現是相悖的。國際上討論數據勞動,常見的圖景是“全球分工”:模型和工程師在全球北方,標注外包給全球南方的平臺和BPO(Business Process Outsourcing,商務流程外包);工資按“幾美分一單”或“一小時一美元多一點”結算。賬本寫得很明白:哪里便宜就往哪里去。

中國的大廠當然也懂這筆賬,但在很多關鍵項目上,它們更怕另一件事——泄密。一位工程師說得很直白:大廠不愿把關鍵數據扔到公開平臺上,因為“標什么數據”會暴露公司下一步要做什么。數據在這里不僅是訓練的燃料,更像研發路線圖。于是,把數據送到內陸,送到更加封閉的社區,就成了自然而然的選擇。

我們在近期發表的一個關于中美數據標注產業勞動的比較研究中把這種組織方式概括為inland-sourcing(內陸化/內循環回路):不是把標注外包到海外,而是把任務從北京、杭州、深圳這些一線或沿海城市總部,送到山西、陜西、甘肅、新疆、貴州、重慶、河南等內陸省份的大廠自建和深度控制的標注基地(data labeling base)。[1]

具體來講,這種獨特的自建基地背后有幾股動力疊加在一起。第一重動力是數據的敏感性。就如上文提到的工程師所言:數據本身就是競爭優勢,而“標什么數據”會泄露一家公司下一步要做什么。第二重動力來自地方政府對AI經濟的參與:對很多內陸三、四線城市來說,參與模型研發像天方夜譚:算力、人才、資本,哪一樣都不是說有就有的。但“數據產業”不一樣:它勞動密集,門檻相對低,能迅速吸納一批人。更重要的是,它可以被寫進一張張漂亮的匯報表:數字經濟就業、AI相關崗位、產業落地、搬遷社區穩定……第三重動力來自企業管理邏輯。標注是高頻、瑣碎、對質量極其敏感的工作,完全依賴高流動的眾包,會把企業拖進無休止的培訓與返工:工人剛熟悉規則就離職,新人進來又要從頭教;標注質量忽高忽低,返工率上升,項目進度被拖慢。所以許多大廠最終選擇“落地”基地:把勞動固定在一個空間里,把經驗沉淀在一群人身上,讓準確率、保密性與返工率可控。

于是你會看到一種非常中國式的合作形態,正如我們的田野工作反映的那樣:數據標注基地的法人是社區書記,書記從社區里挑出一個“讀書讀得最好的年輕人”來當基地經理;工人則來自社區的勞動力池。這套結構把企業最頭疼的兩件事也一并解決了:穩定與低成本。穩定來自社區與親緣網絡的“黏性”;低成本來自地方財政承擔的一部分基礎設施與運營費用。但別誤會,這份穩定并不溫柔,它更像一種工業化的耐心:讓人留得住、學得會、跑不掉,從而把數據做得更準。有人甚至告訴我們,自建基地的數據準確率能做到 97%~98%,明顯高于多數外包平臺或第三方工廠。

性別進入工位:從“幽靈工作”到“巾幗車間”

歐美學者關于數據勞動的研究[2]很容易讓人形成一種“幽靈工”想象:勞動者分散在世界各地,在云端接單、提交、消失;平臺只看得見ID、評分、完成率,人本身是隱形的。也正因這種不可見性,女性更容易被吸引進去:平臺的“靈活”像一張網,剛好兜住照護、家務、零碎時間,勞動被包裝成“補貼性收入”。


投喂AI

[英] 詹姆斯·馬爾登,等

中信出版集團2025

然而,我們進行田野調查的自建基地看起來很不一樣:雖然大部分也是女性工人(因為這個社區中的男性大多外出務工了),但是女性不是在家里接單,而是進基地打卡,坐在統一的機房里。然而,她們仍然呈現出一種與“幽靈工”相似的結構性處境:工作被安排成可以隨時讓位于家庭的狀態,家庭又被安排成可以隨時壓住工作的狀態。[3]


銷聲匿跡

[美] 瑪麗·L. 格雷 [美]西達爾特·蘇里

上海人民出版社2020

你在基地里待久了,就會發現這些女性工作和生活的邊界是如此模糊。很多“媽媽工”中午下班時一路小跑去買菜,回家把午飯、晚飯一起做出來,再趕回工位。到了下午四點半,她們又要從工位上撤離去接孩子:有人把孩子送回家,安排作業后,再回來補一兩個小時工;有人干脆把孩子帶回工位,一邊拉框一邊盯作業。她們的時間被切成了薄片,一片一片貼在生活的縫里。而就在她們來回奔波的時候,婆婆們往往聚在基地外的小廣場曬太陽、聊天——不慌不忙,像一座看不見的“家庭權力中心”。

也正是在這種結構里,“管理”變得很難。基地經理“黑崽”學歷高、年紀輕,按親屬輩分來算,只是“媽媽工”的“侄子輩”。他試著貼考勤表,宣布“從今天開始嚴格遵守上下班時間”,話還沒落地,就被二十多位“姑母”圍住教育:“你還沒結婚,不懂過日子的難處!”最后考勤表成了墻上一張沒人看的紙。這里的關鍵并不是“女人不守紀律”,而是紀律本身被家庭結構重新改寫:真正約束“媽媽工”的不是經理,而是婆媳關系、母職倫理以及那種無處可逃的家庭責任。

地方政府當然看見了這一點。對搬遷社區來說,“留得住人”的關鍵往往在女性:男性繼續外出務工,房子要保、老人要照顧、孩子要上學,能把這一切拴在社區里的,常常是媳婦和母親。于是政府在與B-Tech談判時堅持優先雇女性,基地后來還被授予“巾幗車間”稱號,優秀女工被推到鏡頭前講“在家門口上班”的體面。

鏡頭外,她們確實努力:主動加班、練習技巧、追求準確率和速度,不“愧對”那份“出人頭地”的榮譽。但更關鍵的是,這套“巾幗敘事”并沒有把女性從家庭里解放出來,它常常以溫柔的方式把家庭再次綁回工作制度中。比如,設置“4:30課堂”——孩子放學后可以托管到母親下班。它像一種善意的基礎設施,同時也是一種明確的暗示:你可以工作,但你要同時完成母職;你被允許進入數字經濟,但前提是你不松開照護。

在照料的道德捆綁之下,是“內疚”的政治經濟。很多“媽媽工”年輕時南下打工,錯過了孩子的成長。回到家鄉后,那種缺席感變成一種補償:寧愿犧牲休息,也要把孩子留在身邊。在我們的訪談里,“可可媽”把這件事說得很具體:她在外七年,回來后下決心“孩子必須自己帶”,女兒成績掉下來,她就去爭取早班,把時間挪出來盯教育。

這種內疚感會生成一種特殊的勞動順從:她們更愿意接受“我少賺一點也沒關系”,因為這份工作被她們定義為“離家近、能照顧人”的選擇。當基地為了“保住訂單”重新分工,把“更香的任務”流向少數高效組時,很多“媽媽工”對被分到“油水更少”的工單往往不公開爭辯,她們更容易把差異解釋為自己的選擇:我得顧孩子,所以我就不搶更難、更賺錢的任務。久而久之,“巾幗英雄”的光環就成了一種潤滑劑:它讓結構性不平等更容易被吞下去,讓“你被放到次要位置”聽起來像“你高尚地選擇了家庭”。

當算法走到“最后一公里”:地方知識介入管理

在全球語境中討論AI時,人們常說,自動化最難的不是“起飛”,而是“落地”。機器可以“看見”世界,卻很難在復雜、含混、隨時變動的現實里穩定運轉——它需要有人先把世界整理一遍,把臟亂差的生活折疊成它能吞下去的格式。數據標注就是這“最后一公里”的鋪路石:把圖像里的“人”“車”“坑洼”框出來;把語音切成詞句;把文本分成“攻擊性”“中性”“誤導性”。AI在屏幕上變得聰明之前,先在這些手指的點擊里變得可計算。

但我們在田野里看到的“最后一公里”并不只有“人教機器”這一層,還有另一層更少被寫進國際議題里:算法的控制要真正生效,也要走完自己的“最后一公里”——它得進入地方、進入關系、進入具體的生活節奏。而這段路的坎坷,往往要靠地方政府、社區組織以及一系列我們稱為“算法補足組織”[4]的組織去磨平。

首先,大廠的標注工作訂單量并不穩定。訂單像潮水,有波峰,也有波谷。波谷一來,最先松動的是人心:沒活、工資不穩,就會有人走。人一走,波峰再來又得重新招、重新訓、重新磨合——質量掉、返工漲,保密風險也跟著上來。大廠想要一池“穩定”的勞動力,卻又不愿為“穩定”長期買單。

這時候地方政府出手,方式看起來很樸素:用培訓和補貼把人留在“可隨時上場”的狀態。訂單稀缺時,基地把工人送去參加就業局組織的培訓,內容其實還是標注基礎訓練;人只要簽到參訓,就能拿到每天50元的補貼。訂單驟降時,基地再去爭取與“扶貧車間”相關的各種補貼,讓符合條件的工人拿到一定比例的補貼(上限500元)。表面上,這是就業扶持;實際上,它承擔著更隱秘的功能:把離職沖動按住,把勞動力池維持在“可用”狀態——而維持成本并不完全由企業承擔。

“粉店姐姐”就是這套機制最生動的注腳。這位我們田野中的關鍵報道人不是等著工作的那種人:她有自己的小店,有客源,有一天的流水,可她仍然參加了一輪又一輪標注培訓。第一次培訓后,她開了粉店,還把培訓里認識的人變成了顧客;第二次“進階培訓”時,她甚至關店一周去上課,只為“更新技能、為將來留個機會”。這句話聽起來像個人選擇,實際上是一種特殊的、結構性的勞動組織狀態。我們在論文里把它叫作 benching(板凳隊員):培訓把人變成“半黏著”的勞動者——既不完全被雇傭,也不完全脫離基地;人生活在社區里,心卻被一條看不見的線牽在基地旁邊。對平臺/企業而言,這太好用了:培訓成本被外部化給地方資源;勞動者通過反復訓練提升熟練度,卻仍保持可替換性;更重要的是,它讓勞動供給能跟上AI開發那種忽高忽低、隨時加速又隨時剎車的節奏。

如果把這種現象放到國際學術語境里討論,它其實是一種“數字勞動再嵌入”的新版本:不是把市場重新嵌回傳統共同體,而是把平臺用工的波動嵌進地方政府的培訓指標、項目資金和社區動員能力里——用地方經濟來做平臺的減震器。

更反直覺的發現出現在管理環節。很多關于數字勞動與算法控制的研究都傾向認為:算法可以形成更精細、準確、無路可退的控制系統。因為它面對的不是活生生的人,而是工號、ID、評分、完成率,所以它的管控也更趨于“冷酷”:懲罰自動發生,分配自動完成,人似乎只能被動接受。

但我們在田野里卻反復看到另一種現實:在分工、排班、約束這些最具體的環節上,當地人依據地方性知識做出的“人工優化”,常常比平臺的算法優化更有效,也更便宜。

一位大廠負責AI數據管理的項目經理坦白說,他們確實在做“啟發式優化算法”來生成分工與管理策略,但那需要“特別多的分析工作、數據和算力”。說白了,就是“要投入特別多的錢”,甚至“幾千萬元起步”。而后來他們發現,基地經理憑經驗做的分工,“比啟發式算法準確有效得多,而且還省錢”。因為算法看見的是“ID”和“歷史表現”,而基地經理看見的是人:誰家孩子幾點放學、誰最近眼睛發炎、誰的婆婆臥床、誰能熬夜但周末必須回村里辦事。這樣的知識無法被完全量化,卻能立刻轉化為管理——不是更溫情,而是更精準。

于是,在訂單高峰期,標注基地會把工人分成不同小組:更“年富力強”、更少家庭負擔、效率更高的被分到高效組;被家庭瑣事纏身的媽媽們則更多被分到難度相對低的小組。這種分工方式看似合理,但也非常殘酷:它把生活負擔直接轉譯成生產位置,把母職與照護再次寫進工序表里。平臺很難洞察每個人真實的生產潛能,基地經理卻能用“對人”的認識來釋放效率。

地方知識不僅能幫平臺分工,還能幫平臺監督,一個很小的例子是打卡。基地嵌在生活社區里,很多工人家離基地不到一公里,打卡程序會誤判“已經到達”,工人就能在家里先線上打卡,遲到了平臺也發現不了。但經理很快發現了這一漏洞,通過調整程序的距離敏感度將其堵住。這件事很說明問題:技術大廠的算法控制原本有縫,地方知識本可以成為“縫里的空氣”,讓生活喘一口氣;但它也可能成為“縫里的釘子”,把控制釘得更緊。

結語

很多人以為AI的故事發生在云端——算力、模型、參數。可在山谷里,你會發現它更像一條貼地爬行的生產線——每一次點擊、每一次返工、每一次為了四點半接孩子沖出機房的腳步,都是它向前挪動的力量。當我們重新把目光放低,才會看清:所謂“智能”,并不只屬于機器,它也來自那些最難被看見的人。

[1] Wu T, MULDOON J, XIA B. Global Data Empires: Analysing Artificial Intelligence Data Annotation in China and the USA[J]. Big Data & Society, 2025, 12(2): 20539517251340600.

[2] 格雷, 蘇里. 銷聲匿跡[M]. 左安浦, 譯. 上海: 上海人民出版社, 2020; 馬爾登, 格雷厄姆, 坎特. 投喂AI[M]. 賈青青, 牟一凡, 譯. 北京: 中信出版集團, 2025.

[3] 吳桐雨, 夏冰青. 科技資本與地方發展的糾葛——以G省T市數據標注基地為例[J]. 二十一世紀, 2025, 2: 78-92.

[4] 吳桐雨, 夏冰青. 計算與算計:數據標注勞動中的算法補足組織[J]. 社會學評論, 2023, 11(6): 66-86; XIA B, WU T. The Space-Time Game: Workers with Disabilities in China's AI Data Labeling Industry[J]. New Media & Society, 2025: 14614448251320114.

(原載于《信睿周報》第164期,題圖來自《投喂AI》書封)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
天塌了!“林肯號”涼了,西方億萬儲量釋放,“鯊魚”嗜血而動!

天塌了!“林肯號”涼了,西方億萬儲量釋放,“鯊魚”嗜血而動!

李榮茂
2026-03-13 19:02:41
凌晨在北京去世?75歲“風流妖精”劉曉慶,給內娛明星們上了一課

凌晨在北京去世?75歲“風流妖精”劉曉慶,給內娛明星們上了一課

動物奇奇怪怪
2026-03-12 16:09:42
WTT重慶冠軍賽:3月14日賽程公布!誕生4強名單,國乒3戰日本勁敵

WTT重慶冠軍賽:3月14日賽程公布!誕生4強名單,國乒3戰日本勁敵

海闊山遙YAO
2026-03-14 11:29:36
A股致命陷阱:橫盤數月拉2個漲停就跌 主力就賺這點?真相扎心了

A股致命陷阱:橫盤數月拉2個漲停就跌 主力就賺這點?真相扎心了

一方聊市
2026-03-05 10:18:35
潘江再引眾怒!下半場用人目送遼寧逆轉,3調整成敗筆!

潘江再引眾怒!下半場用人目送遼寧逆轉,3調整成敗筆!

籃球資訊達人
2026-03-13 22:42:52
內馬爾的“最后一舞”:美加墨世界杯巴西客場球衣的時尚宣言

內馬爾的“最后一舞”:美加墨世界杯巴西客場球衣的時尚宣言

C羅帶你侃球
2026-03-13 14:15:57
她減肥成功了卻再也沒有以前火了,感覺像變了一個人!

她減肥成功了卻再也沒有以前火了,感覺像變了一個人!

阿廢冷眼觀察所
2026-03-13 18:52:18
面相真的不會騙人!全紅嬋一出場終于懂什么叫“少年氣里藏鋒芒”

面相真的不會騙人!全紅嬋一出場終于懂什么叫“少年氣里藏鋒芒”

做一個合格的吃瓜群眾
2026-03-13 12:32:39
王濛破格晉升不到24小時,令人擔心的事發生,李琰的話有人信了

王濛破格晉升不到24小時,令人擔心的事發生,李琰的話有人信了

空樽對月花獨瘦
2026-03-14 07:42:13
鄧文迪還是牛!前夫默多克95歲生日宴,她和兩個女兒精心打扮出席

鄧文迪還是牛!前夫默多克95歲生日宴,她和兩個女兒精心打扮出席

照見古今
2026-03-12 19:27:38
攤牌了!離婚5個月后,海哈金喜和李亞鵬高調認愛,比復婚更體面

攤牌了!離婚5個月后,海哈金喜和李亞鵬高調認愛,比復婚更體面

因果
2026-03-14 08:12:20
“外交男神”王毅年輕舊照,與妻子罕見同框,岳父曾是周總理秘書

“外交男神”王毅年輕舊照,與妻子罕見同框,岳父曾是周總理秘書

樂趣紀史
2026-02-04 13:45:32
中國新型武器誕生,西方各國怕了?

中國新型武器誕生,西方各國怕了?

安安說
2026-03-13 12:32:32
人還沒到北京,特朗普一道命令下來,盟友全傻眼,中國卻很淡定

人還沒到北京,特朗普一道命令下來,盟友全傻眼,中國卻很淡定

鐵錘簡科
2026-03-13 14:03:58
沖擊1000賽第10冠!薩巴倫卡橫掃14號種子,第43次躋身巡回賽決賽

沖擊1000賽第10冠!薩巴倫卡橫掃14號種子,第43次躋身巡回賽決賽

全景體育V
2026-03-14 08:44:50
59歲葉子楣自爆:曾被黑社會恐嚇要求露點,單身多年依然向往愛情

59歲葉子楣自爆:曾被黑社會恐嚇要求露點,單身多年依然向往愛情

她時尚丫
2026-03-13 21:03:06
伊朗出手!5枚導彈砸進美軍老巢:直擊駐扎美國特種部隊的"要害"

伊朗出手!5枚導彈砸進美軍老巢:直擊駐扎美國特種部隊的"要害"

滄海旅行家
2026-03-11 12:42:05
中方終于動手,大批貨輪空集裝箱離開,巴媒:中資撤離或重創經濟

中方終于動手,大批貨輪空集裝箱離開,巴媒:中資撤離或重創經濟

一簌月光
2026-03-14 10:42:06
上海男籃的傳奇球員,再度現身!

上海男籃的傳奇球員,再度現身!

新民晚報
2026-03-13 15:10:52
狂賣1.06億假“港藥”!5年暴利生意被曝光,百年老字號竟是騙局

狂賣1.06億假“港藥”!5年暴利生意被曝光,百年老字號竟是騙局

素衣讀史
2026-03-10 16:56:25
2026-03-14 12:16:49
學人Scholar incentive-icons
學人Scholar
匯聚優秀學人,致力于構建面向大眾的交流平臺
1665文章數 284關注度
往期回顧 全部

科技要聞

xAI創始伙伴只剩兩人!馬斯克“痛改前非”

頭條要聞

外甥想賣房接78歲獨居阿婆去外地養老 卻卡在一個章上

頭條要聞

外甥想賣房接78歲獨居阿婆去外地養老 卻卡在一個章上

體育要聞

NBA唯一巴西球員,增重20KG頂內線

娛樂要聞

張藝興,犯了大忌

財經要聞

3·15影子暗訪|神秘的“特供酒”

汽車要聞

吉利銀河M7技術首秀 實力重構主流電混SUV

態度原創

游戲
健康
數碼
旅游
軍事航空

誰還不想要個機械女友?全新美女影游好評如潮!

轉頭就暈的耳石癥,能開車上班嗎?

數碼要聞

AMD優化RDNA 5顯卡核心指令,部分場景性能可飆升近100%

旅游要聞

央媒關注洛陽新安:黃河岸邊春意濃 山桃花開畫中游

軍事要聞

特朗普宣布空襲伊石油出口樞紐哈爾克島

無障礙瀏覽 進入關懷版