337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

你點擊我不是機器人的時候,都是在幫Google免費訓練無人駕駛車

0
分享至

你大概做過無數次這件事:在登錄銀行賬戶、注冊郵箱或者提交一個表單時,屏幕上彈出一組模糊的街景照片,要求你“點擊所有包含紅綠燈的圖片”或者“選出每一個人行橫道”,反復證明自己“不是機器人”。幾秒鐘后,驗證通過,你繼續你的操作,不會再多想一秒。

但你有沒有想過,你點擊的那些紅綠燈和人行橫道的圖片,來自哪里?又去了哪里?

最近,一篇博文把這個問題再次推到了聚光燈下。用戶 @sharbel 撰寫了一篇長文,詳細梳理了 reCAPTCHA(re-Completely Automated Public Turing test to tell Computers and Humans Apart)從誕生到今天的演變,并提出了一個尖銳的論點:過去十幾年里,數以億計的互聯網用戶在不知情的情況下,免費為 Google 標注了海量圖像數據,而這些數據最終流入了 Google Maps 和 Waymo 自動駕駛系統的訓練管線。

這不是什么新近泄露的秘密。reCAPTCHA 作為數據采集工具的雙重身份,在技術圈里已經是公開的常識。Google 甚至在自己的 reCAPTCHA 開發者網站上寫得很清楚:reCAPTCHA 會“將用戶解決驗證碼所花費的時間積極用于文本數字化、圖像標注和構建機器學習數據集”。但對絕大多數普通用戶來說,他們從未讀過這行字。隨著如今 AI 數據的價值愈發重要,這個問題隨著這條博文再度進入公眾視野。

故事要從 2000 年講起。那時候的互聯網正被垃圾郵件和自動注冊機器人搞得一團糟。卡內基梅隆大學的危地馬拉裔計算機科學家 Luis von Ahn 和他的團隊提出了一種區分人類和機器的方法,后來被命名為 CAPTCHA。原理很直觀:給用戶展示一段扭曲變形的文字,人類能看懂,機器識別不了。


圖丨Luis von Ahn(來源:MIT News)

Von Ahn 很快意識到,全世界每天有幾億人在做這件事,每次花大約十秒鐘。這些認知勞動加在一起是一個驚人的數字,全部被浪費了。2007 年,他推出了 reCAPTCHA。核心改動很簡單:驗證碼里展示的不再是隨機生成的亂碼,而是兩個詞。一個是系統已知的答案,用來驗證你是不是人;另一個則來自掃描的舊書籍和報紙,是光學字符識別(OCR)軟件無法辨認的文本。你輸入答案的同時,也在幫助把這些紙質文字轉化成數字文本。

這個設計確實稱得上一石二鳥。reCAPTCHA 被部署到超過十萬個網站上,到 2011 年,它已經完成了整個 Google Books 檔案的數字化,還幫助轉錄了《紐約時報》從 1851 年至今超過 1,300 萬篇文章。Von Ahn 后來在接受 NPR 采訪時說,他把 CAPTCHA 的創意免費送了出去,而 reCAPTCHA 被 Google 在 2009 年收購,價格據他本人透露是“數千萬美元級別”。收購之后,Von Ahn 又去做了另一件事:創辦多鄰國,繼續用眾包的邏輯做語言教育。

Google 拿到 reCAPTCHA 之后,事情開始轉向。

大約在 2012 年,扭曲文字時代結束了。Google 當時面對的新挑戰是:Street View 拍攝車已經在全球幾乎每條道路上跑過了,積累了海量街景照片。但照片本身只是原始像素,要讓這些數據對導航和地圖服務有用,系統需要知道照片里有什么,哪個是門牌號,哪個是路標,哪個是店面招牌。于是 reCAPTCHA v2 出現了。用戶不再輸入文字,取而代之的是圖片網格?!包c擊所有包含交通信號燈的方塊”“選出每個人行橫道”“識別所有店面”。

這些圖片來自 Google Street View。用戶每一次點擊都在告訴 Google 的計算機視覺模型:這塊像素區域是紅綠燈,這個形狀是斑馬線。Google 以免費安全服務的名義,將這個工具嵌入了銀行、政府網站、電商平臺和幾乎所有需要登錄驗證的網頁。你別無選擇。想訪問你的賬戶?先幫我標注幾張圖片。

規模有多大?據多個來源估計,reCAPTCHA 在高峰期每天被解答約 2 億次。加州大學爾灣分校(UC Irvine)2023 年發表的一篇論文《Dazed & Confused: A Large-Scale Real-World User Study of reCAPTCHAv2》給出了更系統的計算:從部署至今的 13 年多時間里,人類總共花費了約 8.19 億小時在 reCAPTCHA 上,按工資折算至少相當于 61 億美元。

研究團隊還估算,reCAPTCHAv2 產生的追蹤 Cookie 數據,終身價值高達 8,880 億美元。論文的主要作者 Andrew Searles 在接受 The Register 采訪時直言:他認為 reCAPTCHA 的真正目的是收集用戶信息和免費勞動。


圖丨相關論文(來源:arXiv)

這些標注數據去了哪里?最顯而易見的方向是 Google Maps。它今天能自動識別路標、讀取門牌號、理解城市地理結構,背后依賴的計算機視覺能力,有一部分基礎就來自 reCAPTCHA 用戶年復一年的標注積累。

更受爭議的方向是 Waymo。Waymo 的前身是 Google 在 2009 年啟動的自動駕駛項目,2016 年獨立為 Alphabet 旗下子公司。一輛自動駕駛汽車要安全運行,必須以接近完美的準確率識別交通燈、人行橫道、行人、停車標志等成千上萬種視覺模式。

而 reCAPTCHA 要求用戶識別的,恰恰就是這些元素。有人推測 reCAPTCHA 數據被用于訓練 Waymo 的自動駕駛系統,但一位未具名的 Google 代表否認了這一點,聲稱截至 2021 年中,這些數據僅用于改進 Google Maps。UC Irvine 的研究者在論文中則認為,reCAPTCHA 提出的圖像識別任務,如辨認紅綠燈和自行車,看起來非常像是在為自動駕駛收集訓練數據。

Google 從未正式確認 reCAPTCHA 數據直接進入了 Waymo 的訓練流程。這一點需要說清楚。不過從外部來看,質疑并非沒有道理。reCAPTCHA v2 讓用戶標注的物體類別,與自動駕駛感知系統需要識別的物體類別高度重合。而 Google/Alphabet 同時擁有 reCAPTCHA 和 Waymo,內部數據管線是否有交叉使用,外界無從審計。

Waymo 如今的體量讓這個問題變得更加敏感。截至 2026 年 2 月,Waymo 已完成超過 2,000 萬次付費載客,自主駕駛里程超過 2 億英里。僅 2025 年一年,它的年度載客量就增長了兩倍,達到 1,500 萬次。

2026 年 2 月,Waymo 完成了一輪 160 億美元的融資,估值達到約 1,260 億美元,超過了大多數全球主流車企。它計劃在 2026 年進入包括倫敦和東京在內的 20 多個新城市。從一個 Google 內部的研究項目,到一家估值千億美元的獨立公司,Waymo 走了不過十多年。


圖丨 Waymo 無人駕駛出租車(來源:Waymo)

與此同時,職業數據標注是一個相當昂貴的行業。Scale AI、Appen、Labelbox 等公司雇傭了大量工人來完成圖像標注工作,每小時的報酬從幾美元到幾十美元不等。Google 通過 reCAPTCHA 做到了同樣的事,只是標注者不是被雇傭的工人,而是想登錄自己銀行賬戶的普通人。

沒有報酬,沒有合同,甚至不需要征得同意。reCAPTCHA 的服務條款當然存在,但絕大多數用戶既沒有閱讀過,也無法選擇拒絕,因為它不是 Google 的產品頁面上的可選項,而是橫亙在你和你想訪問的任何網站之間的一道必經關卡。

2018 年,Google 推出了 reCAPTCHA v3。這一版本不再給用戶展示任何驗證挑戰。它在后臺默默運行,通過監測你的鼠標軌跡、滾動模式、懸停時長和瀏覽器環境來判斷你是不是人類。

UC Irvine 的研究發現,reCAPTCHA 廣泛監控用戶的 Cookie、瀏覽歷史和瀏覽器環境信息,包括畫布渲染、屏幕分辨率、鼠標移動和用戶代理數據,所有這些都可以被用于廣告和追蹤。Google 堅稱這些數據不會被用于個性化廣告。但 2020 年,Cloudflare 出于隱私擔憂從 reCAPTCHA 切換到了競爭對手 hCaptcha,也說明業界并非所有人都對 Google 的說法買賬。

更有意思的是,UC Irvine 的研究發現,早在 2016 年就有研究者能以 70% 的準確率擊敗 reCAPTCHA v2 的圖像驗證,而 v2 的復選框驗證更是可以被 100% 破解。

換句話說,reCAPTCHA 作為安全工具的有效性在持續下降,但它作為數據采集和用戶追蹤工具的功能卻一直在運轉。研究者的結論相當犀利:reCAPTCHA 本質上是一個偽裝成安全服務的免費圖像標注勞動力來源和追蹤 Cookie 農場。

需要指出的是,這個結論不代表學術界的共識。也有人認為,reCAPTCHA 確實在防御層面提供了一定價值,至少增加了機器人的攻擊成本,不應該完全否定它的安全功能。Google 自身的立場也一直是,reCAPTCHA 首先是一個安全產品。

但爭論的核心不在于 reCAPTCHA 有沒有安全價值。核心問題是:當一個安全工具同時也是數據采集工具時,用戶是否應該被告知?是否應該有選擇權?

Luis von Ahn 最初發明 reCAPTCHA 的想法其實很漂亮:既然人們已經在做驗證了,為什么不順便把這些認知勞動用在有益的事情上?幫助數字化全世界的書籍,這是一個能讓人心生敬意的目標。但從 Google 收購 reCAPTCHA 之后的演變來看,“有益”的定義被悄悄替換了。數字化公共圖書館的藏書是公益,訓練價值千億美元的商業產品則是另一回事。

奧地利的聯邦法院已經裁定 reCAPTCHA 違反了 GDPR,因為它在未經充分知情同意的情況下向 Google 傳輸用戶數據。歐洲的監管壓力在上升,但在全球范圍內,reCAPTCHA 仍然部署在數百萬個網站上,每天默默地運行著。

運營/排版:何晨龍

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
 黃仁勛:年薪50萬的工程師沒用掉25萬美元的token,我會極度恐慌

黃仁勛:年薪50萬的工程師沒用掉25萬美元的token,我會極度恐慌

頂級大佬思維
2026-03-20 11:40:46
“三姐妹給父親上墳被炸身亡案”家屬發聲:直播時兩次遭網友死亡威脅,警方已立案偵查

“三姐妹給父親上墳被炸身亡案”家屬發聲:直播時兩次遭網友死亡威脅,警方已立案偵查

大風新聞
2026-03-20 10:37:08
男子蹭飯260頓后續:拒拿2000賠償,正臉曝光,被同學認出已社死

男子蹭飯260頓后續:拒拿2000賠償,正臉曝光,被同學認出已社死

潮鹿逐夢
2026-03-20 11:23:13
央行發聲強調堅定股市維穩,國家隊4000點下方反復吸籌拉起

央行發聲強調堅定股市維穩,國家隊4000點下方反復吸籌拉起

李志林
2026-03-20 12:36:03
中東大消息!油價跳水!

中東大消息!油價跳水!

中國基金報
2026-03-20 09:57:42
俄羅斯光刻機破冰!已搞定自研350nm光刻機

俄羅斯光刻機破冰!已搞定自研350nm光刻機

快科技
2026-03-19 17:02:05
禍不單行!拉里賈尼父子被斬首!他在美當教授的女兒被解雇

禍不單行!拉里賈尼父子被斬首!他在美當教授的女兒被解雇

大江看潮
2026-03-20 09:48:00
馬斯克預言AI競賽格局:Google贏西方,中國贏地球,SpaceX贏太空

馬斯克預言AI競賽格局:Google贏西方,中國贏地球,SpaceX贏太空

頂級大佬思維
2026-03-20 12:17:48
殲20總師被除名:任央企高管,最近露面照曝出,事發全過程被還原

殲20總師被除名:任央企高管,最近露面照曝出,事發全過程被還原

博士觀察
2026-03-20 12:20:55
炸鍋!伊朗總統被逼辭職,革命衛隊徹底奪權,以色列下了盤大棋

炸鍋!伊朗總統被逼辭職,革命衛隊徹底奪權,以色列下了盤大棋

老馬拉車莫少裝
2026-03-19 10:36:42
GOAT!奧沙利文單桿轟出153分,再創斯諾克歷史紀錄

GOAT!奧沙利文單桿轟出153分,再創斯諾克歷史紀錄

全景體育V
2026-03-20 14:43:09
中國軍方下周將與歐盟及北約會談,有何期待?外交部回應

中國軍方下周將與歐盟及北約會談,有何期待?外交部回應

澎湃新聞
2026-03-20 15:30:26
4月1日醫保全國統一落地!70—80歲老人看病,這3件事一定要記牢

4月1日醫保全國統一落地!70—80歲老人看病,這3件事一定要記牢

溫讀史
2026-03-20 05:11:34
長春7只被偷小狗結伴逃亡17公里回家,志愿者講述救援經過:柯基犬二次被關后逃跑,主人順藤摸瓜找到其他愛犬

長春7只被偷小狗結伴逃亡17公里回家,志愿者講述救援經過:柯基犬二次被關后逃跑,主人順藤摸瓜找到其他愛犬

極目新聞
2026-03-20 15:14:14
觸目驚心! 2023年山東海島驚現遍地鳥頭, 因"不值錢"被人肢解丟棄

觸目驚心! 2023年山東海島驚現遍地鳥頭, 因"不值錢"被人肢解丟棄

萬象硬核本尊
2026-03-19 20:03:19
巴鐵又輸慘了?印媒:S400首次擊落1架梟龍,原本瞄準的是殲-10CE

巴鐵又輸慘了?印媒:S400首次擊落1架梟龍,原本瞄準的是殲-10CE

書紀文譚
2026-03-19 18:12:37
高市訪美之前,美日在臺灣問題上齟齬?

高市訪美之前,美日在臺灣問題上齟齬?

新民周刊
2026-03-20 09:07:00
4億桶戰略石油儲備開始投放市場

4億桶戰略石油儲備開始投放市場

第一財經資訊
2026-03-20 11:11:44
這跟不穿有啥區別?黃多多穿三點式比基尼,卻被200斤閨蜜搶風頭

這跟不穿有啥區別?黃多多穿三點式比基尼,卻被200斤閨蜜搶風頭

涵豆說娛
2026-03-20 10:34:12
風向突變,以德為首的西方國家齊發聲:中國已在換電關鍵領域崛起

風向突變,以德為首的西方國家齊發聲:中國已在換電關鍵領域崛起

浮光驚掠影
2026-03-20 11:44:16
2026-03-20 17:12:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16449文章數 514772關注度
往期回顧 全部

科技要聞

新SU7只漲4千!雷軍:真怕交車慢挨罵

頭條要聞

企業家受邀返鄉投資被拘 取保當天將億元項目給縣政府

頭條要聞

企業家受邀返鄉投資被拘 取保當天將億元項目給縣政府

體育要聞

6年前的一場悲劇,造就了“法國瓦爾迪”

娛樂要聞

蔡康永小S“康熙合體”,兩人擁抱落淚

財經要聞

賈國龍起家的西貝首店將“關閉一半”

汽車要聞

何小鵬坦白局:每月3億的“慌”與通向L4的堅定

態度原創

藝術
本地
時尚
公開課
軍事航空

藝術要聞

吳昌碩『圓扇花卉』清新俊逸

本地新聞

春色滿城關不?。B興春日頂流,這片櫻花海藏不住了

瞿穎好有“保鮮感”一女的

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普會晤高市早苗 把美國襲擊伊朗比作偷襲珍珠港

無障礙瀏覽 進入關懷版