![]()
兄弟們,活久見了!
18號(hào)晚上你們要是網(wǎng)速夠快,應(yīng)該見證了一件載入史冊(cè)的事兒:全球斷網(wǎng)。
不是局部的,不是某個(gè)國(guó)家的,是全球大范圍一起斷的那種。
ChatGPT打不開,一直轉(zhuǎn)圈圈。推特好不容易登錄進(jìn)去,卻什么都刷不出來。國(guó)外的哥們兒正在打LOL排位賽,直接就掉線了。想要點(diǎn)個(gè)外賣,系統(tǒng)崩潰掉。Spotify想聽個(gè)歌,卻一直都在加載中。
看看自己的手機(jī),WiFi信號(hào)滿格,5G顯示正常,路由器都重啟三遍了,但就是用不了。
有人懷疑自己被封號(hào)了,有人以為手機(jī)壞了。
更離譜的是,想去Down Detector查到底哪崩了,結(jié)果它自己也崩了。
這一切都因?yàn)橐患夜镜囊粋€(gè)文件生成邏輯錯(cuò)誤引發(fā)。這家公司叫Cloudflare。
![]()
很多人可能根本就沒聽說過,簡(jiǎn)單點(diǎn)說,它就是互聯(lián)網(wǎng)的超級(jí)物業(yè)。
你訪問網(wǎng)站,從表面來看是直接連接到服務(wù)器,可實(shí)際上中間隔著Cloudflare,它負(fù)責(zé)為網(wǎng)站,加速、抵御攻擊、管理流量,在全球布設(shè)有330多個(gè)數(shù)據(jù)中心。
舉個(gè)例子:網(wǎng)購(gòu)時(shí),商家從本地倉(cāng)發(fā)貨肯定比從外地總倉(cāng)快。Cloudflare就是那個(gè)幫網(wǎng)站在全球建本地倉(cāng)的。
而且它還當(dāng)保鏢,有人想搞DDoS攻擊?攔下。有爬蟲機(jī)器人想薅數(shù)據(jù)?攔下。
Cloudflare占了全球CDN市場(chǎng)28%份額,服務(wù)數(shù)千萬網(wǎng)站。
所以你懂了吧?這就像小區(qū)物業(yè),你平時(shí)感覺不到它存在,但它一罷工,所有業(yè)主都被鎖在門外。
昨晚就是這么個(gè)情況,物業(yè)系統(tǒng)崩了,全世界都進(jìn)不了小區(qū)。
好端端的,它是怎么崩的?
![]()
Cloudflare有個(gè)Bot Management系統(tǒng),專門用來區(qū)分真人和機(jī)器人。它會(huì)給每個(gè)訪問者打個(gè)分,網(wǎng)站管理員可以根據(jù)自己的需求定規(guī)矩,比如電商的可以設(shè)個(gè)門檻:分?jǐn)?shù)不到 70 的不讓下單,這樣就能防住那些自動(dòng)搶購(gòu)機(jī)器人。
這套打分系統(tǒng)有個(gè)配置文件,里面大概有 60 個(gè)檢查項(xiàng),系統(tǒng)每過 5 分鐘就會(huì)喊一下數(shù)據(jù)庫(kù):嘿,給我發(fā)一份最新的特征清單。
原本流程很順暢,系統(tǒng)問,數(shù)據(jù)庫(kù)答,60條數(shù)據(jù),井井有條。
但11月18號(hào)上午11:05(UTC時(shí)間),工程師對(duì)數(shù)據(jù)庫(kù)做了個(gè)常規(guī)權(quán)限調(diào)整。
23分鐘后,災(zāi)難開始發(fā)酵。
因?yàn)檫@次調(diào)整,把原本的單線電話變成了全公司大喇叭。
然后,重點(diǎn)來了,前臺(tái)總管給了60條,北京分庫(kù)聽到了也給60條,上海分庫(kù)、廣州分庫(kù)紛紛響應(yīng),60條數(shù)據(jù)瞬間被復(fù)讀成幾百條。
更尷尬的是,Cloudflare在設(shè)計(jì)系統(tǒng)的時(shí)候,覺得平常一般就是60條,最多也就是100條,把上限設(shè)定為200肯定是足夠用的。
結(jié)果這幫分庫(kù)一復(fù)讀,數(shù)據(jù)量瞬間沖破200大關(guān),系統(tǒng)當(dāng)場(chǎng)宕機(jī)。
![]()
最魔幻的是,這個(gè)崩潰不是一直崩,而是仰臥起坐式的崩。
因?yàn)閿?shù)據(jù)庫(kù)是分批更新的,有些節(jié)點(diǎn)更新了,有些還是老版本。所以系統(tǒng)每5分鐘查詢一次,就相當(dāng)于開盲盒:
?運(yùn)氣好 → 碰到老版本 → 60條數(shù)據(jù) → 網(wǎng)站活了
?運(yùn)氣背 → 碰到新版本 → 幾百條數(shù)據(jù) → 網(wǎng)站又死了
我們就這樣在能用和不能用之間反復(fù)橫跳,被折磨了整整6個(gè)小時(shí)。
Cloudflare的工程師一開始也懵了,看著監(jiān)控?cái)?shù)據(jù)像心電圖一樣上下跳,第一反應(yīng)是:完了,又被DDoS攻擊了!(前段時(shí)間他們剛扛住7.3Tbps的超級(jí)攻擊)
更巧的是,他們自己的狀態(tài)頁(yè)也崩了(后來證實(shí)是巧合),工程師們一度懷疑:有人在針對(duì)性攻擊我們?
折騰了好幾個(gè)小時(shí),直到下午13:37才鎖定真兇:不是外敵,是自己人背刺。
14:24,他們緊急停止自動(dòng)生成配置文件,手動(dòng)翻出舊版本并推送至全球。
14:30,核心流量已基本恢復(fù)正常。17:06,所有服務(wù)重啟完畢,災(zāi)難正式結(jié)束。
![]()
Cloudflare官方承認(rèn)了錯(cuò)誤,承諾會(huì)加強(qiáng)檢查、審查容錯(cuò)能力。
但說實(shí)話,每次大廠宕機(jī)后都會(huì)發(fā)這種保證書。
這都已經(jīng)崩了多少次了?2024年7月CrowdStrike更新導(dǎo)致全球Windows藍(lán)屏;今年10月AWS崩了,Downdetector記錄超過1700萬份故障報(bào)告,影響60多個(gè)國(guó)家3500多家公司;現(xiàn)在輪到Cloudflare。
問題在于,我們把整個(gè)互聯(lián)網(wǎng)壓在極少數(shù)幾家公司身上。
這就像一座空中樓閣,地基只有那么幾根柱子,哪根柱子晃一晃,整座樓都得跟著顫。
當(dāng)互聯(lián)網(wǎng)變成像空氣和水一樣的必需品時(shí),我們才發(fā)現(xiàn),供水廠只有那么幾家,而且水管工偶爾還會(huì)手滑。
這,就是真實(shí)的互聯(lián)網(wǎng)。
聲明:本文內(nèi)容均經(jīng)過嚴(yán)謹(jǐn)考證,少部分素材由AI工具輔助核實(shí)。文章旨在傳遞正能量,無低俗和不良引導(dǎo)。
參考信源:Cloudflare官方博客--Cloudflare outage on November 18, 2025
騰訊網(wǎng)-Cloudflare崩了 ChatGPT、X等網(wǎng)站訪問受影響
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.