![]()
一家估值56億美元的數(shù)據(jù)管道公司,突然把自家核心工具開源捐了。這不是棄子,是陽(yáng)謀。
Fivetran上周宣布,將SQLMesh數(shù)據(jù)轉(zhuǎn)換框架捐贈(zèng)給Linux基金會(huì)。這個(gè)決定背后藏著一條清晰的時(shí)間線:2022年收購(gòu),2023年開源,2025年徹底交權(quán)。
數(shù)據(jù)工程師對(duì)這個(gè)名字可能不陌生。SQLMesh是一套"數(shù)據(jù)轉(zhuǎn)換即代碼"(Data Transformation as Code)工具,幫企業(yè)把散落在各處的原始數(shù)據(jù)清洗成可用狀態(tài)。Fivetran三年前花重金買下它,現(xiàn)在卻說(shuō)"不要了,給社區(qū)"。
從收購(gòu)到捐贈(zèng):一場(chǎng)精心設(shè)計(jì)的交接
2022年,F(xiàn)ivetran收購(gòu)SQLMesh母公司Tobiko Data時(shí),外界普遍解讀為補(bǔ)強(qiáng)數(shù)據(jù)管道下游能力。畢竟Fivetran的核心業(yè)務(wù)是把數(shù)據(jù)從A點(diǎn)搬到B點(diǎn),SQLMesh負(fù)責(zé)的是B點(diǎn)之后的事——讓數(shù)據(jù)變得干凈、可用、可追溯。
2023年4月,F(xiàn)ivetran將SQLMesh開源,采用Apache 2.0許可證。這一步當(dāng)時(shí)被看作常規(guī)操作:用開源社區(qū)擴(kuò)大影響力,同時(shí)保留商業(yè)控制權(quán)。
但2025年3月的捐贈(zèng)動(dòng)作,徹底改變了性質(zhì)。Linux基金會(huì)接管后,SQLMesh成為中立項(xiàng)目,F(xiàn)ivetran失去單方面決策權(quán),只保留代碼貢獻(xiàn)者和董事會(huì)席位。
「我們堅(jiān)信,數(shù)據(jù)轉(zhuǎn)換的未來(lái)是開放的。」Fivetran產(chǎn)品副總裁在公告中這樣表述。翻譯過(guò)來(lái):與其獨(dú)自扛旗,不如讓基金會(huì)背書,把競(jìng)爭(zhēng)對(duì)手也拉進(jìn)同一張牌桌。
為什么是現(xiàn)在?數(shù)據(jù)棧正在"管道化"
數(shù)據(jù)行業(yè)的權(quán)力結(jié)構(gòu)正在轉(zhuǎn)移。五年前,誰(shuí)掌控ETL(抽取-轉(zhuǎn)換-加載)工具誰(shuí)就有話語(yǔ)權(quán)。現(xiàn)在,云數(shù)據(jù)倉(cāng)庫(kù)(Snowflake、Databricks、BigQuery)成了新中心,上下游工具被迫重新站隊(duì)。
SQLMesh的處境很微妙。它上游連接Fivetran這類數(shù)據(jù)管道,下游對(duì)接數(shù)據(jù)倉(cāng)庫(kù)。但Fivetran不是唯一選擇——Airbyte、Stitch、Matillion都在搶同一批客戶。下游更卷,dbt Labs已經(jīng)拿下數(shù)據(jù)轉(zhuǎn)換領(lǐng)域約30%的市場(chǎng)份額。
捐贈(zèng)給Linux基金會(huì),相當(dāng)于給SQLMesh發(fā)了一張"中立身份證"。其他數(shù)據(jù)管道廠商可以放心集成,不用擔(dān)心給競(jìng)爭(zhēng)對(duì)手送彈藥。云數(shù)據(jù)倉(cāng)庫(kù)廠商也可以公開支持,不必?fù)?dān)心站隊(duì)嫌疑。
這套邏輯在開源史上反復(fù)上演。Kubernetes從Google捐給CNCF后,成了容器編排的事實(shí)標(biāo)準(zhǔn)。Fivetran顯然在賭同一套劇本。
![]()
技術(shù)細(xì)節(jié):SQLMesh到底解決了什么
數(shù)據(jù)工程師的日常工作里有個(gè)經(jīng)典痛點(diǎn):改了轉(zhuǎn)換邏輯,不知道會(huì)波及多少下游報(bào)表。SQLMesh的核心設(shè)計(jì)是"虛擬數(shù)據(jù)環(huán)境"——在真正執(zhí)行前,先模擬出變更影響范圍。
這有點(diǎn)像代碼審查里的靜態(tài)分析,但針對(duì)的是數(shù)據(jù)管道。傳統(tǒng)工具(如dbt)需要實(shí)際運(yùn)行才能發(fā)現(xiàn)問(wèn)題,SQLMesh把驗(yàn)證環(huán)節(jié)前置,節(jié)省的是計(jì)算資源和時(shí)間。
另一個(gè)差異化點(diǎn)是"語(yǔ)義版本控制"。數(shù)據(jù)表也有版本,SQLMesh能追蹤每次變更的依賴關(guān)系,自動(dòng)判斷哪些下游表需要重跑。對(duì)于擁有數(shù)千張數(shù)據(jù)表的企業(yè),這直接決定了數(shù)據(jù)團(tuán)隊(duì)是準(zhǔn)點(diǎn)下班還是通宵救火。
Fivetran的產(chǎn)品副總裁在訪談中透露,SQLMesh目前在生產(chǎn)環(huán)境管理著"數(shù)百萬(wàn)個(gè)數(shù)據(jù)模型"。這個(gè)數(shù)字未經(jīng)第三方核實(shí),但量級(jí)符合頭部客戶的典型規(guī)模。
競(jìng)爭(zhēng)對(duì)手的微妙反應(yīng)
dbt Labs對(duì)此保持沉默。作為數(shù)據(jù)轉(zhuǎn)換領(lǐng)域最成熟的商業(yè)公司,dbt的開源版本dbt Core同樣采用Apache許可證,但控制權(quán)牢牢握在自己手中。Fivetran的捐贈(zèng)動(dòng)作,某種程度上是在質(zhì)疑這種模式的可持續(xù)性。
Airbyte的態(tài)度更值得玩味。這家數(shù)據(jù)管道廠商在Fivetran宣布捐贈(zèng)后,迅速發(fā)布博客強(qiáng)調(diào)自家"開源優(yōu)先"戰(zhàn)略。但Airbyte的開源協(xié)議是MIT,比Apache更寬松,也意味著商業(yè)公司可以更自由地閉源分叉。
Linux基金會(huì)的選擇同樣有趣。它旗下已有多個(gè)數(shù)據(jù)相關(guān)項(xiàng)目(如Delta Lake、Iceberg),SQLMesh的加入填補(bǔ)了"數(shù)據(jù)轉(zhuǎn)換"這一環(huán)。基金會(huì)執(zhí)行董事在聲明中稱,這將"加速數(shù)據(jù)棧的標(biāo)準(zhǔn)化進(jìn)程"——標(biāo)準(zhǔn)化往往是頭部玩家的護(hù)城河。
一個(gè)懸而未決的問(wèn)題
Fivetran保留了什么?公告明確提到,公司將繼續(xù)"積極參與"SQLMesh開發(fā),并在自家產(chǎn)品中深度集成。但深度集成不等于獨(dú)家綁定——任何競(jìng)爭(zhēng)對(duì)手現(xiàn)在都可以同等接入。
真正的賭注在于:Fivetran能否在SQLMesh生態(tài)中保持影響力優(yōu)勢(shì)?它的數(shù)據(jù)管道業(yè)務(wù)能否借助這一中立平臺(tái),撬動(dòng)更多云數(shù)據(jù)倉(cāng)庫(kù)的合作?
數(shù)據(jù)行業(yè)的整合期遠(yuǎn)未結(jié)束。Snowflake和Databricks的軍備競(jìng)賽、AI對(duì)實(shí)時(shí)數(shù)據(jù)的需求、以及企業(yè)對(duì)成本控制的焦慮,都在重塑工具鏈的優(yōu)先級(jí)。SQLMesh的捐贈(zèng)是這盤大棋中的一手,但棋盤上的玩家還在重新落子。
當(dāng)一家估值56億美元的公司主動(dòng)放棄控制權(quán),它到底在放棄什么,又在換取什么?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.