337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

“流處理 vs. 批處理”是一個錯誤的二分法

0
分享至



Often times, "Stream vs. Batch" is discussed as if it’s oneorthe other, but to me this does not make that much sense really.
很多時候,“Stream vs. Batch”

被討論為非此彼,但對我來說,這并沒有多大意義。

Many streaming systems will apply batching too, i.e. processing or transferring multiple records (a "batch") at once, thus offsetting connection overhead, amortizing the cost of fanning out work to multiple threads, opening the door for highly efficient SIMD processing, etc., all to ensure high performance. The prevailing trend towards storage/compute separation in data streaming and processing architectures (for instance, thinking of platforms such as WarpStream, andDiskless Kafkaat large) further accelerates this development.
許多流系統也將應用批處理,即一次處理或傳輸多條記錄(“批處理”),從而抵消連接開銷,將工作扇出的成本分攤到多個線程,為高效的 SIMD 處理打開大門等,所有這些都是為了確保高性能。數據流和處理架構中存儲/計算分離的普遍趨勢(例如,考慮 WarpStream 和整個無盤 Kafka等平臺)進一步加速了這一發展。

Typically, this is happening transparently to users, done in an opportunistic way: handling all of those records (up to some limit) which have arrived in a buffer since the last batch. This makes for a very nice self-regulating system. High arrival rate of records: larger batches, improving throughput. Low arrival rate: smaller batches, perhaps with even just a single record, ensuring low latency. Columnar in-memory data formats likeApache Arroware of great help for implementing such a design.
通常,這對用戶是透明的,以機會主義的方式完成:處理自上一批以來到達緩沖區的所有這些記錄(最多達到某個限制)。這形成了一個非常好的自我調節系統。記錄到達率高:批次更大,提高吞吐量。低到達率:較小的批次,甚至可能只有一條記錄,確保低延遲。像Apache Arrow這樣的列式內存數據格式對于實現這樣的設計有很大幫助。

In contrast, what the "Stream vs. Batch" discussion in my opinion should actually be about, are "Pull vs. Push" semantics: will the system query its sources for new records in a fixed interval, or will new records be pushed to the system as soon as possible? Now, no matter how often you pull, you can’t convert a pull-based solution into a streaming one. Unless a source represents a consumable stream of changes itself (you see where this is going), a pull system may miss updates happening between fetch attempts, as well as deletes.
相比之下,在我看來,“Stream vs. Batch”的討論實際上應該是關于“Pull vs. Push”語義:系統會在固定的時間間隔內查詢其源以獲取新記錄,還是會盡快將新記錄推送到系統?現在,無論您多久拉取一次,都無法將基于拉取的解決方案轉換為流式解決方案。除非源本身代表可消費的更改流(您知道這是怎么回事),否則拉取系統可能會錯過在獲取嘗試和刪除之間發生的更新。

This is what makes streaming so interesting and powerful: it provides you with a complete view of your data in real-time. A streaming system lets you put your data to thelocationwhere you need it, in theformatyou need it, and in theshapeyou need it (think denormalization), immediately as it gets produced or updated. The price for this is a potentially higher complexity, for example when reasoning about streaming joins (and their state), or handling out-of-order data. But the streaming community is working continuously to improve things here, e.g. via disaggregated state backends, transactional stream processing, and much more. I’m really excited about all the innovation happening in this space right now.
這就是流式處理如此有趣和強大的原因:它為您提供實時數據的完整視圖。流系統允許您將數據放在需要的位置、所需的格式形狀(想想非規范化),在數據生成或更新時立即。這樣做的代價是可能更高的復雜性,例如,在推理流式連接(及其狀態)或處理無序數據時。但是流社區正在不斷努力改進這里的事情,例如通過分解的狀態后端、事務流處理等等。我對這個領域現在發生的所有創新感到非常興奮。

Now, you might wonder: "Do I really need streaming(push), though? I’m fine with batch(pull)."
現在,您可能會想:“不過,我真的需要流式處理(push)嗎?我對批處理(拉)沒問題。

That’s a common and fair question. In my experience, it is best answered by giving it a try yourself. Again and again I have seen how folks who were skeptical at first, very quickly wanted to get real-time streaming for more and more, if not all of their use cases, once they had seen it in action once. If you’ve experienced a data freshness of a second or two in your data warehouse, you don’t want to ever miss this magic again.
這是一個常見且公平的問題。根據我的經驗,最好自己試一試來回答。我一次又一次地看到,起初持懷疑態度的人們,一旦他們曾經看到過實時流,他們很快就希望為越來越多的用例(如果不是全部)獲得實時流。如果您在數據倉庫中體驗過一兩秒的數據新鮮度,那么您肯定不想再錯過這種神奇之處。

All that being said, it’s actually not even about pullorpush so much—
the approaches complement each other. For instance, backfills often are done via batching, i.e. querying, in an otherwise streaming-based system. Also, if you want the completeness of streaming but don’t require a super low latency, you may decide to suspend your streaming pipelines (thus saving cost) in times of low data volume, resume when there’s new data to process, and halt again.
話雖如此,實際上甚至與拉推無關——這些方法是相輔相成的。例如,回填通常是通過批處理(即查詢)在其他基于流的系統中完成的。此外,如果您想要流式處理的完整性,但不需要超低延遲,則可以決定在數據量較低時暫停流式處理管道(從而節省成本),在有新數據要處理時恢復,然后再次停止。

Batch streaming, if you will.
批量流式處理(如果愿意)。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
你敢地面入侵,我就派志愿軍,伊朗迎來新幫手,海灣7國沉默不語

你敢地面入侵,我就派志愿軍,伊朗迎來新幫手,海灣7國沉默不語

浪子阿邴聊體育
2026-04-04 05:44:45
臺灣老兵帶妻子回大陸見原配,苦等50年相談1小時,原配:無話說

臺灣老兵帶妻子回大陸見原配,苦等50年相談1小時,原配:無話說

云霄紀史觀
2026-04-03 16:15:36
教育部發布“教師二十嚴禁”!這回,老師不準做的事,全寫清楚了

教育部發布“教師二十嚴禁”!這回,老師不準做的事,全寫清楚了

笑熬漿糊111
2026-04-05 00:05:25
終于有了結果,曾醫生能保住醫院的工作,最應該感謝的三位貴人!

終于有了結果,曾醫生能保住醫院的工作,最應該感謝的三位貴人!

凌風的世界觀
2025-11-14 08:38:31
2-1!半場多打1人艱難絕殺 11.7億豪門笑傲恩怨對決6連勝7分領跑

2-1!半場多打1人艱難絕殺 11.7億豪門笑傲恩怨對決6連勝7分領跑

狍子歪解體壇
2026-04-05 05:02:13
重磅!25歲中國冰壺女隊隊長拒絕參加世錦賽:我可能被封殺+退役

重磅!25歲中國冰壺女隊隊長拒絕參加世錦賽:我可能被封殺+退役

念洲
2026-04-04 11:25:29
美軍突然不會打仗了!飛行員還沒有找到,在伊朗度過艱難的24小時

美軍突然不會打仗了!飛行員還沒有找到,在伊朗度過艱難的24小時

Ck的蜜糖
2026-04-04 14:45:19
2架美國“黑鷹”被伊朗山民擊中!秘密武器遭曝光,伊朗:新防空系統將陸續亮相!特朗普40年前就說要“搶伊朗石油”、奪哈爾克島

2架美國“黑鷹”被伊朗山民擊中!秘密武器遭曝光,伊朗:新防空系統將陸續亮相!特朗普40年前就說要“搶伊朗石油”、奪哈爾克島

每日經濟新聞
2026-04-05 01:14:41
深圳某小區房價暴漲,半年漲了一千多萬!

深圳某小區房價暴漲,半年漲了一千多萬!

黯泉
2026-04-04 22:35:30
19歲體育生任澤賓去世,有8塊腹肌,好友透露原因,第二天就下葬

19歲體育生任澤賓去世,有8塊腹肌,好友透露原因,第二天就下葬

180視角
2026-04-04 15:55:59
“5G基站”施工時被執法部門叫停,發現紅頭文件為偽造,有公司墊資近200萬;陜西省通信管理局:沒有此“合作”項目;警方正在調查

“5G基站”施工時被執法部門叫停,發現紅頭文件為偽造,有公司墊資近200萬;陜西省通信管理局:沒有此“合作”項目;警方正在調查

大象新聞
2026-04-04 10:45:12
全網最不想火的雞煲店,憑一句“勸退”爆火

全網最不想火的雞煲店,憑一句“勸退”爆火

廣東發布
2026-04-03 20:04:56
美軍直升機超低空飛行搜救,地上伊朗士兵用機槍追著打!伊朗稱用了新武器;美軍飛行員被俘怎么辦?特朗普:希望“那種情況”不會發生

美軍直升機超低空飛行搜救,地上伊朗士兵用機槍追著打!伊朗稱用了新武器;美軍飛行員被俘怎么辦?特朗普:希望“那種情況”不會發生

每日經濟新聞
2026-04-04 13:47:27
跨越一萬公里的清算:48小時逐客令,阿根廷一刀切斷伊朗南美命脈

跨越一萬公里的清算:48小時逐客令,阿根廷一刀切斷伊朗南美命脈

環球格局觀
2026-04-04 20:52:35
北美觀察丨美F-15被擊落 伊朗戰爭的代價正在累積

北美觀察丨美F-15被擊落 伊朗戰爭的代價正在累積

國際在線
2026-04-04 10:53:03
伊朗媒體:蘇萊曼尼女兒否認他的親屬在美被捕

伊朗媒體:蘇萊曼尼女兒否認他的親屬在美被捕

財聯社
2026-04-05 06:19:45
廣東一女子被搶后開車撞向劫匪,致一人死亡,終審被判正當防衛無罪

廣東一女子被搶后開車撞向劫匪,致一人死亡,終審被判正當防衛無罪

臺州交通廣播
2026-04-04 10:17:55
美議員:公開外星人簡報將讓國家混亂,近兩年5名頂尖科學家失蹤或死亡恐與此有關

美議員:公開外星人簡報將讓國家混亂,近兩年5名頂尖科學家失蹤或死亡恐與此有關

紅星新聞
2026-04-04 19:31:34
“麻豆傳媒·關停”:黃色產業,居然也有寒冬!?

“麻豆傳媒·關停”:黃色產業,居然也有寒冬!?

辰星雜談
2026-04-04 13:38:22
炸鍋!非農數據澆滅降息夢,全球金融坐等周一開盤風暴

炸鍋!非農數據澆滅降息夢,全球金融坐等周一開盤風暴

魏家東
2026-04-04 14:05:33
2026-04-05 08:00:49
親愛的數據 incentive-icons
親愛的數據
《我看見了風暴:人工智能基建革命》一書作者
693文章數 219913關注度
往期回顧 全部

科技要聞

內存一年漲四倍!國產手機廠商集體漲價

頭條要聞

爆火雞煲店老板喊話網友"別來了" 連"少東家"也被召回

頭條要聞

爆火雞煲店老板喊話網友"別來了" 連"少東家"也被召回

體育要聞

剎不住的泰格·伍茲,口袋里的兩粒藥丸

娛樂要聞

Q女士反擊,否認逼宋寧峰張婉婷離婚

財經要聞

中微董事長,給半導體潑點冷水

汽車要聞

17萬級海豹07EV 不僅續航長還有9分鐘滿電的快樂

態度原創

教育
本地
房產
藝術
公開課

教育要聞

八年級數學,全軍覆沒

本地新聞

跟著歌聲游安徽,聽古村回響

房產要聞

小陽春全面啟動!現房,才是這波行情里最穩的上車票

藝術要聞

周恩來唯一草書題碑,8個字快一半都不認識!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版