本篇文章給大家分享的是有關Spring Batch并行處理四種模式分別是什么,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
成都創(chuàng)新互聯(lián)公司堅持“要么做到,要么別承諾”的工作理念,服務領域包括:成都網(wǎng)站建設、做網(wǎng)站、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣等服務,滿足客戶于互聯(lián)網(wǎng)時代的石獅網(wǎng)站設計、移動媒體設計的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡建設合作伙伴!
大多數(shù)情況下,單線程、單進程的Spring Batch
已經(jīng)能滿足你的需求。在我們走向更復雜的特性之前,先看看簡單的能不能用,Keep it Simple and Stupid
。
不過,當你確定要使用并行處理時,Spring Batch
也提供了多種選擇。整體上分為兩大類:
(1)單進程、多線程
(2)多進程
細分如下:
(1)多線程的Step
(單進程)
(2)并行的Steps
(單進程)
(3)遠程分塊(多進程)
(4)遠程分區(qū)(多進程)
光從名字看,很難理解它們之間的差別,我們來一一介紹吧。
通過提供一個TaskExecutor
來執(zhí)行,而TaskExecutor
是可以自定義的,我們可以提供一個基于線程池的TaskExecutor
,則可以實現(xiàn)多線程處理。
@Bean public TaskExecutor taskExecutor(){ return new SimpleAsyncTaskExecutor("spring_batch"); } @Bean public Step sampleStep(TaskExecutor taskExecutor) { return this.stepBuilderFactory.get("sampleStep") .chunk(10) .reader(itemReader()) .writer(itemWriter()) .taskExecutor(taskExecutor) .build(); }
這個看起來跟第一個很像,其實完全不一樣。它是多個steps
之間來并行處理。所以job
應該是可以分解為獨立的step
,不是按一步一步的順序處理,這樣才可以并行執(zhí)行。比如下面的例子,step1
和step2
合并成一個flow1
,而step3
為flow2
,flow1
與flow2
之間可以并行處理。
代碼如下:
@Bean public Job job() { return jobBuilderFactory.get("job") .start(splitFlow()) .next(step4()) .build() //builds FlowJobBuilder instance .build(); //builds Job instance } @Bean public Flow splitFlow() { return new FlowBuilder("splitFlow") .split(taskExecutor()) .add(flow1(), flow2()) .build(); } @Bean public Flow flow1() { return new FlowBuilder ("flow1") .start(step1()) .next(step2()) .build(); } @Bean public Flow flow2() { return new FlowBuilder ("flow2") .start(step3()) .build(); } @Bean public TaskExecutor taskExecutor(){ return new SimpleAsyncTaskExecutor("spring_batch"); }
在這種模式下,step
會被拆成多個Java
進程來處理,主程序與分塊執(zhí)行程序之間通過中間件來通信。如下圖所示:
由上圖可以看出,讀取只有一個進程Manager
,而處理進程Worker
則可以多個,所以適用于易讀而難處理的場景。
遠程分區(qū)
跟遠程分塊
容易混淆,但其實它們是不同的。前面講解的遠程分塊
是一個進程讀,多個進程處理;而遠程分區(qū)
是多個進程讀,多個進程處理,多個進程寫:
所以,遠程分區(qū)
適用于容易有IO瓶頸的系統(tǒng),因為它將讀與寫都拆到多個worker
進程中去了。遠程分區(qū)
可以使用中間件,如消息隊列,也可以不用。它通過PartitionHandler
來進行分區(qū)處理,而Partitioner
則定義了如何進行分區(qū)。
上面介紹了Spring Batch
并行處理的四種模式,分別是多線程Step
、并行Steps
、遠程分塊、遠程分區(qū)。前兩種比較簡單,給出代碼例子;而后兩種則復雜得多,特別是遠程分區(qū)
模式,把IO
壓力和業(yè)務處理壓力都分解了,能大大提高整個流程的處理效率。
以上就是Spring Batch并行處理四種模式分別是什么,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注創(chuàng)新互聯(lián)行業(yè)資訊頻道。