如何理解spark on yarn內(nèi)存分配,相信很多沒有經(jīng)驗(yàn)的人對(duì)此束手無(wú)策,為此本文總結(jié)了問(wèn)題出現(xiàn)的原因和解決方法,通過(guò)這篇文章希望你能解決這個(gè)問(wèn)題。
創(chuàng)新互聯(lián)主要從事網(wǎng)站設(shè)計(jì)制作、成都網(wǎng)站設(shè)計(jì)、網(wǎng)頁(yè)設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)老邊,十年網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專業(yè),歡迎來(lái)電咨詢建站服務(wù):18982081108
要掌握這個(gè)知識(shí)點(diǎn),要了解以下幾個(gè)點(diǎn):
- spark driver和executor的on-heap內(nèi)存是如何配置的。
- spark driver和excutor的off-heap內(nèi)存是如何配置的。
默認(rèn)值1g。driver進(jìn)程的on-heap內(nèi)存,driver進(jìn)程就是sparkcontext初始化所在的進(jìn)程。在client模式下driver的堆內(nèi)存,不要通過(guò)SparkConf設(shè)置,要用--driver-memory命令替換,或者在默認(rèn)的配置文件里配置。2). spark.driver.memoryOverhead默認(rèn)值是max(DriverMemory*0.1,384m)。在YARN或者kubernetes模式的cluster模式下,driver端申請(qǐng)的off-heap內(nèi)存的總量,通常是driver堆內(nèi)存的6%-10%。3). spark.executor.memory默認(rèn)值1g。Executor的jvm內(nèi)存總量。4). spark.executor.memoryOverhead默認(rèn)值max(executor*0.1,384).單個(gè)executor申請(qǐng)的off-heap內(nèi)存的總量。該參數(shù)僅僅支持在yarn或者kubernetes上使用,通??梢允莈xecutor內(nèi)存的0.06-0.1。默認(rèn)值512m,Appmaster在client模式下的內(nèi)存。假如是Cluster模式下會(huì)使用spark.driver.memory來(lái)代替。yarn調(diào)度container有個(gè)最小粒度,資源調(diào)度的時(shí)候必須是其整數(shù)倍,最小粒度的配置參數(shù)是
yarn.scheduler.minimum-allocation-mb
最小調(diào)度單元默認(rèn)值是1024,單位是mb。浪尖這里的案例是40個(gè)executor,單個(gè)executor內(nèi)存申請(qǐng)的時(shí)候是20GB,driver是20GB,yarn的web ui截圖如下:整個(gè)APP申請(qǐng)的總內(nèi)存是 923648MB=902GB。spark app申請(qǐng)的單個(gè) Executor內(nèi)存,從1.3和1.4可以得知是:那么40個(gè)executor內(nèi)存是:
spark on yarn 的cluster模式下Driver端與appmaster是在一起的,所以appmaster內(nèi)存參數(shù)無(wú)效,因此driver和executor總內(nèi)存由1.1和1.2可得:上面計(jì)算的案例中,由于浪院長(zhǎng)這里的yarn集群內(nèi)存調(diào)度的最小粒度是1GB貌似,在上面的計(jì)算中沒有參與度。此時(shí)假設(shè)是10個(gè)executor,每個(gè)executor的內(nèi)存是19GB,driver的內(nèi)存依然是19GB。首先,我們先看一下,web ui的總內(nèi)存:
換算成GB就是236544MB/1024 = 231GB
那么經(jīng)計(jì)算可以指導(dǎo)單個(gè)executor的內(nèi)存是:Yarn的最小調(diào)度單元是1GB,所以單個(gè)executor調(diào)度的時(shí)候內(nèi)存是21GB。10個(gè)executor的總內(nèi)存就是 21 *10 = 210GB經(jīng)計(jì)算可以得到driver的內(nèi)存是19*1.1GB= 21GB那么計(jì)算所得的spark app內(nèi)存和 yarn ui上所得內(nèi)存一致。沒有開啟動(dòng)態(tài)executor申請(qǐng)與釋放,假設(shè)開啟了,要視情況計(jì)算。看完上述內(nèi)容,你們掌握如何理解spark on yarn內(nèi)存分配的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!
當(dāng)前題目:如何理解sparkonyarn內(nèi)存分配
URL鏈接:
http://weahome.cn/article/ppejso.html