這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)如何理解Linux CPU負(fù)載和CPU使用率,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
成都創(chuàng)新互聯(lián)公司始終致力于在企業(yè)網(wǎng)站建設(shè)領(lǐng)域發(fā)展。秉承“創(chuàng)新、求實、誠信、拼搏”的企業(yè)精神,致力為企業(yè)提供全面的網(wǎng)絡(luò)宣傳與技術(shù)應(yīng)用整體策劃方案,為企業(yè)提供包括“網(wǎng)站建設(shè)、響應(yīng)式網(wǎng)站、手機(jī)網(wǎng)站建設(shè)、微信網(wǎng)站建設(shè)、重慶小程序開發(fā)、商城網(wǎng)站建設(shè)、平臺網(wǎng)站建設(shè)秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。
這兩個從一定程度上都可以反映一臺機(jī)器的繁忙程度.
cpu使用率反映的是當(dāng)前cpu的繁忙程度,忽高忽低的原因在于占用cpu處理時間的進(jìn)程可能處于io等待狀態(tài)但卻還未釋放進(jìn)入wait。
平均負(fù)載(load average)是指某段時間內(nèi)占用cpu時間的進(jìn)程和等待cpu時間的進(jìn)程數(shù),這里等待cpu時間的進(jìn)程是指等待被喚醒的進(jìn)程,不包括處于wait狀態(tài)進(jìn)程。
以上分析可以看出,一臺機(jī)器很有可能處于低cpu使用率高負(fù)載的情況,因此看機(jī)器的繁忙程度應(yīng)該結(jié)合兩者,從實際的使用情況觀察,自己的一臺雙核志強(qiáng)2.8GHZ,2G內(nèi)存的機(jī)器在平均負(fù)載到50左右,cpu使用率才接近100%(應(yīng)用有不少io操作),這種情況下應(yīng)用還算流暢,實際訪問延遲不是很高。因此在cpu還空閑的情況下,如何提高io響應(yīng)是減少負(fù)載的關(guān)鍵,很多人認(rèn)為負(fù)載到幾十了機(jī)器就非常繁忙了,我倒覺得如果這個時候cpu使用率比較低,則負(fù)載高可能不能很好說明問題,一旦cpu處理的進(jìn)程處理完后,那些等待的進(jìn)程也能立刻得到響應(yīng),這種情況下應(yīng)該優(yōu)化io讀寫速度。真到cpu使用率一直90%以上,即使平均負(fù)載只有個位數(shù)(比如某一個進(jìn)程一直在運(yùn)算),那機(jī)器其實也已經(jīng)繁忙了~
其實,在前面的文章中,也有寫到cpu使用率低負(fù)載高,原因分析 cpu使用率低,但是load很高,load很高的可能是IO
判斷系統(tǒng)負(fù)荷是否過重,必須理解load average的真正含義。下面,我根據(jù)"Understanding Linux CPU Load"這篇文章,嘗試用最通俗的語言,解釋這個問題。
首先,假設(shè)最簡單的情況,你的電腦只有一個CPU,所有的運(yùn)算都必須由這個CPU來完成。
那么,我們不妨把這個CPU想象成一座大橋,橋上只有一根車道,所有車輛都必須從這根車道上通過。(很顯然,這座橋只能單向通行。)
系統(tǒng)負(fù)荷為0,意味著大橋上一輛車也沒有。
系統(tǒng)負(fù)荷為0.5,意味著大橋一半的路段有車。
系統(tǒng)負(fù)荷為1.0,意味著大橋的所有路段都有車,也就是說大橋已經(jīng)"滿"了。但是必須注意的是,直到此時大橋還是能順暢通行的。
系統(tǒng)負(fù)荷為1.7,意味著車輛太多了,大橋已經(jīng)被占滿了(100%),后面等著上橋的車輛為橋面車輛的70%。以此類推,系統(tǒng)負(fù)荷2.0,意味著等待上橋的車輛與橋面的車輛一樣多;系統(tǒng)負(fù)荷3.0,意味著等待上橋的車輛是橋面車輛的2倍??傊?,當(dāng)系統(tǒng)負(fù)荷大于1,后面的車輛就必須等待了;系統(tǒng)負(fù)荷越大,過橋就必須等得越久。
CPU的系統(tǒng)負(fù)荷,基本上等同于上面的類比。大橋的通行能力,就是CPU的最大工作量;橋梁上的車輛,就是一個個等待CPU處理的進(jìn)程(process)。
如果CPU每分鐘最多處理100個進(jìn)程,那么系統(tǒng)負(fù)荷0.2,意味著CPU在這1分鐘里只處理20個進(jìn)程;系統(tǒng)負(fù)荷1.0,意味著CPU在這1分鐘里正好處理100個進(jìn)程;系統(tǒng)負(fù)荷1.7,意味著除了CPU正在處理的100個進(jìn)程以外,還有70個進(jìn)程正排隊等著CPU處理。
為了電腦順暢運(yùn)行,系統(tǒng)負(fù)荷最好不要超過1.0,這樣就沒有進(jìn)程需要等待了,所有進(jìn)程都能第一時間得到處理。很顯然,1.0是一個關(guān)鍵值,超過這個值,系統(tǒng)就不在最佳狀態(tài)了,你要動手干預(yù)了。
上面,我們假設(shè)你的電腦只有1個CPU。如果你的電腦裝了2個CPU,會發(fā)生什么情況呢?
2個CPU,意味著電腦的處理能力翻了一倍,能夠同時處理的進(jìn)程數(shù)量也翻了一倍。
還是用大橋來類比,兩個CPU就意味著大橋有兩根車道了,通車能力翻倍了。
所以,2個CPU表明系統(tǒng)負(fù)荷可以達(dá)到2.0,此時每個CPU都達(dá)到100%的工作量。推廣開來,n個CPU的電腦,可接受的系統(tǒng)負(fù)荷最大為n.0。
芯片廠商往往在一個CPU內(nèi)部,包含多個CPU核心,這被稱為多核CPU。
在系統(tǒng)負(fù)荷方面,多核CPU與多CPU效果類似,所以考慮系統(tǒng)負(fù)荷的時候,必須考慮這臺電腦有幾個CPU、每個CPU有幾個核心。然后,把系統(tǒng)負(fù)荷除以總的核心數(shù),只要每個核心的負(fù)荷不超過1.0,就表明電腦正常運(yùn)行。
怎么知道電腦有多少個CPU核心呢?
"cat /proc/cpuinfo"命令,可以查看CPU信息。"grep -c 'model name' /proc/cpuinfo"命令,直接返回CPU的總核心數(shù)。
1.0是系統(tǒng)負(fù)荷的理想值嗎?
不一定,系統(tǒng)管理員往往會留一點(diǎn)余地,當(dāng)這個值達(dá)到0.7,就應(yīng)當(dāng)引起注意了。經(jīng)驗法則是這樣的:
當(dāng)系統(tǒng)負(fù)荷持續(xù)大于0.7,你必須開始調(diào)查了,問題出在哪里,防止情況惡化。
當(dāng)系統(tǒng)負(fù)荷持續(xù)大于1.0,你必須動手尋找解決辦法,把這個值降下來。
當(dāng)系統(tǒng)負(fù)荷達(dá)到5.0,就表明你的系統(tǒng)有很嚴(yán)重的問題,長時間沒有響應(yīng),或者接近死機(jī)了。你不應(yīng)該讓系統(tǒng)達(dá)到這個值。
對于我的機(jī)器,有24個core,那么,load多少合適呢?
[root@jiangyi01.sqa.zmf /home/ahao.mah/ALIOS_QA] #grep 'model name' /proc/cpuinfo | wc -l 24
答案是:
[root@jiangyi01.sqa.zmf /home/ahao.mah/ALIOS_QA] #echo "0.7*24" |bc 16.8
最后一個問題,"load average"一共返回三個平均值----1分鐘系統(tǒng)負(fù)荷、5分鐘系統(tǒng)負(fù)荷,15分鐘系統(tǒng)負(fù)荷,----應(yīng)該參考哪個值?
如果只有1分鐘的系統(tǒng)負(fù)荷大于1.0,其他兩個時間段都小于1.0,這表明只是暫時現(xiàn)象,問題不大。
如果15分鐘內(nèi),平均系統(tǒng)負(fù)荷大于1.0(調(diào)整CPU核心數(shù)之后),表明問題持續(xù)存在,不是暫時現(xiàn)象。所以,你應(yīng)該主要觀察"15分鐘系統(tǒng)負(fù)荷",將它作為電腦正常運(yùn)行的指標(biāo)。
上述就是小編為大家分享的如何理解Linux CPU負(fù)載和CPU使用率了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。