系統(tǒng)平均負(fù)載被定義為在特定時(shí)間間隔內(nèi)運(yùn)行隊(duì)列中的平均進(jìn)程樹。如果一個(gè)進(jìn)程滿足以下條件則其就會(huì)位于運(yùn)行隊(duì)列中:-
貴溪ssl適用于網(wǎng)站、小程序/APP、API接口等需要進(jìn)行數(shù)據(jù)傳輸應(yīng)用場(chǎng)景,ssl證書未來市場(chǎng)廣闊!成為成都創(chuàng)新互聯(lián)的ssl證書銷售渠道,可以享受市場(chǎng)價(jià)格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:18982081108(備注:SSL證書合作)期待與您的合作!
它沒有在等待I/O
操作的結(jié)果-
它沒有主動(dòng)進(jìn)入等待狀態(tài)(也就是沒有調(diào)用'wait')
-
沒有被停止(例如:等待終止)
例如:[root@www2
init.d]#
uptime
7:51pm
up
2
days,
5:43,
2
users,load
average:
8.13
,
5.90
,
4.94
命令輸出的最后內(nèi)容表示在過去的1
、5
、15分鐘內(nèi)運(yùn)行隊(duì)列中的平均進(jìn)程數(shù)量。
一般來說只要每個(gè)CPU
的當(dāng)前活動(dòng)進(jìn)程數(shù)不大于3
那么系統(tǒng)的性能就是良好的,如果每個(gè)CPU
的任務(wù)數(shù)大于5
,那么就表示這臺(tái)機(jī)器的性能有嚴(yán)重問題。對(duì)于上面的例子來說,假設(shè)系統(tǒng)有兩個(gè)CPU
,那么其每個(gè)CPU
的當(dāng)前任務(wù)數(shù)為:8.13/2=4.065.這表示該系統(tǒng)的性能是可以接受的。
在linux系統(tǒng)里面,常見的有兩個(gè)地方可以看到當(dāng)前系統(tǒng)的最近平均負(fù)載,top命令和uptime,如果執(zhí)行一下uptime命令的話,可以看到有一個(gè)load average,表示最近1分鐘,5分鐘,15分鐘的系統(tǒng)負(fù)載。
# uptime
23:31:04 up 5 days, 10:20, 1 user, load average: 0.00, 0.01, 0.05
一般單核的CPU的話,負(fù)載到1證明系統(tǒng)已經(jīng)運(yùn)行比較滿了,多核的話,有幾個(gè)核就能到幾。
但是,有沒有仔細(xì)想過,這個(gè)負(fù)載值究竟可以有多高?
我們先用一個(gè)程序做下實(shí)驗(yàn)
等這個(gè)程序運(yùn)行一會(huì),再執(zhí)行uptime看下負(fù)載
# uptime
23:44:53 up 5 days, 10:33, 2 users, load average: 16383.13, 14111.52, 7705.88
看到?jīng)],這個(gè)程序竟然把load神奇的刷到了16000這個(gè)級(jí)別,真是厲害,這個(gè)一下子似乎打破了對(duì)系統(tǒng)負(fù)載的認(rèn)識(shí)。
原理是這樣的,通過調(diào)用vfork產(chǎn)生指定數(shù)量的D狀態(tài)的進(jìn)程,從而提高負(fù)載??纯聪到y(tǒng)文檔,是這樣說的
vfork() differs from fork(2) in that the calling thread is suspended until the child terminates (either normally, by calling _exit(2), or abnormally, after delivery of a fatal signal), or it makes a call to execve(2). Untilthat point, the child shares all memory with its parent, including the stack.
vfork 的子進(jìn)程只要不 execve 或者退出,父進(jìn)程就一直掛著(在D狀態(tài))。這里就是讓最后一個(gè)子進(jìn)程用 scanf 等輸入。
但是這個(gè)就是極限了嗎?
程序員在這種事情上是不會(huì)停止追求的,下來再看一個(gè)終極版本的程序
執(zhí)行一下
# stap -g loadavg.stp $(((1
看下效果
# uptime
23:48:19 up 5 days, 10:37, 2 users, load average: 9007199254740991.00, 14987.03, 9007199254740991.00
我天,這是要爆表了,終極load,系統(tǒng)要炸了嗎?
不過,你知道其中的原理嗎,vfork相當(dāng)于還是利用了系統(tǒng)計(jì)算load的原理,通過增加D狀態(tài)進(jìn)程影響計(jì)算,這個(gè)終極版,則是直接修改計(jì)算過程中用到的參數(shù),讓系統(tǒng)算出一個(gè)極大值來,沒有什么能夠超越這個(gè)了。
[root@oldboy ~]# uptime
11:45:25 up 5 days, 13:20, 3 users, load average: 0.00, 0.01, 0.05
uptime內(nèi)容顯示的內(nèi)容一次是系統(tǒng)時(shí)間,開機(jī)到現(xiàn)在的天數(shù),用戶登錄數(shù),以及平均負(fù)載。
核心是平均負(fù)載,其實(shí)就是【單位時(shí)間內(nèi)的活躍進(jìn)程數(shù)】。
2顆,單顆4核CPU為例:
1分鐘:10.00 #CPU處理進(jìn)程1分鐘的繁忙程度,忙碌1分鐘。
5分鐘:8.01 #CPU處理進(jìn)程5分鐘的繁忙程度,忙碌了5分鐘
15分鐘:5.05 #CPU處理進(jìn)程15分鐘的繁忙程度,忙碌持續(xù)15分鐘,15分鐘內(nèi)平均值5.
uptime:故障恢復(fù)了。
1分鐘:1.00 #CPU處理進(jìn)程1分鐘的繁忙程度,忙碌1分鐘。
5分鐘:8.01 #CPU處理進(jìn)程5分鐘的繁忙程度,忙碌了5分鐘
15分鐘:5.05 #CPU處理進(jìn)程15分鐘的繁忙程度,忙碌持續(xù)15分鐘,15分鐘內(nèi)平均值5.
==============================================
總結(jié):15分鐘負(fù)載值12,是高是低呢
負(fù)載數(shù)值/總的核心數(shù)=1 #開始慢的臨界點(diǎn),實(shí)際上1*70%==關(guān)注的臨界點(diǎn)。
12/8=1.2 大于1就說明有問題。
負(fù)載不要超過5,是臨界點(diǎn)。
2顆單顆4核CPU,共8核,負(fù)載就是8*70%=5左右。
需要關(guān)注負(fù)載的值:總的核心數(shù)*70%=關(guān)注的點(diǎn)
==================要掌握的============================
1.平均負(fù)載是運(yùn)行隊(duì)列中活躍的進(jìn)程數(shù)。
2.平均負(fù)載,1,5,15分鐘內(nèi)的負(fù)載。
3.需要關(guān)注負(fù)載的值:總的核心數(shù)*70%=關(guān)注的點(diǎn)
4.輔助top,ps,uptime,sar,mpstat,pidstat,iostat,排查問題。
5.strace跟蹤進(jìn)程系統(tǒng)調(diào)用。
6.記住幾個(gè)案例(面試講故事)。
面試官問:
你在工作中遇到過哪些生產(chǎn)故障,是怎么解決的?
最好和數(shù)據(jù)庫(kù)相關(guān)(負(fù)載高),和web相關(guān)(PHP進(jìn)程100%,JAVA內(nèi)存泄漏)
==================要掌握的============================
***6.平均負(fù)載案例分析實(shí)戰(zhàn)\***
下面,我們以三個(gè)示例分別來看這三種情況,并用 stress、mpstat、pidstat 等工具,找出平均負(fù)載升高的根源。
stress 是 Linux 系統(tǒng)壓力測(cè)試工具,這里我們用作異常進(jìn)程模擬平均負(fù)載升高的場(chǎng)景。
mpstat 是多核 CPU 性能分析工具,用來實(shí)時(shí)查看每個(gè) CPU 的性能指標(biāo),以及所有 CPU 的平均指標(biāo)。
pidstat 是一個(gè)常用的進(jìn)程性能分析工具,用來實(shí)時(shí)查看進(jìn)程的 CPU、內(nèi)存、I/O 以及上下文切換等性能指標(biāo)。
#如果出現(xiàn)無法使用mpstat、pidstat命令查看%wait指標(biāo)建議更新下軟件包
yum install sysstats -y
yum install stress -y
stress --cpu 8 --io 4 --vm 2 --vm-bytes 128M --timeout 10s
***場(chǎng)景一:CPU 密集型進(jìn)程\***
1.首先,我們?cè)诘谝粋€(gè)終端運(yùn)行 stress 命令,模擬一個(gè) CPU 使用率 100% 的場(chǎng)景:
[root@oldboy ~]# stress --cpu 1 --timeout 600
2.接著,在第二個(gè)終端運(yùn)行 uptime 查看平均負(fù)載的變化情況
# 使用watch -d 參數(shù)表示高亮顯示變化的區(qū)域(注意負(fù)載會(huì)持續(xù)升高)
[root@oldboy ~]# watch -d uptime
*3.最后,在第三個(gè)終端運(yùn)行 mpstat 查看 CPU 使用率的變化情況*
# -P ALL 表示監(jiān)控所有CPU,后面數(shù)字5 表示間隔5秒后輸出一組數(shù)據(jù)
[root@oldboy ~]# mpstat -P ALL 5
#單核CPU,所以只有一個(gè)all和0
4.從終端二中可以看到,1 分鐘的平均負(fù)載會(huì)慢慢增加到 1.00,而從終端三中還可以看到,正好有一個(gè) CPU 的使用率為 100%,但它的 iowait 只有 0。這說明,平均負(fù)載的升高正是由于 CPU 使用率為 100% 。那么,到底是哪個(gè)進(jìn)程導(dǎo)致了 CPU 使用率為 100% 呢?可以使用 pidstat 來查詢
![](18.Linux系統(tǒng)管理-進(jìn)程管理.assets/a.png)
# 間隔5秒輸出一組數(shù)據(jù)
[root@oldboy ~]# pidstat -u 5 1
#從這里可以明顯看到,stress進(jìn)程的CPU使用率為100%。
- 模擬cpu負(fù)載高 `stress --cpu 1 --timeout 100`
- 通過uptime或w 查看 `watch -d uptime`
- 查看整體狀態(tài)mpstat -P ALL 1 查看每個(gè)cpu核心使用率
- 精確到進(jìn)程: pidstat 1
****場(chǎng)景二:I/O 密集型進(jìn)程\****
1.首先還是運(yùn)行 stress 命令,但這次模擬 I/O 壓力,即不停地執(zhí)行 sync
[root@oldboy ~]# stress --io 1 --timeout 600s #利用sync()
stress --hdd 8 --hdd-bytes 1g # hd harkdisk 創(chuàng)建進(jìn)程去進(jìn)程寫
*2.然后在第二個(gè)終端運(yùn)行 uptime 查看平均負(fù)載的變化情況:*
[root@oldboy ~]# watch -d uptime
18:43:51 up 2 days, 4:27, 3 users, load average: 1.12, 0.65, 0.00
*3.最后第三個(gè)終端運(yùn)行 mpstat 查看 CPU 使用率的變化情況:*
# 顯示所有 CPU 的指標(biāo),并在間隔 5 秒輸出一組數(shù)據(jù)
[root@oldboy ~]# mpstat -P ALL 5
#會(huì)發(fā)現(xiàn)cpu的與內(nèi)核打交道的sys占用非常高
*4.那么到底是哪個(gè)進(jìn)程,導(dǎo)致 iowait 這么高呢?我們還是用 pidstat 來查詢*
# 間隔5秒后輸出一組數(shù)據(jù),-u 表示CPU指標(biāo)
[root@oldboy ~]# pidstat -u 5 1
#可以發(fā)現(xiàn),還是 stress 進(jìn)程導(dǎo)致的。
- 通過stress 模擬大量進(jìn)程讀寫 `stress --hdd 4 `
- 通過w/uptime查看系統(tǒng)負(fù)載信息 `watch -d uptime`
- 通過top/mpstat 排查 `mpstat -P ALL 1 或 top 按1`
- 確定是iowati `iostat 1查看整體磁盤讀寫情況 或iotop -o 查看具體哪個(gè)進(jìn)程讀寫`
- 根據(jù)對(duì)應(yīng)的進(jìn)程,進(jìn)行相關(guān)處理.
***場(chǎng)景三:大量進(jìn)程的場(chǎng)景 高并發(fā)場(chǎng)景 \***
*當(dāng)系統(tǒng)中運(yùn)行進(jìn)程超出 CPU 運(yùn)行能力時(shí),就會(huì)出現(xiàn)等待 CPU 的進(jìn)程。*
*1.首先,我們還是使用 stress,但這次模擬的是 4 個(gè)進(jìn)程*
[root@oldboy ~]# stress -c 4 --timeout 600
*2.由于系統(tǒng)只有 1 個(gè) CPU,明顯比 4 個(gè)進(jìn)程要少得多,因而,系統(tǒng)的 CPU 處于嚴(yán)重過載狀態(tài)*
*3.然后,再運(yùn)行 pidstat 來看一下進(jìn)程的情況:*
# 間隔5秒后輸出一組數(shù)據(jù)
[root@oldboy ~]# pidstat -u 5 1
*可以看出,4 個(gè)進(jìn)程在爭(zhēng)搶 1 個(gè) CPU,每個(gè)進(jìn)程等待 CPU 的時(shí)間(也就是代碼塊中的 %wait 列)高達(dá) 75%。這些超出 CPU 計(jì)算能力的進(jìn)程,最終導(dǎo)致 CPU 過載。*
****分析完這三個(gè)案例,我再來歸納一下平均負(fù)載與CPU\****
***平均負(fù)載提供了一個(gè)快速查看系統(tǒng)整體性能的手段,反映了整體的負(fù)載情況。但只看平均負(fù)載本身,我們并不能直接發(fā)現(xiàn),到底是哪里出現(xiàn)了瓶頸。所以,在理解平均負(fù)載時(shí),也要注意:
平均負(fù)載高有可能是 CPU 密集型進(jìn)程導(dǎo)致的;
平均負(fù)載高并不一定代表 CPU 使用率高,還有可能是 I/O 更繁忙了;
當(dāng)發(fā)現(xiàn)負(fù)載高的時(shí)候,你可以使用 mpstat、pidstat 等工具,輔助分析負(fù)載的來源****
**系統(tǒng)負(fù)載的計(jì)算和意義**
進(jìn)程以及子進(jìn)程和線程產(chǎn)生的計(jì)算指令都會(huì)讓cpu執(zhí)行,產(chǎn)生請(qǐng)求的這些進(jìn)程組成"運(yùn)行隊(duì)列",等待cpu執(zhí)行,這個(gè)隊(duì)列就是系統(tǒng)負(fù)載, 系統(tǒng)負(fù)載是所有cpu的運(yùn)行隊(duì)列的總和.
[root@oldboyedu ~]# w
20:25:48 up 95 days, 9:06, 1 user, load average: 2.92, 0.00, 0.00
//假設(shè)當(dāng)前計(jì)算機(jī)有4個(gè)核心的cpu,當(dāng)前的負(fù)載是2.92
cpu1 cpu2 cpu3 cpu4
2.94/4(個(gè)cpu核心) = 73%的cpu資源被使用,剩下27%的cpu計(jì)算資源是空想的
//假設(shè)當(dāng)前的計(jì)算有2個(gè)核心的cpu,當(dāng)前的負(fù)載是2.92
2.92/2 = 146% 已經(jīng)驗(yàn)證超過了cpu的處理能力
7. 日常故障排查流程(含日志)
- w/uptime, 查看負(fù)載
- ps aux/top 看看 cpu百分比, io wait或者是內(nèi)存占用的高? (三高 cpu,io,內(nèi)存)
- top檢查具體是哪個(gè)進(jìn)程,找出可疑進(jìn)程
- 追蹤這個(gè)進(jìn)程使用情況,做什么的?
- 看看對(duì)應(yīng)**日志**是否有異常
- 系統(tǒng)日志: /var/log/messages(系統(tǒng)通用日志) /var/log/secure(用戶登錄情況)
- 服務(wù)軟件的日志
***3.那平均負(fù)載為多少時(shí)合理\***
*最理想的狀態(tài)是每個(gè) CPU核心 上都剛好運(yùn)行著一個(gè)進(jìn)程,這樣每個(gè) CPU 都得到了充分利用。所以在評(píng)判平均負(fù)載時(shí),首先你要知道系統(tǒng)有幾個(gè) CPU核心,這可以通過 top 命令獲取,或`grep 'model name' /proc/cpuinfo`*
系統(tǒng)平均負(fù)載被定義為在特定時(shí)間間隔內(nèi)運(yùn)行隊(duì)列中的平均進(jìn)程數(shù)。如果一個(gè)進(jìn)程滿足以下條件則其就會(huì)位于運(yùn)行隊(duì)列中:
- 它沒有在等待I/O操作的結(jié)果
- 它沒有主動(dòng)進(jìn)入等待狀態(tài)(也就是沒有調(diào)用'wait')
- 沒有被停止(例如:等待終止)
《內(nèi)容來自老男孩老師的課堂筆記》
uptime gives a one line display of the following information. The current time, how long the system has been running, how many users are currently logged
on, and the system load averages for the past 1, 5, and 15 minutes.
uptime會(huì)打印出過去1/5/15 分鐘的負(fù)載,負(fù)載值越大負(fù)載越高。
如果只有一個(gè)CPU,負(fù)載為1代表CPU為100%