iostat如何對(duì)linux硬盤(pán)IO性能進(jìn)行檢測(cè),針對(duì)這個(gè)問(wèn)題,這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問(wèn)題的小伙伴找到更簡(jiǎn)單易行的方法。
創(chuàng)新互聯(lián)專注于個(gè)舊網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠(chéng)為您提供個(gè)舊營(yíng)銷型網(wǎng)站建設(shè),個(gè)舊網(wǎng)站制作、個(gè)舊網(wǎng)頁(yè)設(shè)計(jì)、個(gè)舊網(wǎng)站官網(wǎng)定制、微信平臺(tái)小程序開(kāi)發(fā)服務(wù),打造個(gè)舊網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供個(gè)舊網(wǎng)站排名全網(wǎng)營(yíng)銷落地服務(wù)。
近期公司安裝了幾臺(tái)DELL PE2650和2850的服務(wù)器,統(tǒng)一安裝的是RHLE5.132位系統(tǒng),而服務(wù)器的SCSI硬盤(pán)都統(tǒng)一做了raid1。公司老總要求對(duì)硬盤(pán)IO作統(tǒng)一檢測(cè)報(bào)告,在Linux下找了許多工具,發(fā)現(xiàn)最實(shí)用的還是iostat,這個(gè)需要先安裝sysstat ,即yum -y install sysstat;公司內(nèi)部的yum服務(wù)器搭建這個(gè)不是本文的重點(diǎn),這里不作詳細(xì)敘述。
# iostat -x 1 10
Linux 2.6.18-92.el5xen 03/01/2010
avg-cpu: %user %nice %system %iowait %steal %idle
1.10 0.00 4.82 39.54 0.07 54.46
Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util
sda 0.00 3.50 0.40 2.50 5.60 48.00 18.48 0.00 0.97 0.97 0.28
sdb 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
sdc 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
sdd 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
sde 0.00 0.10 0.30 0.20 2.40 2.40 9.60 0.00 1.60 1.60 0.08
sdf 17.40 0.50 102.00 0.20 12095.20 5.60 118.40 0.70 6.81 2.09 21.36
sdg 232.40 1.90 379.70 0.50 76451.20 19.20 201.13 4.94 13.78 2.45 93.16
rrqm/s:每秒進(jìn)行 merge 的讀操作數(shù)目。即 delta(rmerge)/s
wrqm/s: 每秒進(jìn)行 merge 的寫(xiě)操作數(shù)目。即 delta(wmerge)/s
r/s: 每秒完成的讀 I/O 設(shè)備次數(shù)。即 delta(rio)/s
w/s: 每秒完成的寫(xiě) I/O 設(shè)備次數(shù)。即 delta(wio)/s
rsec/s:每秒讀扇區(qū)數(shù)。即 delta(rsect)/s
wsec/s: 每秒寫(xiě)扇區(qū)數(shù)。即 delta(wsect)/s
rkB/s: 每秒讀K字節(jié)數(shù)。是 rsect/s 的一半,因?yàn)槊可葏^(qū)大小為512字節(jié)。(需要計(jì)算)
wkB/s:每秒寫(xiě)K字節(jié)數(shù)。是 wsect/s 的一半。(需要計(jì)算)
avgrq-sz:平均每次設(shè)備I/O操作的數(shù)據(jù)大小 (扇區(qū))。delta(rsect+wsect)/delta(rio+wio)
avgqu-sz:平均I/O隊(duì)列長(zhǎng)度。即 delta(aveq)/s/1000 (因?yàn)閍veq的單位為毫秒)。
await:平均每次設(shè)備I/O操作的等待時(shí)間 (毫秒)。即 delta(ruse+wuse)/delta(rio+wio)
svctm:平均每次設(shè)備I/O操作的服務(wù)時(shí)間 (毫秒)。即 delta(use)/delta(rio+wio)
%util: 一秒中有百分之多少的時(shí)間用于 I/O 操作,或者說(shuō)一秒中有多少時(shí)間 I/O 隊(duì)列是非空的。即 delta(use)/s/1000 (因?yàn)閡se的單位為毫秒)
如果%util接近100%,說(shuō)明產(chǎn)生的I/O請(qǐng)求太多,I/O系統(tǒng)已經(jīng)滿負(fù)荷,該磁盤(pán)
可能存在瓶頸;idle小于70% IO壓力就較大了,一般讀取速度有較多的wait。
同時(shí)可以結(jié)合vmstat 查看查看b參數(shù)(等待資源的進(jìn)程數(shù))和wa參數(shù)(IO等待所占用的CPU時(shí)間的百分比,高過(guò)30%時(shí)IO壓力高)
另外還可以參考
一般:
svctm < await(因?yàn)橥瑫r(shí)等待的請(qǐng)求的等待時(shí)間被重復(fù)計(jì)算了),
svctm的大小一般和磁盤(pán)性能有關(guān):CPU/內(nèi)存的負(fù)荷也會(huì)對(duì)其有影響,請(qǐng)求過(guò)多也會(huì)間接導(dǎo)致 svctm 的增加。
await:await的大小一般取決于服務(wù)時(shí)間(svctm) 以及 I/O 隊(duì)列的長(zhǎng)度和 I/O 請(qǐng)求的發(fā)出模式。
如果svctm 比較接近await,說(shuō)明I/O 幾乎沒(méi)有等待時(shí)間;
如果await 遠(yuǎn)大于svctm,說(shuō)明I/O隊(duì)列太長(zhǎng),應(yīng)用得到的響應(yīng)時(shí)間變慢
如果響應(yīng)時(shí)間超過(guò)了用戶可以容許的范圍,這時(shí)可以考慮更換更快的磁盤(pán),調(diào)整內(nèi)核elevator算法,優(yōu)化應(yīng)用,或者升級(jí) CPU。
隊(duì)列長(zhǎng)度(avgqu-sz)也可作為衡量系統(tǒng) I/O 負(fù)荷的指標(biāo),但由于 avgqu-sz 是按照單位時(shí)間的平均值,所以不能反映瞬間的 I/O 洪水。
別人一個(gè)不錯(cuò)的例子(I/O 系統(tǒng)vs超市排隊(duì))
舉一個(gè)例子,我們?cè)诔信抨?duì) checkout 時(shí),怎么決定該去哪個(gè)交款臺(tái)呢? 首當(dāng)是看排的隊(duì)人數(shù),5個(gè)人總比20人要快吧?除了數(shù)人頭,我們也常??纯辞懊嫒速?gòu)買(mǎi)的東西多少,如果前面有個(gè)采購(gòu)了一星期食品的大媽,那么可以考慮換個(gè)隊(duì)排了。還有就是收銀員的速度了,如果碰上了連錢(qián)都點(diǎn)不清楚的新手,那就有的等了。另外,時(shí)機(jī)也很重要,可能 5分鐘前還人滿為患的收款臺(tái),現(xiàn)在已是人去樓空,這時(shí)候交款可是很爽啊,當(dāng)然,前提是那過(guò)去的 5 分鐘里所做的事情比排隊(duì)要有意義(不過(guò)我還沒(méi)發(fā)現(xiàn)什么事情比排隊(duì)還無(wú)聊的)。
I/O 系統(tǒng)也和超市排隊(duì)有很多類似之處:
r/s+w/s 類似于交款人的總數(shù)
平均隊(duì)列長(zhǎng)度(avgqu-sz)類似于單位時(shí)間里平均排隊(duì)人的個(gè)數(shù)
平均服務(wù)時(shí)間(svctm)類似于收銀員的收款速度
平均等待時(shí)間(await)類似于平均每人的等待時(shí)間
平均I/O數(shù)據(jù)(avgrq-sz)類似于平均每人所買(mǎi)的東西多少
I/O 操作率 (%util)類似于收款臺(tái)前有人排隊(duì)的時(shí)間比例。
我們可以根據(jù)這些數(shù)據(jù)分析出 I/O 請(qǐng)求的模式,以及 I/O 的速度和響應(yīng)時(shí)間。
下面是別人寫(xiě)的這個(gè)參數(shù)輸出的分析
# iostat -x 1
avg-cpu: %user %nice %sys %idle
16.24 0.00 4.31 79.44
Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s rkB/s wkB/s avgrq-sz avgqu-sz await svctm %util
/dev/cciss/c0d0
0.00 44.90 1.02 27.55 8.16 579.59 4.08 289.80 20.57 22.35 78.21 5.00 14.29
/dev/cciss/c0d0p1
0.00 44.90 1.02 27.55 8.16 579.59 4.08 289.80 20.57 22.35 78.21 5.00 14.29
/dev/cciss/c0d0p2
0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
上面的 iostat 輸出表明秒有 28.57 次設(shè)備 I/O 操作: 總IO(io)/s = r/s(讀) +w/s(寫(xiě)) = 1.02+27.55 = 28.57 (次/秒) 其中寫(xiě)操作占了主體 (w:r = 27:1)。
平均每次設(shè)備 I/O 操作只需要 5ms 就可以完成,但每個(gè)I/O 請(qǐng)求卻需要等上 78ms,為什么? 因?yàn)榘l(fā)出的 I/O 請(qǐng)求太多 (每秒鐘約29 個(gè)),假設(shè)這些請(qǐng)求是同時(shí)發(fā)出的,那么平均等待時(shí)間可以這樣計(jì)算:
平均等待時(shí)間 = 單個(gè)I/O 服務(wù)時(shí)間 * ( 1 + 2 + ... + 請(qǐng)求總數(shù)-1) / 請(qǐng)求總數(shù)
應(yīng)用到上面的例子: 平均等待時(shí)間 = 5ms * (1+2+...+28)/29 = 70ms,和 iostat 給出的78ms 的平均等待時(shí)間很接近。這反過(guò)來(lái)表明 I/O 是同時(shí)發(fā)起的。
每秒發(fā)出的 I/O 請(qǐng)求很多 (約29 個(gè)),平均隊(duì)列卻不長(zhǎng) (只有2 個(gè)左右),這表明這 29 個(gè)請(qǐng)求的到來(lái)并不均勻,大部分時(shí)間 I/O 是空閑的。
一秒中有 14.29% 的時(shí)間 I/O 隊(duì)列中是有請(qǐng)求的,也就是說(shuō),85.71% 的時(shí)間里 I/O 系統(tǒng)無(wú)事可做,所有 29 個(gè)I/O 請(qǐng)求都在142毫秒之內(nèi)處理掉了。
delta(ruse+wuse)/delta(io) = await = 78.21 => delta(ruse+wuse)/s=78.21 * delta(io)/s = 78.21*28.57 =2232.8,表明每秒內(nèi)的I/O請(qǐng)求總共需要等待2232.8ms。所以平均隊(duì)列長(zhǎng)度應(yīng)為 2232.8ms/1000ms = 2.23,而iostat 給出的平均隊(duì)列長(zhǎng)度 (avgqu-sz) 卻為22.35,為什么?因?yàn)閕ostat 中有bug,avgqu-sz值應(yīng)為2.23,而不是22.35。
※附帶說(shuō)明下,我用iostat對(duì)服務(wù)器檢測(cè)時(shí),一般用iostat -d命令;而返回的結(jié)果,我關(guān)注的一般是tps、blk_read/s、blk_wrth/s這三項(xiàng),我一般是拿三臺(tái)不同型號(hào)的服務(wù)器在相同環(huán)境下作對(duì)比測(cè)試,這樣性能上的差異,一下子就出來(lái)了。
關(guān)于iostat如何對(duì)linux硬盤(pán)IO性能進(jìn)行檢測(cè)問(wèn)題的解答就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,如果你還有很多疑惑沒(méi)有解開(kāi),可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識(shí)。