這篇文章主要介紹了LINUX線上服務(wù)CPU100%問題如何處理,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對這個行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長期合作伙伴,公司提供的服務(wù)項(xiàng)目有:域名申請、網(wǎng)頁空間、營銷軟件、網(wǎng)站建設(shè)、任城網(wǎng)站維護(hù)、網(wǎng)站推廣。功能問題,通過日志,單步調(diào)試相對比較好定位。
性能問題,例如線上服務(wù)器CPU100%,如何找到相關(guān)服務(wù),如何定位問題代碼,更考驗(yàn)技術(shù)人的功底。
58到家架構(gòu)部,運(yùn)維部,58速運(yùn)技術(shù)部聯(lián)合進(jìn)行了一次線上服務(wù)CPU問題排查實(shí)戰(zhàn)演練,同學(xué)們反饋有收獲,特將實(shí)戰(zhàn)演練的試題和答案公布出來,希望對大家也有幫助。
題目
某服務(wù)器上部署了若干tomcat實(shí)例,即若干垂直切分的Java站點(diǎn)服務(wù),以及若干Java微服務(wù),突然收到運(yùn)維的CPU異常告警。
問:如何定位是哪個服務(wù)進(jìn)程導(dǎo)致CPU過載,哪個線程導(dǎo)致CPU過載,哪段代碼導(dǎo)致CPU過載?
步驟一、找到最耗CPU的進(jìn)程
工具:top
方法:
執(zhí)行top -c ,顯示進(jìn)程運(yùn)行信息列表
鍵入P (大寫p),進(jìn)程按照CPU使用率排序
圖示:
如上圖,最耗CPU的進(jìn)程PID為10765
步驟二:找到最耗CPU的線程
工具:top
方法:
top -Hp 10765 ,顯示一個進(jìn)程的線程運(yùn)行信息列表
鍵入P (大寫p),線程按照CPU使用率排序
圖示:
如上圖,進(jìn)程10765內(nèi),最耗CPU的線程PID為10804
步驟三:將線程PID轉(zhuǎn)化為16進(jìn)制
工具:printf
方法:printf “%x\n” 10804
圖示:
如上圖,10804對應(yīng)的16進(jìn)制是0x2a34,當(dāng)然,這一步可以用計(jì)算器。
之所以要轉(zhuǎn)化為16進(jìn)制,是因?yàn)槎褩@?,線程id是用16進(jìn)制表示的。
步驟四:查看堆棧,找到線程在干嘛
工具:pstack/jstack/grep
方法:jstack 10765 | grep ‘0x2a34’ -C5 --color
打印進(jìn)程堆棧
通過線程id,過濾得到線程堆棧
圖示:
如上圖,找到了耗CPU高的線程對應(yīng)的線程名稱“AsyncLogger-1”,以及看到了該線程正在執(zhí)行代碼的堆棧。
感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“LINUX線上服務(wù)CPU100%問題如何處理”這篇文章對大家有幫助,同時也希望大家多多支持創(chuàng)新互聯(lián),關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道,更多相關(guān)知識等著你來學(xué)習(xí)!