本文轉自: https://juejin.im/post/59e6c1f26fb9a0451c397a8c
“專業(yè)、務實、高效、創(chuàng)新、把客戶的事當成自己的事”是我們每一個人一直以來堅持追求的企業(yè)文化。 創(chuàng)新互聯(lián)建站是您可以信賴的網(wǎng)站建設服務商、專業(yè)的互聯(lián)網(wǎng)服務提供商! 專注于成都網(wǎng)站制作、成都網(wǎng)站建設、軟件開發(fā)、設計服務業(yè)務。我們始終堅持以客戶需求為導向,結合用戶體驗與視覺傳達,提供有針對性的項目解決方案,提供專業(yè)性的建議,創(chuàng)新互聯(lián)建站將不斷地超越自我,追逐市場,引領市場!本系列文章將整理到我在GitHub上的《Java面試指南》倉庫,更多精彩內容請到我的倉庫里查看
https://github.com/h3pl/Java-Tutorial
喜歡的話麻煩點下Star哈
文章將同步到我的個人博客:
www.how2playlife.com
本文是微信公眾號【Java技術江湖】的《深入理解JVM虛擬機》其中一篇,本文部分內容來源于網(wǎng)絡,為了把本文主題講得清晰透徹,也整合了很多我認為不錯的技術博客內容,引用其中了一些比較好的博客文章,如有侵權,請聯(lián)系作者。
該系列博文會告訴你如何從入門到進階,一步步地學習JVM基礎知識,并上手進行JVM調優(yōu)實戰(zhàn),JVM是每一個Java工程師必須要學習和理解的知識點,你必須要掌握其實現(xiàn)原理,才能更完整地了解整個Java技術體系,形成自己的知識框架。
為了更好地總結和檢驗你的學習成果,本系列文章也會提供每個知識點對應的面試題以及參考答案。
如果對本系列文章有什么建議,或者是有什么疑問的話,也可以關注公眾號【Java技術江湖】聯(lián)系作者,歡迎你參與本系列博文的創(chuàng)作和修訂。
在常見的線上問題時候,我們多數(shù)會遇到以下問題:
- 內存泄露
- 某個進程突然cpu飆升
- 線程死鎖
- 響應變慢…等等其他問題。
如果遇到了以上這種問題,在線下可以有各種本地工具支持查看,但到線上了,就沒有這么多的本地調試工具支持,我們該如何基于監(jiān)控工具來進行定位問題?
我們一般會基于數(shù)據(jù)收集來定位,而數(shù)據(jù)的收集離不開監(jiān)控工具的處理,比如:運行日志、異常堆棧、GC日志、線程快照、堆快照等。經(jīng)常使用恰當?shù)姆治龊捅O(jiān)控工具可以加快我們的分析數(shù)據(jù)、定位解決問題的速度。以下我們將會詳細介紹。
jps [options] [hostid]復制代碼
如果不指定hostid就默認為當前主機或服務器。
命令行參數(shù)選項說明如下:
-q 不輸出類名、Jar名和傳入main方法的參數(shù)
- l 輸出main類或Jar的全限名
-m 輸出傳入main方法的參數(shù)
- v 輸出傳入JVM的參數(shù)復制代碼
jstat 是用于見識虛擬機各種運行狀態(tài)信息的命令行工具。它可以顯示本地或者遠程虛擬機進程中的類裝載、內存、垃圾收集、jit編譯等運行數(shù)據(jù),它是線上定位jvm性能的選工具。
命令格式:
jstat [ generalOption | outputOptions vmid [interval[s|ms] [count]] ]
generalOption - 單個的常用的命令行選項,如-help, -options, 或 -version。
outputOptions -一個或多個輸出選項,由單個的statOption選項組成,可以和-t, -h, and -J等選項配合使用。復制代碼
參數(shù)選項:
Option | Displays | Ex |
---|---|---|
class | 用于查看類加載情況的統(tǒng)計 | jstat -class pid:顯示加載class的數(shù)量,及所占空間等信息。 |
compiler | 查看HotSpot中即時編譯器編譯情況的統(tǒng)計 | jstat -compiler pid:顯示VM實時編譯的數(shù)量等信息。 |
gc | 查看JVM中堆的垃圾收集情況的統(tǒng)計 | jstat -gc pid:可以顯示gc的信息,查看gc的次數(shù),及時間。其中最后五項,分別是young gc的次數(shù),young gc的時間,full gc的次數(shù),full gc的時間,gc的總時間。 |
gccapacity | 查看新生代、老生代及持久代的存儲容量情況 | jstat -gccapacity:可以顯示,VM內存中三代(young,old,perm)對象的使用和占用大小 |
gccause | 查看垃圾收集的統(tǒng)計情況(這個和-gcutil選項一樣),如果有發(fā)生垃圾收集,它還會顯示最后一次及當前正在發(fā)生垃圾收集的原因。 | jstat -gccause:顯示gc原因 |
gcnew | 查看新生代垃圾收集的情況 | jstat -gcnew pid:new對象的信息 |
gcnewcapacity | 用于查看新生代的存儲容量情況 | jstat -gcnewcapacity pid:new對象的信息及其占用量 |
gcold | 用于查看老生代及持久代發(fā)生GC的情況 | jstat -gcold pid:old對象的信息 |
gcoldcapacity | 用于查看老生代的容量 | jstat -gcoldcapacity pid:old對象的信息及其占用量 |
gcpermcapacity | 用于查看持久代的容量 | jstat -gcpermcapacity pid: perm對象的信息及其占用量 |
gcutil | 查看新生代、老生代及持代垃圾收集的情況 | jstat -util pid:統(tǒng)計gc信息統(tǒng)計 |
printcompilation | HotSpot編譯方法的統(tǒng)計 | jstat -printcompilation pid:當前VM執(zhí)行的信息 |
例如:
查看gc 情況執(zhí)行:jstat-gcutil 27777
命令格式:
jinfo[option] pid復制代碼
比如:獲取一些當前進程的jvm運行和啟動信息。
jmap命令用于生產(chǎn)堆轉存快照。打印出某個java進程(使用pid)內存內的,所有‘對象’的情況(如:產(chǎn)生那些對象,及其數(shù)量)。
命令格式:
jmap [ option ] pid
jmap [ option ] executable core
jmap [ option ] [server-id@]remote-hostname-or-IP復制代碼
參數(shù)選項:
-dump:[live,]format=b,file= 使用hprof二進制形式,輸出jvm的heap內容到文件=. live子選項是可選的,假如指定live選項,那么只輸出活的對象到文件.
-finalizerinfo 打印正等候回收的對象的信息.
-heap 打印heap的概要信息,GC使用的算法,heap的配置及wise heap的使用情況.
-histo[:live] 打印每個class的實例數(shù)目,內存占用,類全名信息. VM的內部類名字開頭會加上前綴”*”. 如果live子參數(shù)加上后,只統(tǒng)計活的對象數(shù)量.
-permstat 打印classload和jvm heap長久層的信息. 包含每個classloader的名字,活潑性,地址,父classloader和加載的class數(shù)量. 另外,內部String的數(shù)量和占用內存數(shù)也會打印出來.
-F 強迫.在pid沒有相應的時候使用-dump或者-histo參數(shù). 在這個模式下,live子參數(shù)無效.
-h | -help 打印輔助信息
-J 傳遞參數(shù)給jmap啟動的jvm. 復制代碼
jhat 命令與jamp搭配使用,用來分析map生產(chǎn)的堆快存儲快照。jhat內置了一個微型http/Html服務器,可以在瀏覽器找那個查看。不過建議盡量不用,既然有dumpt文件,可以從生產(chǎn)環(huán)境拉取下來,然后通過本地可視化工具來分析,這樣既減輕了線上服務器壓力,有可以分析的足夠詳盡(比如 MAT/jprofile/visualVm)等。
jstack用于生成java虛擬機當前時刻的線程快照。線程快照是當前java虛擬機內每一條線程正在執(zhí)行的方法堆棧的集合,生成線程快照的主要目的是定位線程出現(xiàn)長時間停頓的原因,如線程間死鎖、死循環(huán)、請求外部資源導致的長時間等待等。
命令格式:
jstack [ option ] pid
jstack [ option ] executable core
jstack [ option ] [server-id@]remote-hostname-or-IP復制代碼
參數(shù):
-F當’jstack [-l] pid’沒有相應的時候強制打印棧信息
-l長列表. 打印關于鎖的附加信息,例如屬于java.util.concurrent的ownable synchronizers列表.
-m打印java和native c/c++框架的所有棧信息.
-h | -help打印幫助信息
pid 需要被打印配置信息的java進程id,可以用jps查詢.復制代碼
后續(xù)的查找耗費最高cpu例子會用到。
對jvm監(jiān)控的常見可視化工具,除了jdk本身提供的Jconsole和visualVm以外,還有第三方提供的jprofilter,perfino,Yourkit,Perf4j,JProbe,MAT等。這些工具都極大的豐富了我們定位以及優(yōu)化jvm方式。
這些工具的使用,網(wǎng)上有很多教程提供,這里就不再過多介紹了。對于VisualVm來說,比較推薦使用,它除了對jvm的侵入性比較低以外,還是jdk團隊自己開發(fā)的,相信以后功能會更加豐富和完善。jprofilter對于第三方監(jiān)控工具,提供的功能和可視化最為完善,目前多數(shù)ide都支持其插件,對于上線前的調試以及性能調優(yōu)可以配合使用。
另外對于線上dump的heap信息,應該盡量拉去到線下用于可視化工具來分析,這樣分析更詳細。如果對于一些緊急的問題,必須需要通過線上監(jiān)控,可以采用 VisualVm的遠程功能來進行,這需要使用tool.jar下的MAT功能。
在線上有時候某個時刻,可能會出現(xiàn)應用某個時刻突然cpu飆升的問題。對此我們應該熟悉一些指令,快速排查對應代碼。
1.找到最耗CPU的進程
指令:top復制代碼
2.找到該進程下最耗費cpu的線程
指令:top -Hp pid復制代碼
3.轉換進制
printf “%x\n” 15332 // 轉換16進制(轉換后為0x3be4) 復制代碼
4.過濾指定線程,打印堆棧信息
指令:
jstack pid |grep 'threadPid' -C5 --color
jstack 13525 |grep '0x3be4' -C5 --color // 打印進程堆棧 并通過線程id,過濾得到線程堆棧信息。復制代碼
可以看到是一個上報程序,占用過多cpu了(以上例子只為示例,本身耗費cpu并不高)
有時候部署場景會有線程死鎖的問題發(fā)生,但又不常見。此時我們采用jstack查看下一下。比如說我們現(xiàn)在已經(jīng)有一個線程死鎖的程序,導致某些操作waiting中。
1.查找java進程id
指令:top 或者 jps 復制代碼
指令:jstack -l pid復制代碼
從輸出信息可以看到,有一個線程死鎖發(fā)生,并且指出了那行代碼出現(xiàn)的。如此可以快速排查問題。
java堆內的OOM異常是實際應用中常見的內存溢出異常。一般我們都是先通過內存映射分析工具(比如MAT)對dump出來的堆轉存快照進行分析,確認內存中對象是否出現(xiàn)問題。
當然了出現(xiàn)OOM的原因有很多,并非是堆中申請資源不足一種情況。還有可能是申請?zhí)噘Y源沒有釋放,或者是頻繁頻繁申請,系統(tǒng)資源耗盡。針對這三種情況我需要一一排查。
OOM的三種情況:
1.申請資源(內存)過小,不夠用。
2.申請資源太多,沒有釋放。
3.申請資源過多,資源耗盡。比如:線程過多,線程內存過大等。
1.排查申請申請資源問題。
指令:jmap -heap 11869 復制代碼
查看新生代,老生代堆內存的分配大小以及使用情況,看是否本身分配過小。
從上述排查,發(fā)現(xiàn)程序申請的內存沒有問題。
2.排查gc
特別是fgc情況下,各個分代內存情況。
指令:jstat -gcutil 11938 1000 每秒輸出一次gc的分代內存分配情況,以及gc時間復制代碼
3.查找最費內存的對象
指令: jmap -histo:live 11869 | more復制代碼
上述輸出信息中,大內存對象才161kb,屬于正常范圍。如果某個對象占用空間很大,比如超過了100Mb,應該著重分析,為何沒有釋放。
注意,上述指令:
jmap -histo:live 11869 | more
執(zhí)行之后,會造成jvm強制執(zhí)行一次fgc,在線上不推薦使用,可以采取dump內存快照,線下采用可視化工具進行分析,更加詳盡。
jmap -dump:format=b,file=/tmp/dump.dat 11869
或者采用線上運維工具,自動化處理,方便快速定位,遺失出錯時間。復制代碼
4.確認資源是否耗盡
- pstree 查看進程線程數(shù)量
- netstat 查看網(wǎng)絡連接數(shù)量
或者采用:
- ll /proc/${PID}/fd | wc -l // 打開的句柄數(shù)
- ll /proc/${PID}/task | wc -l (效果等同pstree -p | wc -l) //打開的線程數(shù)
以上就是一些常見的jvm命令應用。
一種工具的應用并非是萬能,包治百病,問題的解決往往是需要多種工具的結合才能更好的定位問題,無論使用何種分析工具,最重要的是熟悉每種工具的優(yōu)勢和劣勢。這樣才能取長補短,配合使用。
https://segmentfault.com/a/1190000009707894
https://www.cnblogs.com/hysum/p/7100874.html
http://c.biancheng.net/view/939.html
https://www.runoob.com/
https://blog.csdn.net/android_hl/article/details/53228348