不同的linux系統(tǒng)有自己不同的監(jiān)控工具,通用的一般有這些。
平陽網(wǎng)站制作公司哪家好,找成都創(chuàng)新互聯(lián)!從網(wǎng)頁設計、網(wǎng)站建設、微信開發(fā)、APP開發(fā)、成都響應式網(wǎng)站建設公司等網(wǎng)站項目制作,到程序開發(fā),運營維護。成都創(chuàng)新互聯(lián)于2013年開始到現(xiàn)在10年的時間,我們擁有了豐富的建站經(jīng)驗和運維經(jīng)驗,來保證我們的工作的順利進行。專注于網(wǎng)站建設就選成都創(chuàng)新互聯(lián)。
1)CPU負荷
命令:sar、mpstat(hpux,AIX)、top/topas、vmstat、w、uptime、ps
2)虛擬內存使用(物理內存+交換區(qū))
命令:top/topas、vmstat、free、swapinfo(hpux)
3)磁盤I/O
命令:top/topas、iostat、lvmstat(AIX)
4)網(wǎng)絡負載
命令:netstat、ifconfig -s
Linux系統(tǒng)top命令的使用方法介紹
在Linux系統(tǒng)中top命令可以用來監(jiān)測進程的狀態(tài),也可以修改進程的優(yōu)先序列。本文就來教大家Linux系統(tǒng)中top命令的使用方法,一起來看一下。
1、主要選項
-d:后接秒數(shù),狀態(tài)更新的秒數(shù),默認5秒
-b:以批次的方式運行top,通常利用重定向將top的輸出重定向到文件
-n:結合-b使用,運行top幾次
-p:指定觀察的進程的'PID
2、在 top 執(zhí)行過程當中可以使用的按鍵命令:
?:顯示在 top 當中可以輸入按鍵命令
P:按CPU的利用率排序顯示;
M:按內存的利用率排序顯示;
N:以 PID排序!
T:由該進程使用的CPU時間累積 (TIME+) 排序。
k:給某個 PID 一個信號(signal)
r:給某個 PID 重新指定一個nice值。
q:退出top。
3、例子
$top -d 2 //每2秒更新一次運行狀態(tài)
$top -b -n 2 》 ~/tmp/top.txt //將2次運行的狀態(tài)信息導出到文件中
$top -d 2 -p 1425 //每2秒更新一次指定進程的運行狀態(tài)信息
以上就是Linux中top命令的使用方法的全部內容了,所以top命令的功能,有點類似微軟系統(tǒng)中進程管理器的功能,使用top命令可以監(jiān)控Linux的性能,具體方法可以參考:《如何使用top命令監(jiān)控Linux系統(tǒng)性能》
CPU資源時,按照以下步驟進行查找:
(一):通過【 top -p 12377 -H】 查看java進程的有哪些線程的運行情況;
和通過【jstack 12377 stack.log】生成Java線程的dump詳細信息;
先用top命令找出占用資源厲害的java進程id,如圖:# top
如上圖所示,java的進程id為’52554′,接下來用top命令單獨對這個進程中的所有線程作監(jiān)視:
1 top -p 52554 -H
# top視圖里面里面可以通過快捷鍵依次b ,x高亮顯示top的列找出需要的線程,默認CPU排序,Sh
記錄一下自己常用的linux系統(tǒng)命令,方便以后查閱,發(fā)覺記憶越來越不行了
找到最耗CPU的java線程ps命令
命令:ps -mp pid -o THREAD,tid,time 或者 ps -Lfp pid
結果展示:
這個命令的作用,主要是可以獲取到對應一個進程下的線程的一些信息。 比如你想分析一下一個java進程的一些運行瓶頸點,可以通過該命令找到所有當前Thread的占用CPU的時間,也就是這里的最后一列。
比如這里找到了一個TID : 30834 ,所占用的TIME時間最高。
通過 printf "%x\n" 30834 首先轉化成16進制, 繼續(xù)通過jstack命令dump出當前的jvm進程的堆棧信息。 通過Grep命令即可以查到對應16進制的線程id信息,很快就可以找到對應最耗CPU的代碼快在哪。
簡單的解釋下,jstack下這一串線程信息內容:
"DboServiceProcessor-4-thread-295" daemon prio=10 tid=0x00002aab047a9800 nid=0x7d9b waiting on condition [0x0000000046f66000]
nid : 對應的linux操作系統(tǒng)下的tid,就是前面轉化的16進制數(shù)字
tid: 這個應該是jvm的jmm內存規(guī)范中的唯一地址定位,如果你詳細分析jvm的一些內存數(shù)據(jù)時用得上,我自己還沒到那種程度,所以先放下
top命令
命令:top -Hp pid
結果顯示:
和前面的效果一下,你可以實時的跟蹤并獲取指定進程中最耗cpu的線程。 再用前面的方法提取到對應的線程堆棧信息。
判斷I/O瓶頸
mpstat命令
命令:mpstat -P ALL 1 1000
結果顯示:
注意一下這里面的%iowait列,CPU等待I/O操作所花費的時間。這個值持續(xù)很高通??赡苁荌/O瓶頸所導致的。
通過這個參數(shù)可以比較直觀的看出當前的I/O操作是否存在瓶頸
iostat命令
命令: iostat -m -x 1 1000
同樣你可以觀察對應的CPU中的%iowait數(shù)據(jù),除此之外iostat還提供了一些更詳細的I/O狀態(tài)數(shù)據(jù),比如比較重要的有:
avgqu-sz : The average queue length of the requests that were issued to the device. (磁盤隊列的請求長度,正常的話2,3比較好。可以和cpu的load一樣的理解)
await : The average time (in milliseconds) for I/O requests issued to the device to be served. (代表一個I/O操作從wait到完成的總時間)
svctm和%util都是代表處理該I/O請求花費的時間和CPU的時間比例。 判斷是否瓶頸時,這兩個參數(shù)不是主要的
r/s w/s 和 rMB/s wMB/s 都是代表當前系統(tǒng)處理的I/O的一些狀態(tài),前者是我們常說的tps,后者就是吞吐量。這也是評價一個系統(tǒng)的性能指標
pid命令
命令: pidstat -p pid -u -d -t -w -h 1 1000
結果顯示:
相當實用的一個命令,可以基于當個進程分析對應的性能數(shù)據(jù),包括CPU,I/O,IR , CS等,可以方便開發(fā)者更加精細化的觀察系統(tǒng)的運行狀態(tài)。不過pidstat貌似是在2.6內核的一些較新的版本才有,需要安裝sysstat包。
ubuntu下,可以通過sudo apt-get install sysstat進行安裝。
sar命令
命令:sar -x pid 1 1000
sar也可以指定對應的pid,關注固定的幾個參數(shù),沒有pidstat那么強大。 看不到對應的I/O, IR等信息。
sar的功能可以覆蓋mpstat , iostat的相關功能。
dstat命令
命令:dstat -y --tcp 1 1000
通過dstat --tcp可以比較方便的看到當前的tcp的各種狀態(tài),不需要每次netstat -nat去看
其他命令
netstat -natp : 查看對應的網(wǎng)絡鏈接,關注下Recv-Q , Send-Q , State。
lsof -p pid : 查找對應pid的文件句柄
lsof -i : 80 : 查找對應端口被哪個進程占用
lsof /tmp/1.txt :查找對應文件被哪個進程占用
tcpdump / wireshark :抓包分析工具
jstat / jmap / jstack / jps 等一系列的java監(jiān)控命令
最后
如果你想做一些性能調優(yōu)的工作,一定要善于利用一些工具進行關注相應的狀態(tài)。通過linux命令你可以比較方便的觀測到CPU , I/O , network等一些比較外圍的狀態(tài), 很多時候就已經(jīng)可以解決大部分的問題。jvm內部的一些運行狀態(tài)監(jiān)控,得需要借助一些特有的工具進行細粒度的觀測。
vmstat是Virtual Meomory Statistics(虛擬內存統(tǒng)計)的縮寫, 是實時系統(tǒng)監(jiān)控工具。該命令通過使用knlist子程序和/dev/kmen偽設備驅動器訪問這些數(shù)據(jù),輸出信息直接打印在屏幕。vmstat反饋的與CPU相關的信息包括:
(1)多少任務在運行
(2)CPU使用的情況
(3)CPU收到多少中斷
(4)發(fā)生多少上下文切換
1. sar
每兩秒刷新一次, 總共5次
[root@dbhost01 ~]# sar 2 5
Linux 2.6.32-504.el6.x86_64 (dbhost01) 03/30/2018 _x86_64_ (4 CPU)
02:53:15 PM CPU %user %nice %system %iowait %steal %idle
02:53:17 PM all 0.66 0.00 1.72 0.66 0.00 96.96
02:53:19 PM all 1.34 0.00 3.35 0.80 0.00 94.51
02:53:21 PM all 0.79 0.00 1.59 1.45 0.00 96.17
02:53:23 PM all 0.40 0.00 2.00 0.80 0.00 96.80
02:53:25 PM all 0.66 0.00 1.85 0.79 0.00 96.70
Average: all 0.77 0.00 2.10 0.90 0.00 96.23
2. top
top -a 按照內存降序
[root@dbhost01 ~]# top -a
top - 15:00:54 up 6:04, 1 user, load average: 0.31, 0.19, 0.11
Tasks: 306 total, 1 running, 305 sleeping, 0 stopped, 0 zombie
Cpu(s): 7.8%us, 2.4%sy, 0.0%ni, 88.9%id, 0.8%wa, 0.0%hi, 0.1%si, 0.0%st
Mem: 4048972k total, 3848576k used, 200396k free, 134844k buffers
Swap: 4194300k total, 1788k used, 4192512k free, 1835360k cached
3. vmstat
vmstat用于顯示虛擬內存,內核線程,磁盤,系統(tǒng)進程, CPU活動等統(tǒng)計信息。
需要安裝sysstat工具。
[root@dbhost01 ~]# vmstat
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
2 0 1788 202508 135064 1835920 0 0 32 26 96 276 1 2 95 1 0
[root@dbhost01 ~]#
[root@dbhost01 ~]# vmstat 2 5
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 1788 202336 135068 1836000 0 0 32 26 97 276 1 2 95 1 0
0 0 1788 202624 135068 1836000 0 0 25 29 4012 6682 0 1 98 1 0
0 0 1788 202624 135072 1836004 0 0 57 87 4003 6685 0 1 98 1 0
1 0 1788 202508 135072 1836004 0 0 57 33 4402 7353 1 1 98 0 0
0 0 1788 202540 135076 1836004 0 0 33 47 4002 6674 0 1 98 1 0
4. lsof(list open files)
[root@dbhost01 ~]# lsof | grep 1521
certmonge 2348 root 16r FIFO 0,8 0t0 15212 pipe
certmonge 2348 root 18r FIFO 0,8 0t0 15218 pipe
gipcd.bin 2754 grid 109u unix 0xffff880139152180 0t0 36936 socket
5. tcpdump
tcpdump -i eth1
15:24:28.777779 IP dbhost01.ssh 192.168.2.82.50990: Flags [P.], seq 393080:393596, ack 105, win 148, options [nop,nop,TS val 22996360 ecr 2443327], length 516
15:24:28.777809 IP dbhost01.ssh 192.168.2.82.50990: Flags [P.], seq 393080:393596, ack 105, win 148, options [nop,nop,TS val 22996360 ecr 2443327], length 516
15:24:28.778976 IP dbhost01.ssh 192.168.2.82.50990: Flags [P.], seq 393596:393968, ack 105, win 148, options [nop,nop,TS val 22996361 ecr 2443327], length 372
15:24:28.779011 IP dbhost01.ssh 192.168.2.82.50990: Flags [P.], seq 393596:393968, ack 105, win 148, options [nop,nop,TS val 22996361 ecr 2443327], length 372
15:24:28.779013 IP 192.168.2.82.50990 dbhost01.ssh: Flags [.], ack 393968, win 16652, options [nop,nop,TS val 2443327 ecr 22996360], length 0
15:24:28.779481 IP dbhost02-priv.23602 dbhost01-priv.24271: UDP, length 556
15:24:28.779585 IP dbhost01-priv.24271 dbhost02-priv.23602: UDP, length 80
15:24:28.779909 IP dbhost01-priv.24271 dbhost02-priv.23602: UDP, length 80
15:24:28.780584 IP dbhost01.ssh 192.168.2.82.50990: Flags [P.], seq 393968:394724, ack 105, win 148, options [nop,nop,TS val 22996362 ecr 2443327], length 756
15:24:28.780590 IP dbhost01.ssh 192.168.2.82.50990: Flags [P.], seq 393968:394724, ack 105, win 148, options [nop,nop,TS val 22996362 ecr 2443327], length 756
15:24:28.780820 IP dbhost01-priv.24271 dbhost02-priv.23602: UDP, length 556
15:24:28.782232 IP dbhost01.ssh 192.168.2.82.50990: Flags [P.], seq 394724:395176, ack 105, win 148, options [nop,nop,TS val 22996364 ecr 2443327], length 452
15:24:28.782235 IP dbhost01.ssh 192.168.2.82.50990: Flags [P.], seq 394724:395176, ack 105, win 148, options [nop,nop,TS val 22996364 ecr 2443327], length 452
6.netstat
[root@dbhost01 ~]# netstat -a | grep oracle
unix 2 [ ACC ] STREAM LISTENING 31861 /var/tmp/.oracle/ora_gipc_sdbhost01gridmyracdb-clusterCRFM_SIPC
unix 2 [ ACC ] STREAM LISTENING 33820 /var/tmp/.oracle/sdbhost01DBG_LOGD
unix 2 [ ACC ] STREAM LISTENING 41177 /var/tmp/.oracle/sdbhost01DBG_EVMD
unix 2 [ ACC ] STREAM LISTENING 65106 /var/tmp/.oracle/sAevm
unix 2 [ ACC ] STREAM LISTENING 65108 /var/tmp/.oracle/sSYSTEM.evm.acceptor.auth
7. htop
需要安裝
8. iostat
Total DISK READ: 91.48 K/s | Total DISK WRITE: 45.27 K/s
TID PRIO USER DISK READ DISK WRITE SWAPIN IO COMMAND
4071 be/4 oracle 30.18 K/s 0.00 B/s 0.00 % 4.69 % ora_lmon_orcl1
4117 be/4 oracle 60.36 K/s 15.09 K/s 0.00 % 3.69 % ora_ckpt_orcl1
2989 rt/4 grid 965.71 B/s 0.00 B/s 0.00 % 2.13 % ocssd.bin
4099 be/4 oracle 0.00 B/s 30.18 K/s 0.00 % 0.07 % ora_ckpt_test
2987 rt/4 grid 0.00 B/s 482.86 B/s 0.00 % 0.03 % ocssd.bin
2979 rt/3 root 0.00 B/s 3.77 K/s 0.00 % 0.00 % ologgerd -M -d /g01/grid/app/11.2.0/grid/crf/db/dbhost01
2980 rt/3 root 0.00 B/s 15.09 K/s 0.00 % 0.00 % ologgerd -M -d /g01/grid/app/11.2.0/grid/crf/db/dbhost01
9. iftop(流量監(jiān)控工具)