方法一、nload工具
為東洲等地區(qū)用戶提供了全套網(wǎng)頁設計制作服務,及東洲網(wǎng)站建設行業(yè)解決方案。主營業(yè)務為做網(wǎng)站、網(wǎng)站設計、東洲網(wǎng)站設計,以傳統(tǒng)方式定制建設網(wǎng)站,并提供域名空間備案等一條龍服務,秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務。我們深信只要達到每一位用戶的要求,就會得到認可,從而選擇與我們長期合作。這樣,我們也可以走得更遠!
查看參數(shù)幫助命令:
nload –help
-a :這個好像是全部數(shù)據(jù)的刷新時間周期,單位是秒,默認是300.
-i :進入網(wǎng)卡的流量圖的顯示比例最大值設置,默認10240 kBit/s.
-m :不顯示流量圖,只顯示統(tǒng)計數(shù)據(jù)。
-o :出去網(wǎng)卡的流量圖的顯示比例最大值設置,默認10240 kBit/s.
-t :顯示數(shù)據(jù)的刷新時間間隔,單位是毫秒,默認500。
-u :設置右邊Curr、Avg、Min、Max的數(shù)據(jù)單位,默認是自動變的.注意大小寫單位不同!
h|b|k|m|g h: auto, b: Bit/s, k: kBit/s, m: MBit/s etc.
H|B|K|M|G H: auto, B: Byte/s, K: kByte/s, M: MByte/s etc.
-U:設置右邊Ttl的數(shù)據(jù)單位,默認是自動變的.注意大小寫單位不同(與-u相同)!
Devices:自定義監(jiān)控的網(wǎng)卡,默認是全部監(jiān)控的,使用左右鍵切換。
如只監(jiān)控eth0命令: nload eth0
方法二、iftop工具
1、iftop界面相關說明
界面上面顯示的是類似刻度尺的刻度范圍,為顯示流量圖形的長條作標尺用的。
中間的= =這兩個左右箭頭,表示的是流量的方向。
TX: 發(fā)送流量
RX: 接收流量
TOTAL:總流量
Cumm: 運行iftop到目前時間的總流量
peak: 流量峰值
rates: 分別表示過去 2s 10s 40s 的平均流量
2、iftop相關參數(shù)
常用的參數(shù) 《Linux就該這么學》
-i 設定監(jiān)測的網(wǎng)卡,如:# iftop -i eth1
-B 以bytes為單位顯示流量(默認是bits),如:# iftop -B
-n 使host信息默認直接都顯示IP,如:# iftop -n
-N 使端口信息默認直接都顯示端口號,如: # iftop -N
-F 顯示特定網(wǎng)段的進出流量,如# iftop -F 10.10.1.0/24或# iftop -F 10.10.1.0/255.255.255.0
-h(display this message),幫助,顯示參數(shù)信息
-p 使用這個參數(shù)后,中間的列表顯示的本地主機信息,出現(xiàn)了本機以外的IP信息;
-b 使流量圖形條默認就顯示;
-f 這個暫時還不太會用,過濾計算包用的;
-P 使host信息及端口信息默認就都顯示;
-m設置界面最上邊的刻度的最大值,刻度分五個大段顯示,例:# iftop -m 100M
進入iftop畫面后的一些操作命令(注意大小寫)
按h切換是否顯示幫助;
按n切換顯示本機的IP或主機名;
按s切換是否顯示本機的host信息;
按d切換是否顯示遠端目標主機的host信息;
按t切換顯示格式為2行/1行/只顯示發(fā)送流量/只顯示接收流量;
按N切換顯示端口號或端口服務名稱;
按S切換是否顯示本機的端口信息;
按D切換是否顯示遠端目標主機的端口信息;
按p切換是否顯示端口信息;
按P切換暫停/繼續(xù)顯示;
按b切換是否顯示平均流量圖形條;
按B切換計算2秒或10秒或40秒內(nèi)的平均流量;
按T切換是否顯示每個連接的總流量;
按l打開屏幕過濾功能,輸入要過濾的字符,比如ip,按回車后,屏幕就只顯示這個IP相關的流量信息;
按L切換顯示畫面上邊的刻度;刻度不同,流量圖形條會有變化;
按j或按k可以向上或向下滾動屏幕顯示的連接記錄;
按1或2或3可以根據(jù)右側顯示的三列流量數(shù)據(jù)進行排序;
按根據(jù)左邊的本機名或IP排序;
按根據(jù)遠端目標主機的主機名或IP排序;
按o切換是否固定只顯示當前的連接;
按f可以編輯過濾代碼,這是翻譯過來的說法,我還沒用過這個!
按!可以使用Shell命令,這個沒用過!沒搞明白啥命令在這好用呢!
按q退出監(jiān)控。
方法三、 ifstat
參數(shù):
-a 監(jiān)測能檢測到的所有網(wǎng)絡接口的狀態(tài)信息
-z 隱藏流量是無的接口,例如那些接口雖然啟動了但是未用的
-i 指定要監(jiān)測的接口,后面跟網(wǎng)絡接口名
時間:
-T 報告所有監(jiān)測接口的全部帶寬
-w 用指定的列寬,而不是為了適應接口名稱的長度而去自動放大列寬
-W 如果內(nèi)容比終端窗口的寬度還要寬就自動換行
-b 用kbits/s顯示帶寬而不是kbytes/s
處理問題時必定不能盲狙,將所有解決辦法都試上一遍。這生產(chǎn)環(huán)境中,解決出現(xiàn)的問題是最優(yōu)先的事情,當然前提是這問題會影響用戶的使用或即將影響到的。
處理每個問題必然可按具體問題進行分類,根據(jù)每一類按對應的解決思路來執(zhí)行。
但像處理一個網(wǎng)絡問題的時候,上至系統(tǒng)防火墻的配置、下至硬件故障。如果處理一個問題都按固定流程來進行的話,那必然效率將非常低下。下為處理網(wǎng)絡故障的一般流程。
1、網(wǎng)絡硬件問題檢查。???????????????????? (機率較低)
2、檢查網(wǎng)卡能否正常工作。??????????? (較高、主要表現(xiàn)為人為配置錯誤)
3、檢查局域網(wǎng)之間聯(lián)機是否正常。(非常高)
4、檢查DNS是否設定正確。??????????? (較低)
5、服務是否正常打開。???????????????????? (低)
6、檢查訪問權限是否打開。??????????? (較高)
假如從1至6是標準的處理網(wǎng)絡問題的流程,這樣的處理方式效率低下。處理問題可以有整體的流程,但是實際操作中可先對出現(xiàn)機率更高的步驟進行檢查、或采取2分法縮小產(chǎn)生問題的范圍,雖然上述較的兩個方法不一定對所有問題都試用,但對于大多數(shù)的網(wǎng)絡問題來說處理效率有者顯著的提升。
個人總結的情況如下。
1、lsmod | grep ip??????????? 查看相關的網(wǎng)卡模塊是否已加載
2、ifconfig -a??????????????????? 能使用該命令查找到對應網(wǎng)卡配置信息,則說明網(wǎng)卡驅動程序正常
3、使用ping命令、依次ping自己、ping局域網(wǎng)主機、ping網(wǎng)關
ping自己異常,問題:服務異常、網(wǎng)卡配置未生效
ping局域網(wǎng)主機異常,問題:配置文件有誤、網(wǎng)卡配置未生效、網(wǎng)線損壞
ping網(wǎng)關異常,問題:配置文件有誤、網(wǎng)卡配置未生效
4、當前3步還不能正常上外網(wǎng)的話。所有route查看默認路由表。
處理方法:刪除不必要的路由信息,并保證默認路由是從對應網(wǎng)關地址出去的。
5、臨時停止iptables服務、SELinux服務、NetworkManager服務
6、如能上網(wǎng)但訪問域名有異常時,那將需要檢查/etc/hosts、/etc/resolv.conf兩個配置
7、假如以上6步檢查完畢之后,還發(fā)現(xiàn)不能上網(wǎng)。有如下可能。
7.1、主機MAC地址被路由器禁止上網(wǎng)
7.2、外網(wǎng)服務異常。如寬帶賬號欠費、光纖被挖斷等物理攻擊。
# ifdown 網(wǎng)卡設備名
# 禁用該網(wǎng)卡設備
# ifup 網(wǎng)卡設備名
# 啟用該網(wǎng)卡設備
netstat:查看網(wǎng)絡相關狀態(tài)的
ifconfig:顯示配置信息
ping:查看網(wǎng)絡鏈接
一、uptime命令
這個命令可以快速查看機器的負載情況。在Linux系統(tǒng)中,這些數(shù)據(jù)表示等待CPU資源的進程和阻塞在不可中斷IO進程(進程狀態(tài)為D)的數(shù)量。這些數(shù)據(jù)可以讓我們對系統(tǒng)資源使用有一個宏觀的了解。
命令的輸出分別表示1分鐘、5分鐘、15分鐘的平均負載情況。通過這三個數(shù)據(jù),可以了解服務器負載是在趨于緊張還是趨于緩解。如果1分鐘平均負載很高,而15分鐘平均負載很低,說明服務器正在命令高負載情況,需要進一步排查CPU資源都消耗在了哪里。反之,如果15分鐘平均負載很高,1分鐘平均負載較低,則有可能是CPU資源緊張時刻已經(jīng)過去。
上面例子中的輸出,可以看見最近1分鐘的平均負載非常高,且遠高于最近15分鐘負載,因此我們需要繼續(xù)排查當前系統(tǒng)中有什么進程消耗了大量的資源??梢酝ㄟ^下文將會介紹的vmstat、mpstat等命令進一步排查。
二、dmesg命令
該命令會輸出系統(tǒng)日志的最后10行。示例中的輸出,可以看見一次內(nèi)核的oom kill和一次TCP丟包。這些日志可以幫助排查性能問題。千萬不要忘了這一步。
三、vmstat命令
vmstat(8) 命令,每行會輸出一些系統(tǒng)核心指標,這些指標可以讓我們更詳細的了解系統(tǒng)狀態(tài)。后面跟的參數(shù)1,表示每秒輸出一次統(tǒng)計信息,表頭提示了每一列的含義,這幾介紹一些和性能調優(yōu)相關的列:
r:等待在CPU資源的進程數(shù)。這個數(shù)據(jù)比平均負載更加能夠體現(xiàn)CPU負載情況,數(shù)據(jù)中不包含等待IO的進程。如果這個數(shù)值大于機器CPU核數(shù),那么機器的CPU資源已經(jīng)飽和。
free:系統(tǒng)可用內(nèi)存數(shù)(以千字節(jié)為單位),如果剩余內(nèi)存不足,也會導致系統(tǒng)性能問題。下文介紹到的free命令,可以更詳細的了解系統(tǒng)內(nèi)存的使用情況。
si,so:交換區(qū)寫入和讀取的數(shù)量。如果這個數(shù)據(jù)不為0,說明系統(tǒng)已經(jīng)在使用交換區(qū)(swap),機器物理內(nèi)存已經(jīng)不足。
us, sy, id, wa, st:這些都代表了CPU時間的消耗,它們分別表示用戶時間(user)、系統(tǒng)(內(nèi)核)時間(sys)、空閑時間(idle)、IO等待時間(wait)和被偷走的時間(stolen,一般被其他虛擬機消耗)。
上述這些CPU時間,可以讓我們很快了解CPU是否出于繁忙狀態(tài)。一般情況下,如果用戶時間和系統(tǒng)時間相加非常大,CPU出于忙于執(zhí)行指令。如果IO等待時間很長,那么系統(tǒng)的瓶頸可能在磁盤IO。
示例命令的輸出可以看見,大量CPU時間消耗在用戶態(tài),也就是用戶應用程序消耗了CPU時間。這不一定是性能問題,需要結合r隊列,一起分析。
四、mpstat命令
該命令可以顯示每個CPU的占用情況,如果有一個CPU占用率特別高,那么有可能是一個單線程應用程序引起的。
五、pidstat命令
pidstat命令輸出進程的CPU占用率,該命令會持續(xù)輸出,并且不會覆蓋之前的數(shù)據(jù),可以方便觀察系統(tǒng)動態(tài)。如上的輸出,可以看見兩個JAVA進程占用了將近1600%的CPU時間,既消耗了大約16個CPU核心的運算資源。
六、iostat命令
r/s, w/s, rkB/s, wkB/s:分別表示每秒讀寫次數(shù)和每秒讀寫數(shù)據(jù)量(千字節(jié))。讀寫量過大,可能會引起性能問題。
await:IO操作的平均等待時間,單位是毫秒。這是應用程序在和磁盤交互時,需要消耗的時間,包括IO等待和實際操作的耗時。如果這個數(shù)值過大,可能是硬件設備遇到了瓶頸或者出現(xiàn)故障。
avgqu-sz:向設備發(fā)出的請求平均數(shù)量。如果這個數(shù)值大于1,可能是硬件設備已經(jīng)飽和(部分前端硬件設備支持并行寫入)。
%util:設備利用率。這個數(shù)值表示設備的繁忙程度,經(jīng)驗值是如果超過60,可能會影響IO性能(可以參照IO操作平均等待時間)。如果到達100%,說明硬件設備已經(jīng)飽和。
如果顯示的是邏輯設備的數(shù)據(jù),那么設備利用率不代表后端實際的硬件設備已經(jīng)飽和。值得注意的是,即使IO性能不理想,也不一定意味這應用程序性能會不好,可以利用諸如預讀取、寫緩存等策略提升應用性能。
七、free命令
free命令可以查看系統(tǒng)內(nèi)存的使用情況,-m參數(shù)表示按照兆字節(jié)展示。最后兩列分別表示用于IO緩存的內(nèi)存數(shù),和用于文件系統(tǒng)頁緩存的內(nèi)存數(shù)。需要注意的是,第二行-/+ buffers/cache,看上去緩存占用了大量內(nèi)存空間。
這是Linux系統(tǒng)的內(nèi)存使用策略,盡可能的利用內(nèi)存,如果應用程序需要內(nèi)存,這部分內(nèi)存會立即被回收并分配給應用程序。因此,這部分內(nèi)存一般也被當成是可用內(nèi)存。
如果可用內(nèi)存非常少,系統(tǒng)可能會動用交換區(qū)(如果配置了的話),這樣會增加IO開銷(可以在iostat命令中提現(xiàn)),降低系統(tǒng)性能。
八、sar命令
sar命令在這里可以查看網(wǎng)絡設備的吞吐率。在排查性能問題時,可以通過網(wǎng)絡設備的吞吐量,判斷網(wǎng)絡設備是否已經(jīng)飽和。如示例輸出中,eth0網(wǎng)卡設備,吞吐率大概在22 Mbytes/s,既176 Mbits/sec,沒有達到1Gbit/sec的硬件上限。
sar命令在這里用于查看TCP連接狀態(tài),其中包括:
active/s:每秒本地發(fā)起的TCP連接數(shù),既通過connect調用創(chuàng)建的TCP連接;
passive/s:每秒遠程發(fā)起的TCP連接數(shù),即通過accept調用創(chuàng)建的TCP連接;
retrans/s:每秒TCP重傳數(shù)量;
TCP連接數(shù)可以用來判斷性能問題是否由于建立了過多的連接,進一步可以判斷是主動發(fā)起的連接,還是被動接受的連接。TCP重傳可能是因為網(wǎng)絡環(huán)境惡劣,或者服務器壓
九、top命令
top命令包含了前面好幾個命令的檢查的內(nèi)容。比如系統(tǒng)負載情況(uptime)、系統(tǒng)內(nèi)存使用情況(free)、系統(tǒng)CPU使用情況(vmstat)等。因此通過這個命令,可以相對全面的查看系統(tǒng)負載的來源。同時,top命令支持排序,可以按照不同的列排序,方便查找出諸如內(nèi)存占用最多的進程、CPU占用率最高的進程等。
但是,top命令相對于前面一些命令,輸出是一個瞬間值,如果不持續(xù)盯著,可能會錯過一些線索。這時可能需要暫停top命令刷新,來記錄和比對數(shù)據(jù)。