您好,下面這幾個命令組合對于管理RS/6000 AIX系統(tǒng)有幫助:
創(chuàng)新互聯(lián)是一家企業(yè)級云計(jì)算解決方案提供商,超15年IDC數(shù)據(jù)中心運(yùn)營經(jīng)驗(yàn)。主營GPU顯卡服務(wù)器,站群服務(wù)器,成都移動機(jī)房托管,海外高防服務(wù)器,機(jī)柜大帶寬、租用·托管,動態(tài)撥號VPS,海外云手機(jī),海外云服務(wù)器,海外服務(wù)器租用托管等。
(1)顯示10個消耗CPU最多的進(jìn)程:
# ps aux |head -1 ;ps aux |sort -rn +2 |head –10
(2)顯示10個消耗存儲空間最多的進(jìn)程:
# ps aux |head -1 ;ps aux |sort -rn +3 |head -10
(3)按順序顯示系統(tǒng)中受罰的進(jìn)程:
#ps -eakl |head -1 ;ps -eakl |sort -rn +5
(4)按優(yōu)先級順序顯示系統(tǒng)中的進(jìn)程:
#ps -eakl |sort -n +6 |head
(5)按處理時間為順序顯示系統(tǒng)中的前十個進(jìn)程:
#ps vx |head -1 ;ps vx |grep -v PID |sort -rn +3 |head –10
(6)按實(shí)際內(nèi)存使用的多少順序顯示系統(tǒng)中的前十個進(jìn)程:
#ps vx |head -1 ;ps vx |grep -v PID |sort -rn +6 |head –10
(7)按換入頁面的多少順序顯示系統(tǒng)中的前10個進(jìn)程:
#ps vx |head -1 ;ps vx |grep -v PID |sort -rn +4 |head -10
或者使用topas命令,左下角欄:
Name PID CPU% PgSp Owner % Used 1.1
topas 962936 0.3 5.5 saqq NFS (calls/sec) % Free 98.8
sched 4386 0.0 0.4 root ServerV2 0
getty 123094 0.0 0.4 root ClientV2 0 Press:
gil 28974 0.0 0.9 root ServerV3 0 "h" for help
db2fmp 520462 0.0 34.7 db2idep
看cpu列
定位瓶頸的話就不好說了,要看程序的源碼了,需要優(yōu)化
Linux系統(tǒng)擁有非常靈活和強(qiáng)大的日志功能,可以保存幾乎所有的操作記錄,并可以從中檢索出我們需要的信息。
大部分Linux發(fā)行版默認(rèn)的日志守護(hù)進(jìn)程為 syslog,位于 /etc/syslog 或 /etc/syslogd,默認(rèn)配置文件為 /etc/syslog.conf,任何希望生成日志的程序都可以向 syslog 發(fā)送信息。
Linux系統(tǒng)內(nèi)核和許多程序會產(chǎn)生各種錯誤信息、警告信息和其他的提示信息,這些信息對管理員了解系統(tǒng)的運(yùn)行狀態(tài)是非常有用的,所以應(yīng)該把它們寫到日志文件中去。完成這個過程的程序就是syslog。syslog可以根據(jù)日志的類別和優(yōu)先級將日志保存到不同的文件中。例如,為了方便查閱,可以把內(nèi)核信息與其他信息分開,單獨(dú)保存到一個獨(dú)立的日志文件中。默認(rèn)配置下,日志文件通常都保存在“/var/log”目錄下。
本文介紹在Linux HA集群中的仲裁和分區(qū)概念。
集群正常工作時,所有節(jié)點(diǎn)都在一個分區(qū)內(nèi)(partition),分區(qū)內(nèi)的所有節(jié)點(diǎn)將選舉出一個仲裁節(jié)點(diǎn),這個仲裁節(jié)點(diǎn)負(fù)責(zé)向其他節(jié)點(diǎn)發(fā)送集群控制命令。當(dāng)網(wǎng)絡(luò)發(fā)生故障時,集群中的節(jié)點(diǎn)發(fā)現(xiàn)無法和仲裁節(jié)點(diǎn)通信,則會在可通信的范圍內(nèi)重新選舉一個新的仲裁節(jié)點(diǎn)。此時集群內(nèi)可能出現(xiàn)多個仲裁節(jié)點(diǎn),每個仲裁節(jié)點(diǎn)的管理范圍為一個分區(qū)。
下文中將通過防火墻策略的設(shè)置模擬集群網(wǎng)絡(luò)中通信出現(xiàn)異常的各種情況,如:
通過防火墻策略可以精準(zhǔn)控制兩兩節(jié)點(diǎn)之間的連通性,使我們能更準(zhǔn)確的了解在網(wǎng)絡(luò)連通性發(fā)生變化對集群的影響。
在所有節(jié)點(diǎn)上啟動防火墻,并添加策略對整個管理網(wǎng)絡(luò)192.168.56.0/24放通。
保存上述策略,之后在實(shí)驗(yàn)過程會使用iptables命名加入新策略模擬網(wǎng)絡(luò)通信異常效果,如果需要恢復(fù)網(wǎng)絡(luò)通信正常狀態(tài),直接不保存策略重啟firewalld服務(wù)即可。
通過pcs status查看集群狀態(tài):
上述結(jié)果顯示當(dāng)前集群只有一個分區(qū),分區(qū)內(nèi)的節(jié)點(diǎn)包括全部3臺主機(jī),仲裁節(jié)點(diǎn)是ha-host3,這表示集群間的通信是完好的。下圖顯示當(dāng)前集群狀態(tài):
在ha-host1上添加以下策略:
該策略將使得ha-host1和ha-host3之間的通信中斷,在所有節(jié)點(diǎn)上查看集群狀態(tài):
上面的結(jié)果顯示,ha-host1失去和當(dāng)前仲裁節(jié)點(diǎn)ha-host3的聯(lián)系之后,和ha-host2一起組成新的分區(qū)并選舉出ha-host2作為新的仲裁節(jié)點(diǎn)。有趣的是ha-host2和ha-host3的通信并未中斷,但是他被“優(yōu)先級較高的ha-host1搶走并推舉為老大”,剩下ha-host3獨(dú)自留在其自身所在的分區(qū)。此時ha-host3所在的分區(qū)提示了“partition WITHOUT quorum”,表示該分區(qū)中的節(jié)點(diǎn)數(shù)目不超過一半。
下圖顯示當(dāng)前集群狀態(tài):
在ha-host1上再添加策略:
使其和當(dāng)前的仲裁節(jié)點(diǎn)ha-host2的通信中斷,集群狀態(tài)變?yōu)椋?/p>
發(fā)現(xiàn)ha-host2和ha-host3一起組成了新的分區(qū),由于ha-host1所在分區(qū)節(jié)點(diǎn)數(shù)不足一半,無法啟動資源,虛擬ip資源vip被切換到了ha-host2上。下圖顯示當(dāng)前集群狀態(tài):
如果再把ha-host2和ha-host3直接的通信中斷,此時3個節(jié)點(diǎn)間兩兩均無法通信。每個節(jié)點(diǎn)都是一個分區(qū),每個分區(qū)的主機(jī)數(shù)均不過半,因此無法啟動任何資源,原先運(yùn)行在ha-host2上的vip也停止了。
當(dāng)前集群狀態(tài)如下圖:
存儲NAS 文件操作
df -h查看空間使用情況
警惕超大 nohup.out
任務(wù)提交
任務(wù)提交前
qhost--查看集群負(fù)載狀態(tài)
qsub / qsub-sge.pl--提交任務(wù)
qstat--查看任務(wù)狀態(tài)
qdel / qmod--任務(wù)控制
任務(wù)查看
qhost -j---列出所有用戶在每個節(jié)點(diǎn)上的任務(wù)
qhost -q---列出每個節(jié)點(diǎn)上每個隊(duì)列的任務(wù)數(shù)
qhost -u username---列出某個用戶在每個節(jié)點(diǎn)上的任務(wù)
提交命令
qsub -cwd -q queue.q test.sh
qsub-sge.pl --maxproc 50 --resource vf=5G --queue queue.q test.sh
任務(wù)查看2
qstat -u username---查看某個用戶的任務(wù)
qstat -u *,---查看所有用戶的任務(wù)
qstat –j jobs_ID---查看某個任務(wù)的詳細(xì)信息
查看.e和.o文件
.e:錯誤信息
.o:標(biāo)準(zhǔn)輸出
任務(wù)控制
qdel jobID---刪除某個任務(wù)
qdel -u username---刪除某個用戶的所有任務(wù)
qmod -s jobID--掛起某個任務(wù)
qmod -us jobID---繼續(xù)運(yùn)行某個掛起的任務(wù)
按任務(wù)占用內(nèi)存大小選擇相應(yīng)的隊(duì)列
查看隊(duì)列 qstat -g c
QUEUE
PE.q--并行
cloud.q--云平臺
general.q--96G節(jié)點(diǎn)
middle.q--96G節(jié)點(diǎn)
great.q--大內(nèi)存節(jié)點(diǎn)
plus.q--大內(nèi)存節(jié)點(diǎn)
single.q--Trinity組裝
single._p.q---Trinity組裝(占用內(nèi)存較大)
TOP監(jiān)視
編輯于 2017-04-21