Cluster Health Monitor(以下簡(jiǎn)稱(chēng) CHM)是一個(gè) ORACLE提供的工具,用來(lái)自動(dòng)收集操作系統(tǒng)的資源(CPU、內(nèi)存、SWAP、進(jìn)程、I/O以及網(wǎng)絡(luò)等)使用情況。CHM會(huì)每秒收集一次數(shù)據(jù)。
創(chuàng)新互聯(lián)建站成立于2013年,是專(zhuān)業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項(xiàng)目網(wǎng)站制作、成都網(wǎng)站制作網(wǎng)站策劃,項(xiàng)目實(shí)施與項(xiàng)目整合能力。我們以讓每一個(gè)夢(mèng)想脫穎而出為使命,1280元望奎做網(wǎng)站,已為上家服務(wù),為望奎各地企業(yè)和個(gè)人服務(wù),聯(lián)系電話(huà):18980820575
這些系統(tǒng)資源數(shù)據(jù)對(duì)于診斷集群系統(tǒng)的節(jié)點(diǎn)重啟、Hang、實(shí)例驅(qū)逐(Eviction)、性能問(wèn)題等是非常有幫助的。另外,用戶(hù)可以使用CHM來(lái)及早發(fā)現(xiàn)一些系統(tǒng)負(fù)載高、內(nèi)存異常等問(wèn)題,從而避免產(chǎn)生更嚴(yán)重的問(wèn)題。
在集群中,可以通過(guò)下面的命令查看CHM對(duì)應(yīng)的資源(ora.crf)的狀態(tài):
在grid用戶(hù)下
$crsctl stat res –t –init
CHM主要包括兩個(gè)服務(wù):
1).System Monitor
Service(osysmond):這個(gè)服務(wù)在所有節(jié)點(diǎn)都會(huì)運(yùn)行,osysmond會(huì)將每個(gè)節(jié)點(diǎn)的資源使用情況發(fā)送給cluster logger service,后者將會(huì)把所有節(jié)點(diǎn)的信息都接收并保存到CHM的資料庫(kù).
2).Cluster Logger Service(ologgerd):在一個(gè)集群中的,ologgerd會(huì)有一個(gè)主機(jī)點(diǎn)(master),還有一個(gè)備節(jié)點(diǎn)(standby).當(dāng)ologgerd在當(dāng)前的節(jié)點(diǎn)遇到問(wèn)題無(wú)法啟動(dòng)后,它會(huì)在備用節(jié)點(diǎn)啟用。
CHM Repository:用于存放收集到數(shù)據(jù),默認(rèn)情況下,會(huì)存在于Grid Infrastructure home下,需要1GB的磁盤(pán)空間,每個(gè)節(jié)點(diǎn)大約每天會(huì)占用0.5GB的空間,您可以使用OCLUMON來(lái)調(diào)整它的存放路徑以及的空間大小。
下面的命令用來(lái)查看它當(dāng)前的設(shè)置:
$oclumon manage –get reppath
CHM Repository Path = /oracle/app/gridhome/crf/db/bpmjl2
Done
$oclumon manage –get resize
CHM Repository Size = 1094795585 <=========單位為秒
Done
修改路徑:
$oclumon manage –repos reploc /shared/oracle/chm
修改大小:
$oclumon manage –repos resize 68083
查看ora服務(wù)
crsctl stat res -t -init
可以關(guān)閉CHM服務(wù).
查看ora.crf服務(wù)
$crsctl stat res ora.crf –init
停止ora.crf服務(wù)
$crsctl stop res ora.crf –init
然后刪除crfclust.bdb文件 (兩個(gè)節(jié)點(diǎn)都需要?jiǎng)h除)