Nagios安裝 - 客戶端
成都創(chuàng)新互聯(lián)服務(wù)項目包括青海網(wǎng)站建設(shè)、青海網(wǎng)站制作、青海網(wǎng)頁制作以及青海網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,青海網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟(jì)效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到青海省份的部分城市,未來相信會繼續(xù)擴大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
1.在客戶端機器上安裝epel擴展源 rpm -ivh http://www.aminglinux.com/bbs/data/p_w_upload/forum/month_1211/epel-release-6-7.noarch.rpm
2.安裝相關(guān)的包
yum install -y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
3.編輯配置nagios的配置文件
vim /etc/nagios/nrpe.cfg
找到“allowed_hosts=127.0.0.1” 改為 “allowed_hosts=127.0.0.1,192.168.1.30” 后面的ip為服務(wù)端ip;
找到” dont_blame_nrpe=0” 改為 “dont_blame_nrpe=1”
4.啟動客戶端 /etc/init.d/nrpe start
注:服務(wù)端獲得客戶端服務(wù)狀態(tài)時,是通過nrpe服務(wù)這個中間介質(zhì)來取得的。
5. 監(jiān)控中心(192.168.0.30)添加被監(jiān)控主機(192.168.0.80)
注:添加主機和監(jiān)控的服務(wù),web沒有辦法配置,只能手動輸入代碼。
首先進(jìn)入服務(wù)端,編輯配置文件。
cd /etc/nagios/conf.d/
vim 192.168.1.51.cfg
加入如下配置:
define host{
use linux-server
host_name 192.168.1.51
alias 1.51
address 192.168.1.51
}
define service{
use generic-service
host_name 192.168.1.51
service_description check_ping
check_command check_ping!100.0,20%!200.0,50%
max_check_attempts 5
normal_check_interval 1
}
define service{
use generic-service
host_name 192.168.1.51
service_description check_ssh
check_command check_ssh
max_check_attempts 5
normal_check_interval 1
notification_interval 60
}
define service{
use generic-service
host_name 192.168.1.51
service_description check_http
check_command check_http
max_check_attempts 5
normal_check_interval 1
}
檢查一下配置文件
nagios -v /etc/nagios/nagios.cfg
6. 配置文件的簡單說明
我們定義的配置文件中一共監(jiān)控了三個service:ssh, ping, http 這三個項目是使用本地的nagios工具去連接遠(yuǎn)程機器,也就是說即使客戶端沒有安裝nagios-plugins以及nrpe也是可以監(jiān)控到的。其他的一些service諸如負(fù)載、磁盤使用等是需要服務(wù)端通過nrpe去連接到遠(yuǎn)程主機獲得信息,所以需要遠(yuǎn)程主機安裝nrpe服務(wù)以及相應(yīng)的執(zhí)行腳本(nagios-plugins)
max_check_attempts 5 #當(dāng)nagios檢測到問題時,一共嘗試檢測5次都有問題才會告警,如果該數(shù)值為1,那么檢測到問題立即告警
normal_check_interval 1#重新檢測的時間間隔,單位是分鐘,默認(rèn)是3分鐘
notification_interval 60 #在服務(wù)出現(xiàn)異常后,故障一直沒有解決,nagios再次對使用者發(fā)出通知的時間。單位是分鐘。如果你認(rèn)為,所有的事件只需要一次通知就夠了,可以把這里的選項設(shè)為0。
以上服務(wù)不依賴于客戶端nrpe服務(wù),我們可以想象,我們在自己電腦上可以使用ping或者telnet探測遠(yuǎn)程任何一臺機器是否存活、是否開啟某個端口或服務(wù)。 而當(dāng)我們想要檢測客戶端上的某個具體服務(wù)的情況時,就需要借助于nrpe了,比如想知道客戶端機器的負(fù)責(zé)或磁盤使用情況。
7.重啟服務(wù)端的nagios,在web頁面中的host里,可以看到新添加進(jìn)來的主機。service可以查看監(jiān)控的服務(wù)。監(jiān)控http ssh ping可以不用借助nrpe,也就是說客戶端不用安裝nrpe。