nagios服務(wù)端默認(rèn)沒有check_nrpe插件,需要編譯安裝nrpe。
創(chuàng)新互聯(lián)專注于吉林企業(yè)網(wǎng)站建設(shè),響應(yīng)式網(wǎng)站開發(fā),商城建設(shè)。吉林網(wǎng)站建設(shè)公司,為吉林等地區(qū)提供建站服務(wù)。全流程定制網(wǎng)站制作,專業(yè)設(shè)計(jì),全程項(xiàng)目跟蹤,創(chuàng)新互聯(lián)專業(yè)和態(tài)度為您提供的服務(wù)nrpe提供check_nrp 以及 nrpe二進(jìn)制程序和啟動(dòng)進(jìn)程所需的配置文件。
對(duì)于nagios服務(wù)端來說,其只需要check_nrpe插件來發(fā)送監(jiān)控指令,而被監(jiān)控端則需要通過nrpe進(jìn)程來監(jiān)控服務(wù)端發(fā)送過來的指令(默認(rèn)監(jiān)聽5666),并執(zhí)行本地插件獲取信息,最后回傳給監(jiān)控端。由此可見,被監(jiān)控端需要安裝nagios-plugins來獲取插件,但如果被監(jiān)控端不使用由plugins組件提供的插件,當(dāng)然也就不需要安裝了。
nrpe的編譯安裝總結(jié):
默認(rèn)使用用戶nagios和組nagios,最好提前創(chuàng)建
[root@localhost nrpe-2.15]# ./configure --prefix=/mnt #測(cè)試目錄 [root@localhost nrpe-2.15]# [root@localhost nrpe-2.15]# make all [root@localhost nrpe-2.15]# make install [root@localhost nrpe-2.15]#
[root@localhost nrpe-2.15]# tree /mnt /mnt ├── bin │ └── nrpe └── libexec └── check_nrpe
已經(jīng)生成了二進(jìn)制文件和插件,對(duì)于nagios服務(wù)端來說,此步之后,直接拷貝check_nrpe到nagios插件存放目錄即可(注意可執(zhí)行權(quán)限)。
而對(duì)于被監(jiān)控端來說,check_nrpe插件是沒有用的,而是需要nrpe來提供監(jiān)聽服務(wù),但此時(shí)安裝目錄并沒有配置文件:
[root@localhost nrpe-2.15]# make install-daemon-config /usr/bin/install -c -m 775 -o nagios -g nagios -d /mnt/etc /usr/bin/install -c -m 644 -o nagios -g nagios sample-config/nrpe.cfg /mnt/etc
可以手動(dòng)將源碼目錄下的配置文件 sample-config/nrpe.cfg 拷貝到安裝目錄,并修改下屬主和屬組即可。
簡單看下配置文件,需要修改allowed_hosts,將nagios服務(wù)端ip添加到后邊,逗號(hào)隔開即可:
server_port=5666 #server_address=127.0.0.1 nrpe_user=nagios nrpe_group=nagios allowed_hosts=127.0.0.1,$NagiosIP
有了配置文件就可以啟動(dòng)nrpe進(jìn)程了,有兩種方式,一種是獨(dú)立守護(hù)進(jìn)程,一種超級(jí)守護(hù)進(jìn)程的方式。
獨(dú)立守護(hù)進(jìn)程:
[root@localhost nrpe-2.15]# [root@localhost nrpe-2.15]# netstat -antp | grep 5666 [root@localhost nrpe-2.15]# /mnt/bin/nrpe -c /mnt/etc/nrpe.cfg -n -d [root@localhost nrpe-2.15]# netstat -antp | grep 5666 tcp 0 0 0.0.0.0:5666 0.0.0.0:* LISTEN 13643/nrpe tcp 0 0 :::5666 :::* LISTEN 13643/nrpe [root@localhost nrpe-2.15]#
-c 指定配置文件
-n 不使用ssl,默認(rèn)是使用的,編譯時(shí)有參數(shù)--enable-ssl可以加上,應(yīng)該是默認(rèn)選項(xiàng)
如果使用了 -n, nagios監(jiān)控端在使用check_nrpe時(shí)也需要指定此參數(shù)。
-d 已獨(dú)立守護(hù)進(jìn)程方式啟動(dòng)
超級(jí)守護(hù)進(jìn)程,需要inetd or xinetd,在編輯相關(guān)配置文件時(shí),指定“-i”參數(shù)即可。
為了啟動(dòng)方便,將服務(wù)添加到chkconfig
參考腳本:
#!/bin/bash # chkconfig: 35 78 22 LOCK_FILE='/var/lock/subsys/nrped' NRPE_COMMAND='/usr/local/nrpe/bin/nrpe' NRPE_CONFIGURE_FILE='/usr/local/nrpe/etc/nrpe.cfg' start() { echo -n "starting nrped ... " $NRPE_COMMAND -c $NRPE_CONFIGURE_FILE -d &>/dev/null && touch $LOCK_FILE &>/dev/null [[ $? -eq 0 ]] && echo -e "\033[1;32mOK\033[0m" || echo -e "\033[1;31mFAIL\033[0m" } stop() { echo -n "stopping nrped ... " killall nrpe &>/dev/null && rm -f $LOCK_FILE &>/dev/ull [[ $? -eq 0 ]] && echo -e "\033[1;32mOK\033[0m" || echo -e "\033[1;31mFAIL\033[0m" } status() { [[ -f $LOCK_FILE ]] && echo "nrpe is running ..." || echo "nrpe isn't running ... " } case $1 in start) start ;; stop) stop ;; restart) stop; start ;; status) status ;; esac
后期處理和測(cè)試:
[root@localhost nrpe-2.15]# chmod +x /etc/init.d/nrped [root@localhost nrpe-2.15]# chkconfig --add nrped [root@localhost nrpe-2.15]# chkconfig --list| grep nrped nrped 0:off 1:off 2:off 3:on 4:off 5:on 6:off [root@localhost nrpe-2.15]# service nrped start starting nrped ... OK [root@localhost nrpe-2.15]# service nrped stop stopping nrped ... OK [root@localhost nrpe-2.15]# service nrped restart stopping nrped ... FAIL starting nrped ... OK [root@localhost nrpe-2.15]# service nrped restart stopping nrped ... OK starting nrped ... OK [root@localhost nrpe-2.15]# service nrped status nrpe is running ... [root@localhost nrpe-2.15]# netstat -antp | grep nrpe tcp 0 0 0.0.0.0:5666 0.0.0.0:* LISTEN 13940/nrpe tcp 0 0 :::5666 :::* LISTEN 13940/nrpe [root@localhost nrpe-2.15]#
關(guān)于被監(jiān)控端插件:
nagios監(jiān)控端可以“遠(yuǎn)程”調(diào)用的指令需要在被監(jiān)控端nrpe配置文件中提前定義,如下:
command[check_users]=/mnt/libexec/check_users -w 5 -c 10 command[check_load]=/mnt/libexec/check_load -w 15,10,5 -c 30,25,20 command[check_hda1]=/mnt/libexec/check_disk -w 20% -c 10% -p /dev/hda1 command[check_zombie_procs]=/mnt/libexec/check_procs -w 5 -c 10 -s Z command[check_total_procs]=/mnt/libexec/check_procs -w 150 -c 200 #command[check_users]=/mnt/libexec/check_users -w $ARG1$ -c $ARG2$ #command[check_load]=/mnt/libexec/check_load -w $ARG1$ -c $ARG2$ #command[check_disk]=/mnt/libexec/check_disk -w $ARG1$ -c $ARG2$ -p $ARG3$ #command[check_procs]=/mnt/libexec/check_procs -w $ARG1$ -c $ARG2$ -s $ARG3$
可以定義閾值明確的指令也可以留有“變量”供監(jiān)控端指定。
以上指令都是安裝nagios-plugins后生成的指令,現(xiàn)在用shell手動(dòng)編寫一個(gè)簡單的監(jiān)控插件。
開發(fā)插件需要符合以下規(guī)則:
插件需要一個(gè)返回值和一段輸出,而且nagios只接受第一段輸出。
返回值和nagios五種狀態(tài)的對(duì)應(yīng)關(guān)系如下:
0: OK
1: WARNNING
2: CRITICAL
3: UNKNOWN
4: PENDING
腳本功能是簡單的監(jiān)控本地內(nèi)存, 代碼如下:
#!/bin/bash #Author: LinigYi # "Memory check" OK=0 WARNNING=1 CRITICAL=2 UNKNOWN=3 PENDING=4 mem_string=$(free -m | grep Mem) totle=$(echo $mem_string | awk '{print $2}') used=$(echo $mem_string | awk '{print $3}') free=$(echo $mem_string | awk '{print $4}') used_percent_string=$(echo "scale=3; ${used}/${totle}" | bc) used_percent_aa=${used_percent_string:1:2} used_percent_bb=${used_percent_string:3:1} if [[ $used_percent_bb -ge 5 ]]; then used_percent=$((used_percent_aa+=1)) else used_percent=${used_percent_aa} fi [[ $1 == '-w' ]] && shift && warnning=$1 && shift [[ $1 == '-c' ]] && shift && critical=$1 [[ $warnning -gt $critical ]] && { echo value wrong !! exit $PENDING } if [[ $used_percent -ge $critical ]]; then echo CRITICAL - Totle: $totle Used: $used Free: $free, used percent: ${used_percent}% exit $CRITICAL elif [[ $used_percent -ge $warnning ]]; then echo WARNNING - Totle: $totle Used: $used Free: $free, used percent: ${used_percent}% exit $WARNNING else echo OK - Totle: $totle Used: $used Free: $free, used percent: ${used_percent}% exit $OK fi
基本模擬plugins的插件輸出格式
測(cè)試插件:
首先修改配置文件,將nagios服務(wù)端ip添加到允許列表:
[root@localhost mnt]# cat /mnt/etc/nrpe.cfg | grep allowed_hosts allowed_hosts=127.0.0.1, 172.19.2.250 [root@localhost mnt]#
[root@localhost mnt]# ls -l /mnt/libexec/ total 240 -rwxr-xr-x. 1 root root 160049 Apr 22 18:10 check_load -rwxr-xr-x. 1 root root 1098 Apr 22 18:14 check_mem -rwxrwxr-x. 1 nagios nagios 76825 Apr 22 16:54 check_nrpe [root@localhost mnt]#
插件一定要有可執(zhí)行權(quán)限! 拷貝一個(gè)對(duì)比的插件check_load
[root@localhost mnt]# cat /mnt/etc/nrpe.cfg | grep '^command' command_timeout=60 command[check_users]=/mnt/libexec/check_users -w 5 -c 10 command[check_load]=/mnt/libexec/check_load -w 15,10,5 -c 30,25,20 command[check_hda1]=/mnt/libexec/check_disk -w 20% -c 10% -p /dev/hda1 command[check_zombie_procs]=/mnt/libexec/check_procs -w 5 -c 10 -s Z command[check_total_procs]=/mnt/libexec/check_procs -w 150 -c 200 command[check_mem]=/mnt/libexec/check_mem -w 20 -c 40 [root@localhost mnt]#
最后一個(gè) check_mem 指令為自己定義。
啟動(dòng)nrpe
[root@localhost mnt]# [root@localhost mnt]# killall nrpe [root@localhost mnt]# netstat -antp | grep nrpe [root@localhost mnt]# /mnt/bin/nrpe -c /mnt/etc/nrpe.cfg -d [root@localhost mnt]# netstat -antp | grep nrpe tcp 0 0 0.0.0.0:5666 0.0.0.0:* LISTEN 14831/nrpe tcp 0 0 :::5666 :::* LISTEN 14831/nrpe [root@localhost mnt]#
在nagios服務(wù)端做測(cè)試:
[root@localhost libexec]# ip add show 1: lo:mtu 16436 qdisc noqueue state UNKNOWN link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 inet 127.0.0.1/8 scope host lo inet6 ::1/128 scope host valid_lft forever preferred_lft forever 2: eth0: mtu 1500 qdisc pfifo_fast state UP qlen 1000 link/ether 00:1a:4a:94:7d:2e brd ff:ff:ff:ff:ff:ff inet 172.19.2.250/24 brd 172.19.2.255 scope global eth0 inet6 fe80::21a:4aff:fe94:7d2e/64 scope link valid_lft forever preferred_lft forever [root@localhost libexec]# [root@localhost libexec]# [root@localhost libexec]# pwd /usr/local/nagios/libexec [root@localhost libexec]# ./check_nrpe -H 192.168.2.162 -c check_load OK - load average: 0.00, 0.00, 0.00|load1=0.000;15.000;30.000;0; load5=0.000;10.000;25.000;0; load15=0.000;5.000;20.000;0; [root@localhost libexec]# [root@localhost libexec]# echo $? 0 [root@localhost libexec]# [root@localhost libexec]# ./check_nrpe -H 192.168.2.162 -c check_mem WARNNING - Totle: 3828 Used: 871 Free: 2956, used percent: 23% [root@localhost libexec]# echo $? 1 [root@localhost libexec]#
檢測(cè)成功 !
現(xiàn)在可以在nagios監(jiān)控端添加監(jiān)控服務(wù)了 !
附件:http://down.51cto.com/data/2367632另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。