創(chuàng)新互聯(lián)專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站、義縣網(wǎng)絡(luò)推廣、小程序設(shè)計(jì)、義縣網(wǎng)絡(luò)營銷、義縣企業(yè)策劃、義縣品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運(yùn)營等,從售前售中售后,我們都將竭誠為您服務(wù),您的肯定,是我們最大的嘉獎(jiǎng);創(chuàng)新互聯(lián)為所有大學(xué)生創(chuàng)業(yè)者提供義縣建站搭建服務(wù),24小時(shí)服務(wù)熱線:18982081108,官方網(wǎng)址:www.cdcxhl.com
Nagios是一款開源的電腦系統(tǒng)和網(wǎng)絡(luò)監(jiān)視工具,能有效監(jiān)控Windows、Linux和Unix的主機(jī)狀態(tài),交換機(jī)路由器等網(wǎng)絡(luò)設(shè)置,打印機(jī)等。在系統(tǒng)或服務(wù)狀態(tài)異常時(shí)發(fā)出郵件或短信報(bào)警第一時(shí)間通知網(wǎng)站運(yùn)維人員,在狀態(tài)恢復(fù)后發(fā)出正常的郵件或短信通知。
Nagios原名為NetSaint,由Ethan Galstad開發(fā)并維護(hù)至今。NAGIOS是一個(gè)縮寫形式: "Nagios Ain't Gonna Insist On Sainthood" Sainthood翻譯為圣徒,而"Agios"是"saint"的希臘表示方法。Nagios被開發(fā)在Linux下使用,但在Unix下也工作得非常好。
主要功能
· 網(wǎng)絡(luò)服務(wù)監(jiān)控(SMTP、POP3、HTTP、NNTP、ICMP、SNMP、FTP、SSH)
· 主機(jī)資源監(jiān)控(CPU load、disk usage、system logs),也包括Windows主機(jī)(使用NSClient++plugin)
· 可以指定自己編寫的Plugin通過網(wǎng)絡(luò)收集數(shù)據(jù)來監(jiān)控任何情況(溫度、警告……)
· 可以通過配置Nagios遠(yuǎn)程執(zhí)行插件遠(yuǎn)程執(zhí)行腳本
· 遠(yuǎn)程監(jiān)控支持SSH或SSL加通道方式進(jìn)行監(jiān)控
· 簡(jiǎn)單的plugin設(shè)計(jì)允許用戶很容易的開發(fā)自己需要的檢查服務(wù),支持很多開發(fā)語言(shell scripts、C++、Perl、ruby、Python、PHP、C#等)
· 包含很多圖形化數(shù)據(jù)Plugins(Nagiosgraph、Nagiosgrapher、PNP4Nagios等)
· 可并行服務(wù)檢查
· 能夠定義網(wǎng)絡(luò)主機(jī)的層次,允許逐級(jí)檢查,就是從父主機(jī)開始向下檢查
· 當(dāng)服務(wù)或主機(jī)出現(xiàn)問題時(shí)發(fā)出通告,可通過email, pager, sms或任意用戶自定義的plugin進(jìn)行通知
· 能夠自定義事件處理機(jī)制重新激活出問題的服務(wù)或主機(jī)
· 自動(dòng)日志循環(huán)
· 支持冗余監(jiān)控
包括Web界面可以查看當(dāng)前網(wǎng)絡(luò)狀態(tài),通知,問題歷史,日志文件等
Nagios的功能是監(jiān)控服務(wù)和主機(jī),但是他自身并不包括這部分功能,所有的監(jiān)控、檢測(cè)功能都是通過各種插件來完成的。
啟動(dòng)Nagios后,它會(huì)周期性的自動(dòng)調(diào)用插件去檢測(cè)服務(wù)器狀態(tài),同時(shí)Nagios會(huì)維持一個(gè)隊(duì)列,所有插件返回來的狀態(tài)信息都進(jìn)入隊(duì)列,Nagios每次都從隊(duì)首開始讀取信息,并進(jìn)行處理后,把狀態(tài)結(jié)果通過web顯示出來。
Nagios提供了許多插件,利用這些插件可以方便的監(jiān)控很多服務(wù)狀態(tài)。安裝完成后,在nagios主目錄下的/libexec里放有nagios自帶的可以使用的所有插件,如,check_disk是檢查磁盤空間的插件,check_load是檢查CPU負(fù)載的,等等。每一個(gè)插件可以通過運(yùn)行./check_xxx –h來查看其使用方法和功能。
Nagios可以識(shí)別4種狀態(tài)返回信息,即0(OK)表示狀態(tài)正常/綠色、1(WARNING)表示出現(xiàn)警告/***、2(CRITICAL)表示出現(xiàn)非常嚴(yán)重的錯(cuò)誤/紅色、3(UNKNOWN)表示未知錯(cuò)誤/深***。Nagios根據(jù)插件返回來的值,來判斷監(jiān)控對(duì)象的狀態(tài),并通過web顯示出來,以供管理員及時(shí)發(fā)現(xiàn)故障
四種監(jiān)控狀態(tài)
1 OK 2 Waring 3 Critical 4 Unknown
再說報(bào)警功能,如果監(jiān)控系統(tǒng)發(fā)現(xiàn)問題不能報(bào)警那就沒有意義了,所以報(bào)警也是nagios很重要的功能之一。但是,同樣的,Nagios自身也沒有報(bào)警部分的代碼,甚至沒有插件,而是交給用戶或者其他相關(guān)開源項(xiàng)目組去完成的。
Nagios安裝,是指基本平臺(tái),也就是Nagios軟件包的安裝。它是監(jiān)控體系的框架,也是所有監(jiān)控的基礎(chǔ)。
打開Nagios官方的文檔,會(huì)發(fā)現(xiàn)Nagios基本上沒有什么依賴包,只要求系統(tǒng)是Linux或者其他Nagios支持的系統(tǒng)。不過如果你沒有安裝apache(http服務(wù)),那么你就沒有那么直觀的界面來查看監(jiān)控信息了,所以apache姑且算是一個(gè)前提條件。關(guān)于apache的安裝,網(wǎng)上有很多,照著安裝就是了。安裝之后要檢查一下是否可以正常工作。
知道Nagios是如何通過插件來管理服務(wù)器對(duì)象后,現(xiàn)在開始研究它是如何管理遠(yuǎn)端服務(wù)器對(duì)象的。Nagios系統(tǒng)提供了一個(gè)插件NRPE。Nagios通過周期性的運(yùn)行它來獲得遠(yuǎn)端服務(wù)器的各種狀態(tài)信息。它們之間的關(guān)系如下圖所示:
Nagios通過NRPE來遠(yuǎn)端管理服務(wù)
1. Nagios執(zhí)行安裝在它里面的check_nrpe插件,并告訴check_nrpe去檢測(cè)哪些服務(wù)。
2.通過SSL,check_nrpe連接遠(yuǎn)端機(jī)子上的NRPE daemon
3. NRPE運(yùn)行本地的各種插件去檢測(cè)本地的服務(wù)和狀態(tài)(check_disk,..etc)
4.最后,NRPE把檢測(cè)的結(jié)果傳給主機(jī)端的check_nrpe,check_nrpe再把結(jié)果送到Nagios狀態(tài)隊(duì)列中。
5. Nagios依次讀取隊(duì)列中的信息,再把結(jié)果顯示出來。
角色 OS HostIP
監(jiān)控主機(jī) Rhel6.2Nagios192.168.2.53
被監(jiān)控機(jī) Rhel6.2Linux192.168.2.11
被監(jiān)控機(jī) WinSer2008Windows192.168.2.12
1nagios基礎(chǔ)支持套件:httpd php php-MySQL sql-devel
Nagios插件支持套件:gcc glibc glibc-common gd gd-develxinetd openssl-devel
如果系統(tǒng)中沒有這些套件,使用yum安裝
# yum install -y httpd php php-mysql sql-devel gcc glibc glibc-common gdgd-devel xinetd openssl-devel
2創(chuàng)建nagios運(yùn)行的用戶和用戶組,并把a(bǔ)pache加入該用戶組
# groupadd nagcmd
# useradd –G nagcmd nagios
# passwd nagios
# usermod –a –G nagcmd apache
3編譯安裝Nagios
# tar zxvf nagios-3.4.3.tar.gz
# cd nagios
# ./configure --prefix=/u01/nagios –-with-command-group=nagcmd –-enable-event-broker
# make all
# make install
# make install-init
# make install-commandmode
# make install-config
# make install-webconf
4驗(yàn)證程序是否被正確安裝
切換目錄到安裝路徑(這里是/u01/nagios),看是否存在etc、bin、sbin、share、var這五個(gè)目錄,如果存在則可以表明程序被正確的安裝到系統(tǒng)了。Nagios各個(gè)目錄用途說明如下:
binNagios 可執(zhí)行程序所在目錄
etcNagios 配置文件所在目錄
sbinNagios CGI 文件所在目錄,也就是執(zhí)行外部命令所需文件所在的目錄
shareNagios網(wǎng)頁文件所在的目錄
libexecNagios 外部插件所在目錄
varNagios 日志文件、lock 等文件所在的目錄
var/archivesNagios 日志自動(dòng)歸檔目錄
var/rw用來存放外部命令文件的目錄
5創(chuàng)建apache目錄驗(yàn)證文件
在上面的配置中,指定了目錄驗(yàn)證文件htpasswd,下面要?jiǎng)?chuàng)建這個(gè)文件:
# htpasswd -c /u01l/nagios/etc/htpasswd nagiosadmin
這樣就在/usr/local/nagios/etc目錄下創(chuàng)建了一個(gè)htpasswd驗(yàn)證文件,當(dāng)通過http://192.168.2.50/nagios/ 訪問時(shí)就需要輸入用戶名和密碼了。
2)查看認(rèn)證文件的內(nèi)容
# cat /u01/nagios/etc/htpasswd
6安裝Nagios插件
# tar zxvf nagios-plugins-1.4.16.tar.gz
# cd nagios-plugins-1.4.16
# ./configure –-prefix=/u01/nagios –-with-nagios-user=nagios -–with-nagios-group=nagios
# make && make install
7把Nagios加入開機(jī)啟動(dòng)
# chkconfig --add nagios
# chkconfig --level 35 nagios on
# chkconfig --list nagios
8啟動(dòng)apache與nagios服務(wù)
# service httpd start
# service nagios start
9關(guān)閉selinux和防火墻
# setenforce 0
# service iptables stop
到這里nagios的安裝也就基本完成了,你可以通過web來訪問了。
Nagios主要用于監(jiān)控一臺(tái)或者多臺(tái)本地主機(jī)及遠(yuǎn)程的各種信息,包括本機(jī)資源及對(duì)外的服務(wù)等。默認(rèn)的Nagios配置沒有任何監(jiān)控內(nèi)容,僅是一些模板文件。若要讓Nagios提供服務(wù),就必須修改配置文件,增加要監(jiān)控的主機(jī)和服務(wù),下面將詳細(xì)介紹。
默認(rèn)配置文件介紹
每個(gè)文件或目錄含義如下表所示:
文件名或目錄名用途
cgi.cfg控制CGI訪問的配置文件
nagios.cfgNagios 主配置文件
resource.cfg變量定義文件,又稱為資源文件,在些文件中定義變量,以便由其他配置文件引用,如$USER1$
objectsobjects 是一個(gè)目錄,在此目錄下有很多配置文件模板,用于定義Nagios 對(duì)象
objects/commands.cfg命令定義配置文件,其中定義的命令可以被其他配置文件引用
objects/contacts.cfg定義聯(lián)系人和聯(lián)系人組的配置文件
objects/localhost.cfg定義監(jiān)控本地主機(jī)的配置文件
objects/printer.cfg定義監(jiān)控打印機(jī)的一個(gè)配置文件模板,默認(rèn)沒有啟用此文件
objects/switch.cfg定義監(jiān)控路由器的一個(gè)配置文件模板,默認(rèn)沒有啟用此文件
objects/templates.cfg定義主機(jī)和服務(wù)的一個(gè)模板配置文件,可以在其他配置文件中引用
objects/timeperiods.cfg定義Nagios 監(jiān)控時(shí)間段的配置文件
objects/windows.cfg監(jiān)控Windows 主機(jī)的一個(gè)配置文件模板,默認(rèn)沒有啟用此文件
配置文件之間的關(guān)系
在nagios的配置過程中涉及到的幾個(gè)定義有:主機(jī)、主機(jī)組,服務(wù)、服務(wù)組,聯(lián)系人、聯(lián)系人組,監(jiān)控時(shí)間,監(jiān)控命令等,從這些定義可以看出,nagios各個(gè)配置文件之間是互為關(guān)聯(lián),彼此引用的。
成功配置出一臺(tái)nagios監(jiān)控系統(tǒng),必須要弄清楚每個(gè)配置文件之間依賴與被依賴的關(guān)系,最重要的有四點(diǎn):
第一:定義監(jiān)控哪些主機(jī)、主機(jī)組、服務(wù)和服務(wù)組;第二:定義這個(gè)監(jiān)控要用什么命令實(shí)現(xiàn);
第三:定義監(jiān)控的時(shí)間段; 第四:定義主機(jī)或服務(wù)出現(xiàn)問題時(shí)要通知的聯(lián)系人和聯(lián)系人組。
修改Nagios配置文件
為了能更清楚的說明問題,同時(shí)也為了維護(hù)方便,建議將nagios各個(gè)定義對(duì)象創(chuàng)建獨(dú)立的配置文件:
a. 修改nagios.cfg來設(shè)定監(jiān)控對(duì)象需要使用到的配置文件
b. 創(chuàng)建hosts.cfg文件來定義主機(jī)和主機(jī)組
c. 創(chuàng)建services.cfg文件來定義服務(wù)
d. 用默認(rèn)的contacts.cfg文件來定義聯(lián)系人和聯(lián)系人組
e. 用默認(rèn)的commands.cfg文件來定義命令
f. 用默認(rèn)的templates.cfg文件作為資源引用文件
g. 用默認(rèn)的timeperiods.cfg來定義監(jiān)控時(shí)間段
配置文件配置詳解:
1)nagios.cfg
確保有如下路徑配置
cfg_file=/u01/nagios/etc/objects/commands.cfg
cfg_file=/u01/nagios/etc/objects/contacts.cfg
cfg_file=/u01/nagios/etc/objects/timeperiods.cfg
cfg_file=/u01/nagios/etc/objects/templates.cfg
cfg_file=/u01/nagios/etc/objects/hosts.cfg
cfg_file=/u01/nagios/etc/objects/services.cfg
2) resource.cfg文件
resource.cfg是nagios的變量定義文件
4)cgi.cfg文件
此文件用來控制相關(guān)cgi腳本,如果想在nagios的web監(jiān)控界面執(zhí)行cgi腳本,例如重啟nagios進(jìn)程、關(guān)閉nagios通知、停止nagios主機(jī)檢測(cè)等,這時(shí)就需要配置cgi.cfg文件了。
5) commands.cfg文件
此文件默認(rèn)是存在的,無需修改即可使用,當(dāng)然如果有新的命令需要加入時(shí),在此文件進(jìn)行添加即可。
6)templates.cfg文件
nagios主要用于監(jiān)控主機(jī)資源以及服務(wù),在nagios配置中稱為對(duì)象,為了不必重復(fù)定義一些監(jiān)控對(duì)象,Nagios引入了一個(gè)模板配置文件,將一些共性的屬性定義成模板,以便于多次引用。這就是templates.cfg的作用。
7)hosts.cfg文件
此文件默認(rèn)不存在,需要手動(dòng)創(chuàng)建,hosts.cfg主要用來指定被監(jiān)控的主機(jī)地址以及相關(guān)屬性信息
新建host.cfg,并在文件中,加入被監(jiān)控Linux主機(jī)信息
definehost{
use linux-server
host_name Nagios-Linux
alias Nagios-Linux
address 192.168.2.10
}
8)services.cfg文件
此文件默認(rèn)也不存在,需要手動(dòng)創(chuàng)建,services.cfg文件主要用于定義監(jiān)控的服務(wù)和主機(jī)資源,例如監(jiān)控http服務(wù)、ftp服務(wù)、主機(jī)磁盤空間、主機(jī)系統(tǒng)負(fù)載等等。
新建service.cfg,然后添加如下信息
define service{
use local-service
host_name Nagios-Linux
service_description check-host-alive
check_command check-host-alive
}
9)contacts.cfg文件
contacts.cfg是一個(gè)定義聯(lián)系人和聯(lián)系人組的配置文件,當(dāng)監(jiān)控的主機(jī)或者服務(wù)出現(xiàn)故障,nagios會(huì)通過指定的通知方式(郵件或者短信)將信息發(fā)給這里指定的聯(lián)系人或者使用者。
10)timeperiods.cfg文件
此文件只要用于定義監(jiān)控的時(shí)間段
修改完后,在啟動(dòng)前驗(yàn)證Nagios配置文件的正確性
Nagios在驗(yàn)證配置文件方面做的非常到位,只需通過一個(gè)命令即可完成:
# /u01/nagios/bin/nagios-v /u01/nagios/etc/nagios.cfg
上面已經(jīng)對(duì)遠(yuǎn)程Linux主機(jī)是否存活做了監(jiān)控,而判斷遠(yuǎn)程機(jī)器是否存活,我們可以使用ping工具對(duì)其監(jiān)測(cè)。還有一些遠(yuǎn)程主機(jī)服務(wù),例如ftp、ssh、http,都是對(duì)外開放的服務(wù),即使不用Nagios,我們也可以試的出來,隨便找一臺(tái)機(jī)器看能不能訪問這些服務(wù)就行了。但是對(duì)于像磁盤容量,cpu負(fù)載這樣的“本地信息”,Nagios只能監(jiān)測(cè)自己所在的主機(jī),而對(duì)其他的機(jī)器則顯得有點(diǎn)無能為力。畢竟沒得到被控主機(jī)的適當(dāng)權(quán)限是不可能得到這些信息的。為了解決這個(gè)問題,nagios有這樣一個(gè)附加組件--“NRPE”,用它就可以完成對(duì)Linux 類型主機(jī)"本地信息”的監(jiān)控。
NRPE 總共由兩部分組成:
· check_nrpe 插件,位于監(jiān)控主機(jī)上
· NRPE daemon,運(yùn)行在遠(yuǎn)程的Linux主機(jī)上(通常就是被監(jiān)控機(jī))
整個(gè)的監(jiān)控過程如下:
當(dāng)Nagios需要監(jiān)控某個(gè)遠(yuǎn)程Linux主機(jī)的服務(wù)或者資源情況時(shí):
1. Nagios會(huì)運(yùn)行check_nrpe這個(gè)插件,告訴它要檢查什么;
2. check_nrpe插件會(huì)連接到遠(yuǎn)程的NRPE daemon,所用的方式是SSL;
3. NRPE daemon會(huì)運(yùn)行相應(yīng)的Nagios插件來執(zhí)行檢查;
4. NRPE daemon將檢查的結(jié)果返回給check_nrpe插件,插件將其遞交給nagios做處理。
注意:NRPE daemon需要Nagios插件安裝在遠(yuǎn)程的Linux主機(jī)上,否則,daemon不能做任何的監(jiān)控。
A增加用戶&設(shè)定密碼
# useradd nagios
# passwd nagios
B安裝Nagios插件
# tar xf nagios-plugins-2.0.3.tar.gz
# cd nagios-plugins-2.0.3
# ./configure --prefix=/usr/local/nagios
# make && make install
C安裝NRPE
# tar xf nrpe-2.15.tar.gz
# cd nrpe-2.15
# ./configure
D逐個(gè)安裝check_nrpe插件
# make install-plugin
監(jiān)控機(jī)需要安裝check_nrpe這個(gè)插件,被監(jiān)控機(jī)并不需要,我們?cè)谶@里安裝它只是為了測(cè)試目的
# make install-daemon
安裝deamon
# make install-daemon-config
安裝配置文件
# make install-xinetd
安裝xinted腳本
可以看到創(chuàng)建了這個(gè)文件/etc/xinetd.d/nrpe。
編輯這個(gè)腳本:
增加監(jiān)控機(jī)的IP:only_from = 127.0.0.1 192.168.2.50
編輯/usr/local/etc/nrpe.cfg
增加監(jiān)控機(jī)的IP: allowed_hosts=127.0.0.1192.168.2.50
編輯/etc/services文件,增加NRPE服務(wù)
#local service
nrpe 5666/tcp # nrpe
啟動(dòng)nrpe服務(wù):
# service xinted start
之前已經(jīng)將Nagios運(yùn)行起來了,現(xiàn)在要做的事情是:
· 安裝check_nrpe插件;
# cd nrpe-2.15
# ./configure --prefix=/u01/nagios
# make all
# make install-plugin
· 在commands.cfg中創(chuàng)建check_nrpe的命令定義,因?yàn)橹挥性赾ommands.cfg中定義過的命令才能在services.cfg中使用;
# 'check_nrpe' command definition
define command{
command_name check_nrpe
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
· 創(chuàng)建對(duì)被監(jiān)控主機(jī)的監(jiān)控項(xiàng)目;
下面就可以在services.cfg中定義對(duì)Nagios-Linux主機(jī)的監(jiān)控了
define service{
use local-service
host_name Nagios-Linux
service_description Current Load
check_command check_nrpe!check_load
}
define service{
use local-service
host_name Nagios-Linux
service_description Check Disk sda1
check_command check_nrpe!check_sda1
}
define service{
use local-service
host_name Nagios-Linux
service_description Total Processes
check_command check_nrpe!check_total_procs
}
define service{
use local-service
host_name Nagios-Linux
service_description Current Users
check_command check_nrpe!check_users
}
define service{
use local-service
host_name Nagios-Linux
service_description Check Zombie Procs
check_command check_nrpe!check_zombie_procs
}
在Nagios的libexec下有check_nt這個(gè)插件,它就是用來檢查windows機(jī)器的服務(wù)的。其功能類似于check_nrpe。不過還需要搭配另外一個(gè)軟件NSClient++,它則類似于NRPE。
可以看到NSClient與nrpe最大的區(qū)別就是:
· 被監(jiān)控機(jī)上安裝有nrpe,并且還有插件,最終的監(jiān)控是由這些插件來進(jìn)行的。當(dāng)監(jiān)控主機(jī)將監(jiān)控請(qǐng)求發(fā)給nrpe后,nrpe調(diào)用插件來完成監(jiān)控。
· NSClient++則不同,被監(jiān)控機(jī)上只安裝NSClient,沒有任何的插件。當(dāng)監(jiān)控主機(jī)將監(jiān)控請(qǐng)求發(fā)給NSClient++后,NSClient直接完成監(jiān)控,所有的監(jiān)控是由NSClient完成的。
這也說明了NSClient++的一個(gè)很大的問題:不靈活、沒有可擴(kuò)展性。它只能完成自己本身包含的監(jiān)控操作,不能由一些插件來擴(kuò)展。好在NSClient++已經(jīng)做的不錯(cuò)了,基本上可以完全滿足我們的監(jiān)控需求。
10.1安裝NSClient++
從http://www.nsclient.org/nscp/downloads下載NSClient++-0.2.7.zip