架構(gòu):
宣化網(wǎng)站制作公司哪家好,找成都創(chuàng)新互聯(lián)!從網(wǎng)頁設(shè)計、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、響應(yīng)式網(wǎng)站開發(fā)等網(wǎng)站項目制作,到程序開發(fā),運營維護。成都創(chuàng)新互聯(lián)公司2013年成立到現(xiàn)在10年的時間,我們擁有了豐富的建站經(jīng)驗和運維經(jīng)驗,來保證我們的工作的順利進行。專注于網(wǎng)站建設(shè)就選成都創(chuàng)新互聯(lián)。
nagios跟ganglia一樣可以都是監(jiān)控軟件,但是兩個也有不同之處,Ganglia的優(yōu)勢在于實時對監(jiān)控集群中的機器的各項指標,比如CPU、內(nèi)存、磁盤、溫度等數(shù)據(jù),匯總成各種圖形化界面,并提供可調(diào)用數(shù)據(jù)。而在出現(xiàn)問題的時候報警提示功能,相對較弱。
Nagios的優(yōu)勢在于出現(xiàn)問題之時可以提供強大的報警提示功能,但是在時間監(jiān)控上,功能比較弱,即使使用NRPE插件也不足以提供強大的機器監(jiān)控,所以此處將兩者結(jié)合起來。實現(xiàn)監(jiān)控、報警功能。
環(huán)境介紹:
1.服務(wù)器中已經(jīng)安裝好了Ganglia,安裝過程參考:http://9480860.blog.51cto.com/9470860/1746122
2.服務(wù)器中已經(jīng)安裝好了Nagios,安裝過程詳見:http://9480860.blog.51cto.com/9470860/1746124
安裝思路:
通過Nagios調(diào)用Ganglia的接口,獲取整個服務(wù)器的監(jiān)控指標。如果超過設(shè)定的指標,則予以報警。
安裝過程:
1.Ganglia與naios的結(jié)合
# cp ganglia-3.6.0/contrib/check_ganglia.py /usr/local/nagios/libexec/
# chown nagios.nagios check_ganglia.py
# /usr/local/nagios/libexec/check_ganglia.py
2.修改gmetad配置,使其shared監(jiān)控數(shù)據(jù)
# vim /usr/local/ganglia/etc/gmetad.conf
trusted_hosts 127.0.0.1 192.168.235.138 cjx
## vim check_ganglia.py 修改報警腳本
try:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.connect((ganglia_host,ganglia_port))
parser = GParser(host, metric)
value = parser.parse(s.makefile("r"))
s.close()
except Exception, err:
print "CHECKGANGLIA UNKNOWN: Error while getting value \"%s\"" % (err)
sys.exit(3)
if critical > warning:
if value >= critical:
print "CHECKGANGLIA CRITICAL: %s is %.2f" % (metric, value)
sys.exit(2)
elif value >= warning:
print "CHECKGANGLIA WARNING: %s is %.2f" % (metric, value)
sys.exit(1)
else:
print "CHECKGANGLIA OK: %s is %.2f" % (metric, value)
sys.exit(0)
else:
if critical >= value:
print "CHECKGANGLIA CRITICAL: %s is %.2f" % (metric, value)
sys.exit(2)
elif warning >= value:
print "CHECKGANGLIA WARNING: %s is %.2f" % (metric, value)
sys.exit(1)
else:
print "CHECKGANGLIA OK: %s is %.2f" % (metric, value)
sys.exit(0)
//報警腳本需要特別注意格式,否則會顯示錯誤提示
# python check_ganglia.py -h cjx -m load_one -w 10 -c 100
3.增加檢測ganglia的命令
# vim /etc/nagios/objects/commands.cfg
# 'check_ganglia' command definition
define command{
command_name check_ganglia
command_line $USER1$/check_ganglia.py -h $HOSTADDRESS$ -m $ARG1$ -w $ARG2$ -c $ARG3$
}
4.定義ganglia模板
# vim templates.cfg
define service{
name ganglia-service ; The name of this service template
use generic-service
hostgroup_name gangliaservers
service_groups gangliametrics
register 0
}
5.定義主機
[root@cjx objects]# vim hosts.cfg
define host{
use linux-server
host_name cjx
alias Manager
address 127.0.0.1
icon_p_w_picpath server.gif
statusmap_p_w_picpath server.gd2
2d_coords 200,300
3d_coords 200,300,100
}
define hostgroup{
hostgroup_name ganglia-servers ; The name of the hostgroup
alias ganglia servers ; Long name of the group
members *;
}
~
5.定義服務(wù)
[root@cjx objects]# vim service.cfg
define servicegroup {
#servicegroup_name ganglia-metrics
servicegroup_name gangliametrics
alias Ganglia Metrics
}
define service {
use ganglia-service
host_name cjx
hostgroup_name ganglia-servers
service_description load_one
check_command check_ganglia!load_one!4!5
}
define service{
host_name cjx
hostgroup_name ganglia-servers
use ganglia-service
service_description disk_free
check_command check_ganglia!disk_free!0.2!0.1
}
//定義服務(wù)時一定要定義好主機、主機組、服務(wù)組,否則會出現(xiàn)error、warning錯誤提示,且 網(wǎng)上不好找到答案
6.把文件路徑加入到nagios主配置文件里面
[root@cjx objects]# cd ..
# vim /etc/nagios/nagios.cfg
cfg_file=/etc/nagios/objects/hosts.cfg
cfg_file=/etc/nagios/objects/service.cfg
7.驗證配置正確性
# /usr/local/nagios/bin/nagios -v /etc/nagios/nagios.cfg
8.重啟nagios服務(wù)
# service nagios restart
9.打開nagios-web頁面可以看到相關(guān)信息
這個時候就靜靜的看著web頁面吧。