這篇文章給大家介紹MONGO DB too many MongoDB page_faults 報(bào)錯排查step by step的示例分析,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
創(chuàng)新互聯(lián)專注于永年企業(yè)網(wǎng)站建設(shè),自適應(yīng)網(wǎng)站建設(shè),商城網(wǎng)站建設(shè)。永年網(wǎng)站建設(shè)公司,為永年等地區(qū)提供建站服務(wù)。全流程按需制作,專業(yè)設(shè)計(jì),全程項(xiàng)目跟蹤,創(chuàng)新互聯(lián)專業(yè)和態(tài)度為您提供的服務(wù)
早上運(yùn)維的同學(xué), morning call,說zabbix的 MONGO 監(jiān)控報(bào)警,圖片傳給我,報(bào)的錯誤是 too many mongodb page_faults.
本來 page_faults 引起的根本原因就是瞬時MONGO 從磁盤讀取了大量的數(shù)據(jù),引起page_faults。
這時候有的MONGO DBA 會馬上反應(yīng),看看有沒有沒有全COLLECION的掃描,沒有良好的索引,大量的SCAN ,會造成這個問題。
但這個問題奇葩的地方就在于,這個報(bào)錯的 PAGE_FAULTS機(jī)器,并沒有查詢(并非primary 庫),既然么有查詢,怎么來的page_faults。
官方的解釋截圖
馬上去確認(rèn)一下,到底這個剛運(yùn)行的MONGO 的standy庫的 page_faults 到底是不是有問題。
下面是出現(xiàn)問題的機(jī)器,(別笑新機(jī)器當(dāng)然沒有那么多page_faults)
,對比主機(jī)的 page_faults
果然,這個問題機(jī)器的page_faults果然多了。
另外看看內(nèi)存的狀況,果不其然,已經(jīng)開始使用SWAP了
通過 mongostat 來查看,系統(tǒng)并沒有什么不正常
在查看日志
可以看到,日志已經(jīng)指向 advisoryHostFQDNS,并且通過日志,發(fā)現(xiàn)一直有這個錯誤,并且執(zhí)行一次命令要80秒。
經(jīng)過查詢,可能原因有幾個,因?yàn)檫@個advisoryHostFQDNs 是集群中每臺MONGODB 機(jī)器的域名解析,這里查詢這個信息是從 OPS MANANGER 而來的,說明我們這邊可能在解析域名上有問題。
這里解決問題的方法:在每臺機(jī)器,及OPS MANANGE 上 HOSTS 上填寫所有集群MONGODB的機(jī)器名,而不在通過DNS 來解析,看看能不能解決上述的問題。
關(guān)于MONGO DB too many mongodb page_faults 報(bào)錯排查step by step的示例分析就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。