在shell里會有一種不太常見的情況,就是腳本有時候會出現超時的現象。一般來說遇到這種問題,我們都會簡單粗暴的采用下面這種腳本來當“超時看門狗“:
梁平網站建設公司成都創(chuàng)新互聯公司,梁平網站設計制作,有大型網站制作公司豐富經驗。已為梁平上千提供企業(yè)網站建設服務。企業(yè)網站搭建\成都外貿網站建設要多少錢,請找那個售后服務好的梁平做網站的公司定做!這個腳本搭配兩個變量使用的話,監(jiān)控一點小代碼還算OK,但是它的邏輯還是比較粗糙,比如如果在這個腳本執(zhí)行的時候,又有了一個新的process在后臺啟動,那么kill掉的就是新的process,而本應該停止的腳本還是在后臺肆無忌憚的跑著。
為了不濫殺無辜,所以遇到這種情況,就要使用timeout命令,具體的用法請自行#man timeout,這個命令在centos 6里就是自帶的。
假設我們要ping www.baidu.com ,同時要求“若超過了5秒沒有反應,就停止這個任務”。那么就是用命令:#timeout 5s ping www.baidu.com,效果如圖:
從26秒到31秒,的確達到了5秒就跳出的效果。
牛刀小試結束,那么現在我們就來進化一下我們之前的那個MQ腳本,之前在 http://chenx1242.blog.51cto.com/10430133/1884415 里我曾經寫過一個MQ腳本,但是那個MQ腳本有點理想化了,里面忘記了添加“超時監(jiān)控”以及“重啟失敗的話會發(fā)郵件提醒運維人員”這兩個功能,在這里我們就把上面兩個短板補齊。
首先,我們先運行一下看看這個MQ看門狗腳本需要運行的時間:
從上面可見整個腳本運行大約需要13秒,那么我們考慮到其他因素設定超時時間為20秒,執(zhí)行效果如圖:
返回碼是0,那么再看看如果因為超時而停止的返回碼是多少呢?
可見由于超時停止的返回碼是124(ctrl+c手動退出的返回碼是130),那么整個腳本就很好寫了,如下:
然后在crontab里直接執(zhí)行這個腳本就好了。
補充說明之一,在文中測試timeout命令的時候,我使用了ping,其實這個是不嚴謹的,因為unix的ping默認會無限重復,所以#timeout 3s ping www.baidu.com 不管有沒有網絡連接都會超時。這里最好的例子是看看#timeout 3s sleep 1和#timeout 3s sleep 5的區(qū)別。
補充說明之二,在shell腳本里,timeout后面若跟函數的話是無效的!