我們都有過上機(jī)器查日志的經(jīng)歷,當(dāng)集群數(shù)量增多的時候,這種原始的操作帶來的低效率不僅給我們定位現(xiàn)網(wǎng)問題帶來極大的挑戰(zhàn),同時,我們也無法對我們服務(wù)框架的各項指標(biāo)進(jìn)行有效的量化診斷,更無從談有針對性的優(yōu)化和改進(jìn)。這個時候,構(gòu)建具備信息查找,服務(wù)診斷,數(shù)據(jù)分析等功能的實(shí)時日志監(jiān)控系統(tǒng)尤為重要。
創(chuàng)新互聯(lián)公司主營東陽網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營網(wǎng)站建設(shè)方案,成都APP應(yīng)用開發(fā),東陽h5成都微信小程序搭建,東陽網(wǎng)站營銷推廣歡迎東陽等地區(qū)企業(yè)咨詢ELK (ELK Stack: ElasticSearch, LogStash, Kibana, Beats) 是一套成熟的日志解決方案,其開源及高性能在各大公司廣泛使用。而我們業(yè)務(wù)所使用的服務(wù)框架,如何接入 ELK 系統(tǒng)呢?
業(yè)務(wù)背景
我們的業(yè)務(wù)框架背景:
我們將整個框架接入 ELK 簡單歸納為下面幾個步驟:
一、日志結(jié)構(gòu)設(shè)計
傳統(tǒng)的,我們在做日志輸出的時候,是直接輸出日志的等級(level)和日志的內(nèi)容字符串(message)。然而我們不僅關(guān)注什么時間,發(fā)生了什么,可能還需要關(guān)注類似的日志發(fā)生了多少次,日志的細(xì)節(jié)與上下文,以及關(guān)聯(lián)的日志。 因此我們不只是簡單地將我們的日志結(jié)構(gòu)化一下為對象,還要提取出日志關(guān)鍵的字段。
1. 將日志抽象為事件
我們將每一條日志的發(fā)生都抽像為一個事件。事件包含:
事件元字段
請求元字段
數(shù)據(jù)字段
不同類型的事件,需要輸出的細(xì)節(jié)不盡相同,我們將這些細(xì)節(jié)(非元字段)統(tǒng)一放到d -- data,之中。使我們的事件結(jié)構(gòu)更加清晰,同時,也能避免數(shù)據(jù)字段對元字段造成污染。
e.g. 如 client-init
事件,該事件會在每次服務(wù)器接收到用戶請求時打印,我們將用戶的 ip
, url
等事件獨(dú)有的統(tǒng)一歸為數(shù)據(jù)字段放到 d
對象中
舉個完整的例子
{ "datetime":"2018-11-07 21:38:09.271", "timestamp":1541597889271, "level":"INFO", "event":"client-init", "reqId":"rJtT5we6Q", "reqLife":5874, "reqUid": "999793fc03eda86", "d":{ "url":"/", "ip":"9.9.9.9", "httpVersion":"1.1", "method":"GET", "userAgent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36", "headers":"*" }, "browser":"{"name":"Chrome","version":"70.0.3538.77","major":"70"}", "engine":"{"version":"537.36","name":"WebKit"}", "os":"{"name":"Mac OS","version":"10.14.0"}", "content":"(Empty)", "line":"middlewares/foo.js:14", "server":"127.0.0.1" }