這篇“Splunk是什么”文章的知識點大部分人都不太理解,所以小編給大家總結(jié)了以下內(nèi)容,內(nèi)容詳細,步驟清晰,具有一定的借鑒價值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“Splunk是什么”文章吧。
10多年的臨滄網(wǎng)站建設(shè)經(jīng)驗,針對設(shè)計、前端、開發(fā)、售后、文案、推廣等六對一服務(wù),響應(yīng)快,48小時及時工作處理。成都營銷網(wǎng)站建設(shè)的優(yōu)勢是能夠根據(jù)用戶設(shè)備顯示端的尺寸不同,自動調(diào)整臨滄建站的顯示方式,使網(wǎng)站能夠適用不同顯示終端,在瀏覽器中調(diào)整網(wǎng)站的寬度,無論在任何一種瀏覽器上瀏覽網(wǎng)站,都能展現(xiàn)優(yōu)雅布局與設(shè)計,從而大程度地提升瀏覽體驗。成都創(chuàng)新互聯(lián)從事“臨滄網(wǎng)站設(shè)計”,“臨滄網(wǎng)站推廣”以來,每個客戶項目都認真落實執(zhí)行。
Splunk是日志/流式數(shù)據(jù)領(lǐng)域中做的最好的商業(yè)軟件實現(xiàn),它的核心能力只有一個:
像Google那樣搜索企業(yè)內(nèi)部所有產(chǎn)生的日志
這個的威力非常大,現(xiàn)在的企業(yè)不缺數(shù)據(jù),缺的是有效挖掘數(shù)據(jù)的能力。而顯然大部分企業(yè)沒有Google的能力去做搜索,于是Splunk提供這樣的能力。與之相競爭的開源實現(xiàn)有Logstash。
Splunk ≈ Logstash Logstash = redis(傳輸) + ElasticSearch(搜索) + Kibana(展現(xiàn)) ElasticSearch = Lucene + Search
Splunk官網(wǎng)上有,我就不替他們做廣告了,總之,很貴,一萬美元能買1G的流量每天。言歸正傳,我還是分析一下這個玩意兒的一些功能特性吧。
首先,Splunk有一個很炫酷的界面
可以看到,Splunk的主要使用方式就是那個搜索框,在里面輸入一種叫做SPL的搜索語言,就能獲取到你想要的各種信息了。Splunk能在后臺對數(shù)據(jù)進行過濾、聚合、統(tǒng)計,最后得到各種報表、圖像
SPL是一種向SQL致(chao)敬(xi)的語言,語法非常的類似,不同的是,SPL搜索的不是關(guān)系數(shù)據(jù)庫,而是輸入到Splunk系統(tǒng)中所有的日志數(shù)據(jù),以下是幾個具體的案例:
可以看到,對于一行SPL搜索語句
sourcetype = syslog ERROR | top user | fields - precent
Splunk是這么干的,
首先從硬盤上搜索字段sourcetype(來源類型)為syslog的日志,同時,在日志中含有ERROR這個關(guān)鍵字的。
通過管道符,把上面的搜索結(jié)果根據(jù)user字段做聚合,取出其中出現(xiàn)次數(shù)最多的前10個
再通過管道符,去掉百分比字段,最后得出結(jié)果
最后看到,這個搜索干了什么事情呢?它一下子就把日志中出錯最多的前十個用戶給統(tǒng)計出來了,這樣后續(xù)程序員就能跟蹤這些錯誤為什么產(chǎn)生,然后著手去解決。
| where distance/time > 100
使用where,對日志中兩個字段進行相除后比較。
Splunk主要做了3件事
解析原始日志格式,分解成有意義的字段,有的 log 收集方案在第一階段就解析日志只發(fā)送關(guān)心的字段,以節(jié)省帶寬。
根據(jù)時間戳,request ID,session ID,user ID 等關(guān)聯(lián)日志條目,以盡量清晰當時各個子系統(tǒng)的狀態(tài);
根據(jù)分析的目的做過濾、聚合、統(tǒng)計等等,最后整一份漂亮的報表出來。
WEB的UI很出色,插件式的,把這個做成了一個平臺,允許很多第三方的公司在上面發(fā)布應(yīng)用。
搜索語法強大,例如查找HTTP 503錯誤近期的出現(xiàn)頻率,例如某一個地區(qū)用戶訪問最多的商品列表,例如頁面訪問量排名?;旧?,你能想到的可以由SQL完成的搜索,SPL都能夠做出來。
自動猜測一些日志的字段,同時可以在Web上手動調(diào)整怎么解析源頭日志。
以上所有操作,都能由掌握SPL語言的非程序員來完成,也就是說Splunk可以由產(chǎn)品經(jīng)理或者運營團隊來操控。而且還能把數(shù)據(jù)可視化做出來。
流式搜索,實時過濾日志然后報警,這個對運維團隊很有用。
以上幾點,就決定了Splunk的市場非常的大,這家公司的概念是流式數(shù)據(jù)領(lǐng)域的數(shù)據(jù)倉庫,2012在納斯達克上市,不過這兩年被人做空,股票大跌。因為很多云計算廠商都能提供這種服務(wù),例如阿里云1MB/S都是免費的。
###Splunk vs Logstash###
Logstash是個開源的日志搜索工具,也是一體化的開箱即用的產(chǎn)品?;旧?,能實現(xiàn)Splunk六成的功力。Web沒有那么強,也沒有SPL這樣簡單的語言,ElasticSearch需要通過Json來查詢,Kibana的搜索語句能力有限。目前可以說Logstash這個項目還在成熟期。需要后續(xù)很多的工作才能做好。
###Splunk vs Kafka ###
這么比較其實不是很公平。
Kafka只解決了日志的統(tǒng)一搜集、傳輸、序列化存儲問題。Splunk做的更多些,還做了數(shù)據(jù)索引的深加工。
同時,Kafka需要在源頭使用schema來定義數(shù)據(jù)格式,嚴格,有利于后期的消費程序使用。
Splunk卻對源頭數(shù)據(jù)要求沒有那么高,對現(xiàn)有系統(tǒng)改動小,因為是個企業(yè)軟件,需要追求兼容性。
從高可用方面來看,Splunk目前還沒有一天搜集幾個T的數(shù)據(jù)的案例,Kafka在這方面的能力絕對沒有問題。
Kafka是個比較好的車身框架,但還缺一個強大的發(fā)動機和不少內(nèi)飾;Splunk是一輛功能完善的車子,就是價格很貴,而且沒有在150碼以上開過的案例。
所以,對于Kafka,可能的總體解決方案有:
Kafka + YARN + Hadoop = Samza(Linkin) Kafka + Strom + MySQL Kafka + ElasticSearch + Kibana
以上就是關(guān)于“Splunk是什么”這篇文章的內(nèi)容,相信大家都有了一定的了解,希望小編分享的內(nèi)容對大家有幫助,若想了解更多相關(guān)的知識內(nèi)容,請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。