我們生活中的數(shù)據(jù)總體分為兩種:結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。
創(chuàng)新互聯(lián)主要企業(yè)基礎(chǔ)官網(wǎng)建設(shè),電商平臺(tái)建設(shè),移動(dòng)手機(jī)平臺(tái),重慶小程序開發(fā)等一系列專為中小企業(yè)定制開發(fā)產(chǎn)品體系;應(yīng)對(duì)中小企業(yè)在互聯(lián)網(wǎng)運(yùn)營(yíng)的各種問題,為中小企業(yè)在互聯(lián)網(wǎng)的運(yùn)營(yíng)中保駕護(hù)航。數(shù)據(jù)庫適合結(jié)構(gòu)化數(shù)據(jù)的精確查詢,而不適合非結(jié)構(gòu)化數(shù)據(jù)的模糊查詢及靈活搜索(特別是數(shù)據(jù)量大的時(shí)候),無法提供想要是實(shí)時(shí)性。
對(duì)于非結(jié)構(gòu)化的數(shù)據(jù)的檢索,只能對(duì)全部?jī)?nèi)容做分析(分詞)。
分詞后如何搜索?倒排索引and正排索引
倒排索引---根據(jù)你所搜索的text進(jìn)行分詞去文檔中搜索。
正排索引---將文檔進(jìn)行分詞匹配你搜索的關(guān)鍵字
這里有一個(gè)問題:數(shù)據(jù)庫是正排索引還是倒排索引?
ES是使用了Lucene做搜索框架來實(shí)現(xiàn)自己的搜索部分內(nèi)容。
?每小時(shí)能夠索引150G以上的數(shù)據(jù),對(duì)內(nèi)存的要求小,只需要1M的堆內(nèi)存,增量索引和批量索引一樣快。 索引的大小約為索引文本大小的20%~30%
強(qiáng)大的查詢方式支持短語查詢、通配符查詢、臨近查詢、范圍查詢等。支持多個(gè)索引查詢結(jié)果合并。支持更新操作和查詢操作同時(shí)進(jìn)行。支持高亮、join、分組結(jié)果功能。
作為開源項(xiàng)目,你可在商業(yè)或開源項(xiàng)目中使用。Lucene有多種語言實(shí)現(xiàn)版可選(Python、PHP、C++等)不只是Java
Lucene的索引結(jié)構(gòu)是有層次結(jié)構(gòu)的:索引、段、文檔、域、詞
Es企業(yè)應(yīng)用場(chǎng)景:
關(guān)系性數(shù)據(jù)庫 | Elasticsearch |
數(shù)據(jù)庫Database | index |
表table | Type |
數(shù)據(jù)行Row???????? | Document |
數(shù)據(jù)列Column | Field |
約束Schema | Mapping |
常用的操作:
Match Query
Match Phrase Query
//term --- 完全匹配
GET /tk-policy-testenv/_search
{
"query": {
"bool": {
"filter": [
{
"term": {
"myname_no": "7198220142418"
}
}
]
}
},
"sort": [
{
"@timestamp": {
"order": "desc"
}
}
],
"size": 100,
"from": 0
}
GET /data-repo-stream-testenv/_search
{
"query": {
"bool": {
"filter": [
{
"term": {
"key": "7_ESREPO:2cfd21a4b3a24747b3b624c3ead4f317"
}
}
]
}
},
"sort": [
{
"@timestamp": {
"order": "desc"
}
}
],
"size": 100,
"from": 0
}
GET /tencent:zx_hopen-2022.07/_search
{
"query": {
"bool": {
"must": [
{ "match": { "message": "HLCP-INSTALMENT"}},
{ "match": { "message": "我要進(jìn)行續(xù)期回調(diào)報(bào)文 = "}}
],
"should": [
{ "match": { "message": "H220615018793680123232" }}
]
}
}
GET /tencent:nt_zx_hopen-2022.08/_search?filter_path=hits.total,hits.hits._source&_source=message,log
{
"query": {
"bool": {
"must": [
{
"match_phrase": {
"message": {
"query": "服務(wù)名,TraceId"
}
}
}
]
,
"filter": [{
"match_phrase": {
"host.ip": "10.161.165.212"http://某一個(gè)服務(wù)的地址 用哪一個(gè)打開哪一個(gè)
//"host.ip": "10.161.165.114"
//"host.ip": "10.161.165.85"
//"host.ip": "10.161.165.102"
//"host.ip": "10.161.165.169"
//"host.ip": "10.161.165.203"
//"log.file.path" : "spbt_9001"
}
}]
}
},
"sort": [
{
"@timestamp": {
"order": "desc"
}
}
],
"size": 5,
"from": 0
}
可視化工具:Kibana是一個(gè)基于Node的索引數(shù)據(jù)統(tǒng)計(jì)工具,可以利用elk的聚合功能,生成各種圖表,如柱形圖、線狀圖、餅圖等。
特點(diǎn):
?日常工作中查看日志排查問題足夠,通過日志中的關(guān)鍵信息即可查詢到報(bào)錯(cuò)信息,利用各環(huán)境創(chuàng)建不同的索引,可以排查指定環(huán)境的日志,還可以查看各時(shí)間段的請(qǐng)求量,某一天的日志。結(jié)合Skywalking調(diào)用鏈路監(jiān)控將調(diào)用各服務(wù)相關(guān)日志聚合到ES同一個(gè)索引下,通過TraceId關(guān)聯(lián)一條事務(wù)的所有日志。
你是否還在尋找穩(wěn)定的海外服務(wù)器提供商?創(chuàng)新互聯(lián)www.cdcxhl.cn海外機(jī)房具備T級(jí)流量清洗系統(tǒng)配攻擊溯源,準(zhǔn)確流量調(diào)度確保服務(wù)器高可用性,企業(yè)級(jí)服務(wù)器適合批量采購(gòu),新人活動(dòng)首月15元起,快前往官網(wǎng)查看詳情吧