參數(shù)拼接到查詢路勁中查詢,查詢可以不指定 type 的類型
創(chuàng)新互聯(lián)建站是一家集網(wǎng)站建設(shè),元寶企業(yè)網(wǎng)站建設(shè),元寶品牌網(wǎng)站建設(shè),網(wǎng)站定制,元寶網(wǎng)站建設(shè)報價,網(wǎng)絡營銷,網(wǎng)絡優(yōu)化,元寶網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。
查詢結(jié)果部分字段說明:
value值部分會作為整體被查詢, 不會被分詞, 與match做區(qū)分, match的value是會被分詞作匹配查詢的.
返回的文檔必須滿足must子句的條件,并且參與計算分值
返回的文檔必須滿足filter子句的條件。但是不會像Must一樣,參與計算分值
返回的文檔可能滿足should子句的條件。在一個Bool查詢中,如果沒有must或者filter,有一個或者多個should子句,那么只要滿足一個就可以返回。minimum_should_match參數(shù)定義了至少滿足幾個子句, 默認情況是1
返回的文檔必須不滿足must_not定義的條件。
如果一個查詢既有filter又有should,那么至少包含一個should子句。
bool查詢也支持禁用協(xié)同計分選項disable_coord。一般計算分值的因素取決于所有的查詢條件。
bool查詢也是采用more_matches_is_better的機制,因此滿足must和should子句的文檔將會合并起來計算分值。
使用 _source 可以只查詢需要展示的列, 相當于 sql 的 select offset,methodName from ...
from表示從第幾行開始,size表示查詢多少條文檔。from默認為0,size默認為10,
如
聚合查詢的結(jié)構(gòu):
舉例說明:
比如求所有文檔某個字段求最大、最小、和、平均值, 可以對某個field進行計算.
以avg為例, 計算offset在所有文檔中的均值
運行結(jié)果:
該聚合一般域其它 single-value 聚合聯(lián)合使用,比如在計算一個字段的平均值的時候,可能還會關(guān)注這個平均值是由多少個值計算而來。
例子:統(tǒng)計搜索結(jié)果中maiDianType字段出現(xiàn)的次數(shù)
搜索結(jié)果:
基于文檔的某個值(可以是特定的字段,也可以通過腳本計算而來),計算文檔非重復的個數(shù)(去重計數(shù)),相當于sql中的distinct。
例子: 統(tǒng)計搜索結(jié)果中maiDianType出現(xiàn)的種類
搜索結(jié)果: maiDianType共有6種值
基于文檔的某個值(可以是特定的數(shù)值型字段,也可以通過腳本計算而來),計算出一些統(tǒng)計信息(min、max、sum、count、avg5個值)。
例子: 基于useTime進行值統(tǒng)計
ps: 這個例子中是基于腳本進行的統(tǒng)計
統(tǒng)計結(jié)果:
與stats功能相似, 比stats多4個統(tǒng)計結(jié)果: 平方和、方差、標準差、平均值加/減兩個標準差的區(qū)間
例子:
結(jié)果:
對指定字段(腳本)的值按從小到大累計每個值對應的文檔數(shù)的占比(占所有命中文檔數(shù)的百分比),返回指定占比比例對應的值。默認返回[ 1, 5, 25, 50, 75, 95, 99 ]分位上的值,也可以指定分位置.
例子:
結(jié)果:
ps:
"1.0":30 代表: useTime30的, 占比1%
"99.0":237 代表: useTime237的, 占比99%
例子: 指定聚合的百分比
查詢結(jié)果:
詞聚合?;谀硞€field,該 field 內(nèi)的每一個【唯一詞元】為一個桶,每個桶內(nèi)可以做再次聚合.
列子: 以prodSubNo的每個值作為聚合, 聚合結(jié)果默認排序為從大到小
搜索結(jié)果:
doc_count_error_upper_bound: //文檔計數(shù)的最大偏差值
sum_other_doc_count: , //未返回的其他項的文檔數(shù)
列子: 以prodSubNo的每個值作為聚合, 得到的桶繼續(xù)做avg子聚合, 得到每個prodSubNo下的useTime的avg聚合結(jié)果
搜索結(jié)果:
基于一個條件,來對當前的文檔進行過濾的聚合。
例子: 對查詢結(jié)果進行過濾, prodSubNo=601001聚合過濾, 可對過濾后的內(nèi)容進行子聚合查詢, 這里使用stats統(tǒng)計聚合
查詢結(jié)果:
基于多個過濾條件,來對當前文檔進行【過濾】的聚合,每個過濾都包含所有滿足它的文檔(多個bucket中可能重復),先過濾再聚合。
例子: 使用prodSubNo=601001和maiDianType=script分別對索引結(jié)果進行過濾
搜索結(jié)果:
范圍分組聚合?;谀硞€值(可以是 field 或 script),以【字段范圍】來桶分聚合。范圍聚合包括 from 值,不包括 to 值(區(qū)間前閉后開)。
例子: 對于useTime字段值進行0-20和20-40范圍內(nèi)的聚合
ps: 對范圍聚合后的結(jié)果,還可以進行子聚合
搜索結(jié)果:
elasticsearch可以代替NoSQL的。
優(yōu)點:
1.高并發(fā)。實測es單機分配10g內(nèi)存單實例,寫入能力1200qps,60g內(nèi)存、12核CPU起3個實例預計可達到6000qps。
2.同機房單條數(shù)據(jù)寫入平均3ms(比mysql慢,mg不清楚)
3.容錯能力比mg強。比如1主多從,主片掛了從片會自動頂上
4.滿足大數(shù)據(jù)下實時讀寫需求,無需分庫(不存在庫的概念)。
5.易擴展。實例間做下配置即可擴展并發(fā)性和容積,自動分配的寫入機制,無需操心傳統(tǒng)db中多主同步的詬病
6.支持較復雜的條件查詢,group by、排序都不是問題
7.具有一定的關(guān)系性,但不用擔心大字段的問題
缺點:
1.不支持事務
2.讀寫有一定延時(不知道其他大牛是否遇到這個問題),我是寫入一分鐘后再做讀操作
3.無權(quán)限管理
也是最近開始用,說下我的應用場景,用來存儲線上日志做實時分析(類似淘寶鷹眼,但是完全實時),存儲結(jié)構(gòu)化的日志及原文,也調(diào)研過很多db,mg也有考慮過,相比之下實現(xiàn)和運維成本mg都要高不少
我的場景如下:
1.高并發(fā),設(shè)計日志并發(fā)80wqps(實際存儲會用一些策略縮小規(guī)模,約萬級別)
2.單條數(shù)據(jù)體積大,允許最大20k
3.要求支持條件查詢
4.實時性高,目前從日志存儲開始到出分析結(jié)果3分鐘,包含前面提到的讀寫延時(求解決方案)
es的分詞器往往包括3個低級構(gòu)建塊包:
Standard Analyzer
標準分析儀按照Unicode文本分段算法的定義,將文本分割成單詞邊界的分詞。它刪除了大多數(shù)標點符號,小寫顯示分詞,并支持刪除stop words。
Simple Analyzer
當遇到不是字母的字符時,簡單的分析器會將文本分成條目。小寫顯示分詞。
Whitespace Analyzer
空格分析器遇到任何空格字符時都會將文本分為多個項目。不會把分詞轉(zhuǎn)換為小寫字母。
Stop Analyzer
停止分析儀和Simple Analyzer類似,但也支持stop words的刪除。
Keyword Analyzer
一個“noop”分析器,它可以接受任何給定的文本,并輸出完全相同的文本作為一個單詞。
Pattern Analyzer
使用正則表達式拆分分詞,支持lower-casing和stop words。
Language Analyzers
Elasticsearch提供許多語言特定的分析器,如英語或法語。
Fingerprint Analyzer
一個專門的分析儀,它可以創(chuàng)建一個可用于重復檢測的指紋。
對中文文本以英文逗號作為分隔符分詞:
將分析器設(shè)置到索引上
獲取分詞結(jié)果
es 節(jié)點層面的默認分詞設(shè)置已經(jīng)廢棄,不支持了。就是說在 elasticsearch.yml 配置諸如:
無效,會導致es啟動失?。?/p>
推薦在索引層面動態(tài)設(shè)置。