這篇文章主要介紹“Elasticsearch中store field與non-store field的區(qū)別是什么”,在日常操作中,相信很多人在Elasticsearch中store field與non-store field的區(qū)別是什么問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Elasticsearch中store field與non-store field的區(qū)別是什么”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!
綿竹網(wǎng)站制作公司哪家好,找成都創(chuàng)新互聯(lián)公司!從網(wǎng)頁設(shè)計、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、成都響應(yīng)式網(wǎng)站建設(shè)公司等網(wǎng)站項目制作,到程序開發(fā),運營維護。成都創(chuàng)新互聯(lián)公司2013年開創(chuàng)至今到現(xiàn)在10年的時間,我們擁有了豐富的建站經(jīng)驗和運維經(jīng)驗,來保證我們的工作的順利進行。專注于網(wǎng)站建設(shè)就選成都創(chuàng)新互聯(lián)公司。
在定義index的mapping的時候,我們可以指定某些fields是否要store(默認(rèn)是不store)
PUT /my_index { "mappings": { "my_type": { "properties": { "title": { "type": "string", "store": true }, "date": { "type": "date", "store": true }, "content": { "type": "string" } } } } }
其實不管你將store設(shè)置為ture or false, elasticsearch都將為我們存儲這些field, 不同的是:
當(dāng)store為false時(默認(rèn)配置),這些field只存儲在"_source" field中。
當(dāng)store為true時,這些field的value會存儲在一個跟_source平級的獨立的field中。同時也會存儲在_source中,所以有兩份拷貝。
_source field在索引的mapping 中disable了。這種情況下,如果不將某個field定義成store=true,那些將無法在返回的查詢結(jié)果中看到這個field.
_source的內(nèi)容非常大。這時候如果我們想要在返回的_source document中解釋出某個field的值的話,開銷會很大(當(dāng)然你也可以定義source filtering將減少network overhead),比例某個document中保存的是一本書,所以document中可能有這些field: title, date, content。假如我們只是想查詢書的title 跟date信息,而不需要解釋整個_source(非常大),這個時候我們可以考慮將title, date這些field設(shè)置成store=true。
需要注意的是,看起來將field store可以減少查詢的開銷,但其實這樣也會加大disk的訪問頻率。假如你將_source中的10個field都定義store,那么在你查詢這些field的時候會將會有10次disk seek的操作。而返回_source只有一次disk seek的操作。所以這個也是我們在定義的時候需要blance的。
眾所周知_source字段存儲的是索引的原始內(nèi)容,那store屬性的設(shè)置是為何呢?es為什么要把store的默認(rèn)取值設(shè)置為no?設(shè)置為yes是否是重復(fù)的存儲呢?
我們將一個field的值寫入es中,要么是想在這個field上執(zhí)行search操作(不知道具體的id),要么執(zhí)行retrieve操作(根據(jù)id來檢索)。但是,如果不顯式的將該field的store屬性設(shè)置為yes,同時_source字段enabled的情況下,你仍然可以獲取到這個field的值。這就意味著在一些情況下讓一個field不被index或者store仍然是有意義的。
當(dāng)你將一個field的store屬性設(shè)置為true,這個會在lucene層面處理。lucene是倒排索引,可以執(zhí)行快速的全文檢索,返回符合檢索條件的文檔id列表。在全文索引之外,lucene也提供了存儲字段的值的特性,以支持提供id的查詢(根據(jù)id得到原始信息)。通常我們在lucene層面存儲的field的值是跟隨search請求一起返回的(id+field的值)。es并不需要存儲你想返回的每一個field的值,因為默認(rèn)情況下每一個文檔的的完整信息都已經(jīng)存儲了,因此可以跟隨查詢結(jié)構(gòu)返回你想要的所有field值。
有一些情況下,顯式的存儲某些field的值是必須的:當(dāng)_source被disabled的時候,或者你并不想從source中parser來得到field的值(即使這個過程是自動的)。請記住:從每一個stored field中獲取值都需要一次磁盤io,如果想獲取多個field的值,就需要多次磁盤io,但是,如果從_source中獲取多個field的值,則只需要一次磁盤io,因為_source只是一個字段而已。所以在大多數(shù)情況下,從_source中獲取是快速而高效的。
es中默認(rèn)的設(shè)置_source是enable的,存儲整個文檔的值。這意味著在執(zhí)行search操作的時候可以返回整個文檔的信息。如果不想返回這個文檔的完整信息,也可以指定要求返回的field,es會自動從_source中抽取出指定field的值返回(比如說highlighting的需求)。
你可以指定一些字段store為true,這意味著這個field的數(shù)據(jù)將會被單獨存儲。這時候,如果你要求返回field1(store:yes),es會分辨出field1已經(jīng)被存儲了,因此不會從_source中加載,而是從field1的存儲塊中加載。
哪些情形下需要顯式的指定store屬性呢?大多數(shù)情況并不是必須的。從_source中獲取值是快速而且高效的。如果你的文檔長度很長,存儲_source或者從_source中獲取field的代價很大,你可以顯式的將某些field的store屬性設(shè)置為yes。缺點如上邊所說:假設(shè)你存儲了10個field,而如果想獲取這10個field的值,則需要多次的io,如果從_source中獲取則只需要一次,而且_source是被壓縮過的。
還有一種情形:reindex from some field,對某些字段重建索引的時候。從source中讀取數(shù)據(jù)然后reindex,和從某些field中讀取數(shù)據(jù)相比,顯然后者代價更低一些。這些字段store設(shè)置為yes比較合適。
到此,關(guān)于“Elasticsearch中store field與non-store field的區(qū)別是什么”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識,請繼續(xù)關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>
網(wǎng)站標(biāo)題:Elasticsearch中storefield與non-storefield的區(qū)別是什么
網(wǎng)址分享:http://weahome.cn/article/goghjs.html