這篇文章給大家分享的是有關(guān)HBase中的基本概念是什么的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
五河網(wǎng)站建設(shè)公司成都創(chuàng)新互聯(lián),五河網(wǎng)站設(shè)計制作,有大型網(wǎng)站制作公司豐富經(jīng)驗。已為五河1000+提供企業(yè)網(wǎng)站建設(shè)服務(wù)。企業(yè)網(wǎng)站搭建\外貿(mào)營銷網(wǎng)站建設(shè)要多少錢,請找那個售后服務(wù)好的五河做網(wǎng)站的公司定做!HBase是Google Bigtable的開源實現(xiàn)。HBase是一個開源的、分布式的、多版本的、面向列的存儲模型。HBase利用HDFS作為其文件系統(tǒng)(或本地),還可以通過MapReduce計算模型來并行處理大數(shù)據(jù)。
HBase中的基本概念:
Row Key
1) Row key是檢索記錄的主鍵。
2) Row key行鍵 (Row key)可以是任意字符串(長度是 64KB,實際應(yīng)用中長度一般為 10-100bytes),在hbase內(nèi)部,row key保存為字節(jié)數(shù)組。
3) 數(shù)據(jù)按照Row key的字典序(byte order)排序存儲。設(shè)計key時,要充分排序存儲這個特性,將經(jīng)常一起讀取的行存儲放到一起。(位置相關(guān)性)
4) 行的讀寫是原子操作。
Column family (列族)
1) HBase表中的每個列都屬于某個列族,列族必須作為表模式(schema)定義的一部分預(yù)先給出,必須在使用表之前定義。列名都是以列族作為前綴,中間以冒號(:)隔開,如:courses:math。
2) 訪問控制、磁盤和內(nèi)存的使用統(tǒng)計都是在列族層面進(jìn)行的。實際應(yīng)用中,列族上的控制權(quán)限能幫助我們管理不同類型的應(yīng)用:我們允許一些應(yīng)用可以添加新的基本數(shù)據(jù)、一些應(yīng)用可以讀取基本數(shù)據(jù)并創(chuàng)建繼承的列族、一些應(yīng)用則只允許瀏覽數(shù)據(jù)(甚至可能因為隱私的原因不能瀏覽所有數(shù)據(jù))。
Cell (存儲單元)
由{row key, column(=
Timestamp(時間戳)
1) 每個cell都保存著同一個數(shù)據(jù)的多個版本,版本通過時間戳來索引。
2) 時間戳為64位整型。
3) 可以自動賦值(當(dāng)前系統(tǒng)時間),也可以用戶自己指定。
4) 不同版本數(shù)據(jù)按照時間戳倒序排。
5) HBase提供了兩種數(shù)據(jù)版本回收機(jī)制:a. 保存數(shù)據(jù)最后n個版本;b. 保存最近一段時間內(nèi)的版本。用戶可以針對每個列族去設(shè)置。
感謝各位的閱讀!關(guān)于“HBase中的基本概念是什么”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!