Cassandra和HBase中怎樣使用的BigTable模型

這篇文章將為大家詳細(xì)講解有關(guān)Cassandra和HBase中怎樣使用的BigTable模型，文章內(nèi)容質(zhì)量較高，因此小編分享給大家做個(gè)參考，希望大家閱讀完這篇文章后對(duì)相關(guān)知識(shí)有一定的了解。

成都網(wǎng)站制作、網(wǎng)站設(shè)計(jì)服務(wù)團(tuán)隊(duì)是一支充滿著熱情的團(tuán)隊(duì)，執(zhí)著、敏銳、追求更好，是創(chuàng)新互聯(lián)的標(biāo)準(zhǔn)與要求，同時(shí)竭誠為客戶提供服務(wù)是我們的理念。創(chuàng)新互聯(lián)把每個(gè)網(wǎng)站當(dāng)做一個(gè)產(chǎn)品來開發(fā)，精雕細(xì)琢，追求一名工匠心中的細(xì)致，我們更用心！

眾所周知，BigTable是NoSql數(shù)據(jù)庫的王者，其論文更是NOSQL理論的基石，但遺憾的是BigTable不開源，于是有了開源的BigTable版本這一說法，其中的佼佼者包括今天提到的兩位：Cassandra和HBase。下面創(chuàng)新互聯(lián)小編來講解下Cassandra和HBase中怎樣使用的BigTable模型?

1.FundamentallyDistributed（分布式存儲(chǔ)）

項(xiàng)目從最初規(guī)劃上，就是為海量數(shù)據(jù)服務(wù)的，當(dāng)然分布式存儲(chǔ)的思想也是扎根于其血脈中。分布式系統(tǒng)主要需要考慮兩個(gè)方面：partitioning（分區(qū)存儲(chǔ)，也可以理解為通常說的Sharding）、replication（數(shù)據(jù)復(fù)制，主要是將數(shù)據(jù)復(fù)制成多份以提高可用性）。

2.ColumnOriented（列式存儲(chǔ)）

和普通的RDBMS不一樣，普通的RDBMS通常是行式存儲(chǔ)的，一行數(shù)據(jù)是連續(xù)存在一段磁盤空間上的。而列式存儲(chǔ)是將各個(gè)列分別進(jìn)行連續(xù)的存儲(chǔ)。也正是因此，它對(duì)于處理字段中的NULL字段，能夠不占用過多的空間。同時(shí)能夠支持靈活松散的列定義。也就是我們通常所說的schema-less。

Cassandra和HBase中怎樣使用的BigTable模型

3.Sequentialwrite（順序?qū)懘疟P）

BigTable型系統(tǒng)的一個(gè)特點(diǎn)是其對(duì)寫性能進(jìn)行的優(yōu)化。它的寫都是通過先記一條操作日志，然后直接寫在內(nèi)存中的數(shù)據(jù)集合，然后其集合按條件或定時(shí)將數(shù)據(jù)flush到磁盤。這里涉及到的記操作日志或者數(shù)據(jù)flush到磁盤都會(huì)順序的磁盤操作。故而避免了磁盤隨機(jī)操作造成的無謂的磁盤尋道時(shí)間。

4.Mergedread（讀操作數(shù)據(jù)合并）

上面說到寫操作是通過定時(shí)將數(shù)據(jù)直接flush到磁盤進(jìn)行的，每次flush都會(huì)生成一個(gè)數(shù)據(jù)塊，那可能造成一個(gè)數(shù)據(jù)在多個(gè)數(shù)據(jù)塊中的情況，而在讀的時(shí)候就需要將這多個(gè)版本中的值進(jìn)行合并。其中在判斷一個(gè)數(shù)據(jù)塊是否包含指定值時(shí)使用了bloom-filter算法。

5.PeriodicDataCompaction（定期數(shù)據(jù)合并）

同樣是上面說到的，一個(gè)數(shù)據(jù)可能存在于多個(gè)數(shù)據(jù)塊，如果我們不做處理，隨著時(shí)間的推移，數(shù)據(jù)塊會(huì)越來越多。所以BigTable型系統(tǒng)會(huì)進(jìn)行定時(shí)的數(shù)據(jù)合并。在上面講到的將內(nèi)存中的數(shù)據(jù)直接flush到磁盤的過程中，flush之前進(jìn)行了一次數(shù)據(jù)的排序操作，既是說存在磁盤中的塊中的數(shù)據(jù)，都是順序的，那么對(duì)一堆順序的數(shù)據(jù)進(jìn)行排重合并，其實(shí)和我們熟知的多路歸并排序很相似。故而其定時(shí)數(shù)據(jù)合并的效率也是非常高的。

關(guān)于Cassandra和HBase中怎樣使用的BigTable模型就分享到這里了，希望以上內(nèi)容可以對(duì)大家有一定的幫助，可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò)，可以把它分享出去讓更多的人看到。

分享名稱：Cassandra和HBase中怎樣使用的BigTable模型
分享地址：http://weahome.cn/article/igsghi.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

Cassandra和HBase中怎樣使用的BigTable模型

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管