如何區(qū)hdfs、hbase、hive和hbase適用場景

這篇文章主要為大家展示了“如何區(qū)hdfs、hbase、hive和hbase適用場景”，內容簡而易懂，條理清晰，希望能夠幫助大家解決疑惑，下面讓小編帶領大家一起研究并學習一下“如何區(qū)hdfs、hbase、hive和hbase適用場景”這篇文章吧。

創(chuàng)新互聯(lián)服務項目包括平房網(wǎng)站建設、平房網(wǎng)站制作、平房網(wǎng)頁制作以及平房網(wǎng)絡營銷策劃等。多年來，我們專注于互聯(lián)網(wǎng)行業(yè)，利用自身積累的技術優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關系等，向廣大中小型企業(yè)、政府機構等提供互聯(lián)網(wǎng)行業(yè)的解決方案，平房網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟效益。目前，我們服務的客戶以成都為中心已經(jīng)輻射到平房省份的部分城市，未來相信會繼續(xù)擴大服務區(qū)域并繼續(xù)獲得客戶的支持與信任！

Hive

不想用程序語言開發(fā)MapReduce的朋友比如DB們，熟悉SQL的朋友可以使用Hive開離線的進行數(shù)據(jù)處理與分析工作。

注意Hive現(xiàn)在適合在離線下進行數(shù)據(jù)的操作，就是說不適合在掛在真實的生產(chǎn)環(huán)境中進行實時的在線查詢或操作，因為一個字“慢”。相反

起源于FaceBook,Hive在Hadoop中扮演數(shù)據(jù)倉庫的角色。建立在Hadoop集群的最頂層，對存儲在Hadoop群上的數(shù)據(jù)提供類SQL的接口進行操作。你可以用 HiveQL進行select,join,等等操作。

如果你有數(shù)據(jù)倉庫的需求并且你擅長寫SQL并且不想寫MapReduce jobs就可以用Hive代替。

HBase

HBase作為面向列的數(shù)據(jù)庫運行在HDFS之上，HDFS缺乏隨即讀寫操作，HBase正是為此而出現(xiàn)。HBase以Google BigTable為藍本，以鍵值對的形式存儲。項目的目標就是快速在主機內數(shù)十億行數(shù)據(jù)中定位所需的數(shù)據(jù)并訪問它。

HBase是一個數(shù)據(jù)庫，一個NOSQL的數(shù)據(jù)庫，像其他數(shù)據(jù)庫一樣提供隨即讀寫功能，Hadoop不能滿足實時需要，HBase正可以滿足。如果你需要實時訪問一些數(shù)據(jù)，就把它存入HBase。

你可以用Hadoop作為靜態(tài)數(shù)據(jù)倉庫，HBase作為數(shù)據(jù)存儲，放那些進行一些操作會改變的數(shù)據(jù)。

 hbase與hive都是架構在hadoop之上的。都是用hadoop作為底層存儲。而hbase是作為分布式數(shù)據(jù)庫，而hive是作為分布式數(shù)據(jù)倉庫。當然hive還是借用hadoop的MapReduce來完成一些hive中的命令的執(zhí)行。

什么場景下應用Hbase?

成熟的數(shù)據(jù)分析主題，查詢模式已經(jīng)確立，并且不會輕易改變。
傳統(tǒng)的關系型數(shù)據(jù)庫已經(jīng)無法承受負荷，高速插入，大量讀取。
適合海量的，但同時也是簡單的操作(例如：key-value)。

官方解釋：

Use Apache HBase? when you need random, realtime read/write access to your Big Data. This project's goal is the hosting of very large tables -- billions of rows X millions of columns -- atop clusters of commodity hardware. Apache HBase is an open-source, distributed, versioned, non-relational database modeled after Google's Bigtable: A Distributed Storage System for Structured Data by Chang et al. Just as Bigtable leverages the distributed data storage provided by the Google File System, Apache HBase provides Bigtable-like capabilities on top of Hadoop and HDFS.

Pig VS Hive

Hive更適合于數(shù)據(jù)倉庫的任務，Hive主要用于靜態(tài)的結構以及需要經(jīng)常分析的工作。Hive與SQL相似促使其成為Hadoop與其他BI工具結合的理想交集。

Pig賦予開發(fā)人員在大數(shù)據(jù)集領域更多的靈活性，并允許開發(fā)簡潔的腳本用于轉換數(shù)據(jù)流以便嵌入到較大的應用程序。

Pig相比Hive相對輕量，它主要的優(yōu)勢是相比于直接使用Hadoop Java APIs可大幅削減代碼量。正因為如此，Pig仍然是吸引大量的軟件開發(fā)人員。

Hive和Pig都可以與HBase組合使用，Hive和Pig還為HBase提供了高層語言支持，使得在HBase上進行數(shù)據(jù)統(tǒng)計處理變的非常簡單

Hive VS HBase

Hive是建立在Hadoop之上為了減少MapReduce jobs編寫工作的批處理系統(tǒng)，HBase是為了支持彌補Hadoop對實時操作的缺陷的項目。

想象你在操作RMDB數(shù)據(jù)庫，如果是全表掃描，就用Hive+Hadoop,如果是索引訪問，就用HBase+Hadoop 。

Hive query就是MapReduce jobs可以從5分鐘到數(shù)小時不止，HBase是非常高效的，肯定比Hive高效的多。

以上是“如何區(qū)hdfs、hbase、hive和hbase適用場景”這篇文章的所有內容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內容對大家有所幫助，如果還想學習更多知識，歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道！

分享名稱：如何區(qū)hdfs、hbase、hive和hbase適用場景
當前鏈接：http://weahome.cn/article/pgegei.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

如何區(qū)hdfs、hbase、hive和hbase適用場景

其他資訊

網(wǎng)站制作

企業(yè)服務

網(wǎng)站建設

服務器托管

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

如何區(qū)hdfs、hbase、hive和hbase適用場景

其他資訊

網(wǎng)站制作

企業(yè)服務

網(wǎng)站建設

服務器托管

如何區(qū)hdfs、hbase、hive和hbase適用場景