小編給大家分享一下hive是什么工具,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對這個行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價值的長期合作伙伴,公司提供的服務(wù)項目有:域名與空間、網(wǎng)頁空間、營銷軟件、網(wǎng)站建設(shè)、上高網(wǎng)站維護(hù)、網(wǎng)站推廣。
hive是基于Hadoop的一個數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供簡單的sql查詢功能,可以將sql語句轉(zhuǎn)換為MapReduce任務(wù)進(jìn)行運(yùn)行,其優(yōu)點是學(xué)習(xí)成本低,可以通過類SQL語句快速實現(xiàn)簡單的MapReduce統(tǒng)計,不必開發(fā)專門的MapReduce應(yīng)用,十分適合數(shù)據(jù)倉庫的統(tǒng)計分析.
hive是建立在Hadoop上的數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),它提供了一系列的工具,可以用來進(jìn)行數(shù)據(jù)提取轉(zhuǎn)化加載(ETL),這是一種可以存儲、查詢和分析存儲在Hadoop中的大規(guī)模數(shù)據(jù)的機(jī)制。
hive定義了簡單的類SQL查詢語言,稱為HQL,它允許熟悉SQL的用戶查詢數(shù)據(jù)。同時,這個語言也允許熟悉MapReduce開發(fā)者的開發(fā)自定義的mapper和reduce來處理內(nèi)建的mapper和reduce無法完成的復(fù)雜的分析工作.
hive沒有專門的數(shù)據(jù)格式,hive可以很好的工作在Thrift之上,控制分隔符,也允許用戶指定數(shù)據(jù)格式.
hive是基于hadoop的sql解析引擎.
在hive中運(yùn)行的是sql.hive中的sql非常接近MySQL的sql語法.
hiveQL中的數(shù)據(jù)庫、表、字段、類型與hadoop上的文件結(jié)構(gòu)的對比.
數(shù)據(jù)庫----------文件夾
表--------------文件夾
表中數(shù)據(jù)-------文件夾中的數(shù)據(jù)文件
字段------------數(shù)據(jù)文件中的列
hiveQL運(yùn)行-----MapReduce
hiveQL中的表信息必須映射成HDFS中的文件信息,類似于Hibernate的配置文件(*.hmb.xml)。
這些映射信息不實存放在文件中,而是存放在RDBMS(derby,mysql)中.
以上是“hive是什么工具”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!