創(chuàng)新互聯(lián)www.cdcxhl.cn八線動(dòng)態(tài)BGP香港云服務(wù)器提供商,新人活動(dòng)買多久送多久,劃算不套路!
這篇文章將為大家詳細(xì)講解有關(guān)hive支持mongodb具體的連接方法,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。
hive支持mongodb,具體的連接方法如下:
創(chuàng)建基于MongoDB的Hive表是通過MongoStorageHandler來處理的。它同樣處理從Hive表里查詢與插入數(shù)據(jù)(通過select與insert)。
CREATE [EXTERNAL] TABLE( ) STORED BY 'com.mongodb.hadoop.hive.MongoStorageHandler' [WITH SERDEPROPERTIES('mongo.columns.mapping'=' ')] TBLPROPERTIES('mongo.uri'=' ');
有兩種方式來指定所需連接的Mongo Collection。
1. 在上述示例里面,通過mongo.uri這個(gè)表屬性來指定,屬性的值填入的是MongoDB connection string,通過它來指向具體的collection。這種方式會(huì)將這個(gè)URI存入表的metadata里面,如果需要填寫連接的一些認(rèn)證信息(如username:password等),該方式不太適合。
2. 第二種方式是把connection string填入一個(gè)properties文件,如:
# HiveTable.properties mongo.input.uri=mongodb://...
然后提供這個(gè)文件的路徑給mongo.properties.path這個(gè)表參數(shù),如
CREATE TABLE ... TBLPROPERTIES('mongo.properties.path'='HiveTable.properties')
備注:在創(chuàng)建相應(yīng)Hive表時(shí)所引用的MongoDB collection不一定要空的。
在創(chuàng)建Hive表的時(shí)候,也可以選擇性的指定MongoDB collection里的字段與Hive的列字段或struct字段的映射。指定的方式是在SERDEPROPERTIES里通過mongo.columns.mapping屬性來指定。在創(chuàng)建基于BSON文件的Hive表時(shí)也可以用到。
如果創(chuàng)建的表是EXTERNAL的,那么在Hive里刪除這張表時(shí),不會(huì)影響MongoDB里面的數(shù)據(jù),只會(huì)刪除這張表的metadata。如果沒有指定EXTERNAL,那么刪除表的時(shí)候會(huì)連帶MongoDB里的數(shù)據(jù)一并刪除,因此最好是指定創(chuàng)建的表為EXTERNAL。
關(guān)于hive支持mongodb具體的連接方法就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。