這篇文章將為大家詳細講解有關(guān)hive支持MongoDB具體的連接方法,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
創(chuàng)新互聯(lián)-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價比甘谷網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式甘谷網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋甘谷地區(qū)。費用合理售后完善,10年實體公司更值得信賴。
hive支持mongodb,具體的連接方法如下:
創(chuàng)建基于MongoDB的Hive表是通過MongoStorageHandler來處理的。它同樣處理從Hive表里查詢與插入數(shù)據(jù)(通過select與insert)。
CREATE [EXTERNAL] TABLE( ) STORED BY 'com.mongodb.hadoop.hive.MongoStorageHandler' [WITH SERDEPROPERTIES('mongo.columns.mapping'=' ')] TBLPROPERTIES('mongo.uri'=' ');
有兩種方式來指定所需連接的Mongo Collection。
1. 在上述示例里面,通過mongo.uri這個表屬性來指定,屬性的值填入的是MongoDB connection string,通過它來指向具體的collection。這種方式會將這個URI存入表的metadata里面,如果需要填寫連接的一些認證信息(如username:password等),該方式不太適合。
2. 第二種方式是把connection string填入一個properties文件,如:
# HiveTable.properties mongo.input.uri=mongodb://...
然后提供這個文件的路徑給mongo.properties.path這個表參數(shù),如
CREATE TABLE ... TBLPROPERTIES('mongo.properties.path'='HiveTable.properties')
備注:在創(chuàng)建相應(yīng)Hive表時所引用的MongoDB collection不一定要空的。
在創(chuàng)建Hive表的時候,也可以選擇性的指定MongoDB collection里的字段與Hive的列字段或struct字段的映射。指定的方式是在SERDEPROPERTIES里通過mongo.columns.mapping屬性來指定。在創(chuàng)建基于BSON文件的Hive表時也可以用到。
如果創(chuàng)建的表是EXTERNAL的,那么在Hive里刪除這張表時,不會影響MongoDB里面的數(shù)據(jù),只會刪除這張表的metadata。如果沒有指定EXTERNAL,那么刪除表的時候會連帶MongoDB里的數(shù)據(jù)一并刪除,因此最好是指定創(chuàng)建的表為EXTERNAL。
關(guān)于hive支持mongodb具體的連接方法就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。