本篇內(nèi)容主要講解“怎么用HDFS恢復(fù)被刪除的文件”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“怎么用HDFS恢復(fù)被刪除的文件”吧!
東區(qū)ssl適用于網(wǎng)站、小程序/APP、API接口等需要進(jìn)行數(shù)據(jù)傳輸應(yīng)用場(chǎng)景,ssl證書未來(lái)市場(chǎng)廣闊!成為創(chuàng)新互聯(lián)的ssl證書銷售渠道,可以享受市場(chǎng)價(jià)格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:18982081108(備注:SSL證書合作)期待與您的合作!
Hadoop有一個(gè)“垃圾回收站”的功能,用于恢復(fù)在過(guò)去一段時(shí)間內(nèi)被刪除文件。若某個(gè)文件被刪除了多次,你還可以恢復(fù)具體哪一次刪除的文件。該功能默認(rèn)是關(guān)閉狀態(tài),若想開(kāi)啟,需要在$HADOOP_HOME/etc/hadoop/core-site.xml文件中,添加以下配置:
fs.trash.interval 10
上面的配置意思為:Hadoop會(huì)設(shè)立一個(gè)回收站,回收站每隔10分鐘清空一次。
若在一個(gè)回收周期內(nèi)多次刪除同一個(gè)文件或目錄,則Trash內(nèi)會(huì)分版本保存你每次刪除的文件。這就意味你可以恢復(fù)在某個(gè)時(shí)刻所刪除的文件。
舉個(gè)例子:
時(shí)間點(diǎn) | 動(dòng)作 | Trash內(nèi)容 |
12:40 | 回收站清空 | empty |
12:41 | 刪除fruit.data | fruit.data |
12:42 | 重新上傳fruit.data且再次刪除fruit.data | fruit.data,fruit.data1446352935186 |
12:45 | 重新上傳fruit.data且再次刪除fruit.data | fruit.data,fruit.data1446352935186,fruit.data1446353100390 |
12:50 | 回收站清空 | empty |
根據(jù)上表,在12:41第二次刪除friut.data,回收站中出現(xiàn)了fruit.?data1446352935186?,后面的那串?dāng)?shù)字就是你刪除時(shí)刻的時(shí)間戳。那么我們就可在垃圾回收站清空之前,恢復(fù)12:41或12:45刪除的文件。
結(jié)合hive的使用,一般會(huì)有很多定時(shí)任務(wù)向hive中插入更新數(shù)據(jù),那么.Trash中針對(duì)某個(gè)table就會(huì)有很多個(gè)版本的存在,若想查看某個(gè)時(shí)刻的數(shù)據(jù),只要在Trash中把該時(shí)間的數(shù)據(jù)恢復(fù)即可,針對(duì)誤刪特別有用。
到此,相信大家對(duì)“怎么用HDFS恢復(fù)被刪除的文件”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!