創(chuàng)新互聯(lián)www.cdcxhl.cn八線動態(tài)BGP香港云服務(wù)器提供商,新人活動買多久送多久,劃算不套路!
創(chuàng)新互聯(lián)公司憑借在網(wǎng)站建設(shè)、網(wǎng)站推廣領(lǐng)域領(lǐng)先的技術(shù)能力和多年的行業(yè)經(jīng)驗,為客戶提供超值的營銷型網(wǎng)站建設(shè)服務(wù),我們始終認為:好的營銷型網(wǎng)站就是好的業(yè)務(wù)員。我們已成功為企業(yè)單位、個人等客戶提供了做網(wǎng)站、網(wǎng)站設(shè)計服務(wù),以良好的商業(yè)信譽,完善的服務(wù)及深厚的技術(shù)力量處于同行領(lǐng)先地位。什么是大數(shù)據(jù)脫敏?針對這個問題,這篇文章詳細介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
大數(shù)據(jù)數(shù)據(jù)脫敏,又稱數(shù)據(jù)漂白、數(shù)據(jù)去隱私化或數(shù)據(jù)變形,是指對某些敏感信息通過脫敏規(guī)則進行數(shù)據(jù)的變形,實現(xiàn)敏感隱私數(shù)據(jù)的可靠保護,這樣在開發(fā)、測試和其它非生產(chǎn)環(huán)境以及外包環(huán)境中安全地使用脫敏后的真實數(shù)據(jù)集。
隱私數(shù)據(jù)脫敏技術(shù)
通常在大數(shù)據(jù)平臺中,數(shù)據(jù)以結(jié)構(gòu)化的格式存儲,每個表有諸多行組成,每行數(shù)據(jù)有諸多列組成。根據(jù)列的數(shù)據(jù)屬性,數(shù)據(jù)列通??梢苑譃橐韵聨追N類型:
可確切定位某個人的列,稱為可識別列,如身份證號,地址以及姓名等。
單列并不能定位個人,但是多列信息可用來潛在的識別某個人,這些列被稱為半識別列,如郵編號,生日及性別等。美國的一份研究論文稱,僅使用郵編號,生日和性別信息即可識別87%的美國人[3]。
包含用戶敏感信息的列,如交易數(shù)額,疾病以及收入等。
其他不包含用戶敏感信息的列。
所謂避免隱私數(shù)據(jù)泄露,是指避免使用數(shù)據(jù)的人員(數(shù)據(jù)分析師,BI工程師等)將某行數(shù)據(jù)識別為某個人的信息。數(shù)據(jù)脫敏技術(shù)通過對數(shù)據(jù)進行脫敏,如移除識別列,轉(zhuǎn)換半識別列等方式,使得數(shù)據(jù)使用人員在保證可對#2(轉(zhuǎn)換后)半識別列,#3敏感信息列以及#4其他列進行數(shù)據(jù)分析的基礎(chǔ)上,在一定程度上保證其無法根據(jù)數(shù)據(jù)反識別用戶,達到保證數(shù)據(jù)安全與大化挖掘數(shù)據(jù)價值的平衡。
隱私數(shù)據(jù)泄露類型
隱私數(shù)據(jù)泄露可以分為多種類型,根據(jù)不同的類型,通常可以采用不同的隱私數(shù)據(jù)泄露風(fēng)險模型來衡量防止隱私數(shù)據(jù)泄露的風(fēng)險,以及對應(yīng)不同的數(shù)據(jù)脫敏算法對數(shù)據(jù)進行脫敏。一般來說,隱私數(shù)據(jù)泄露類型包括:
個人標識泄露。當(dāng)數(shù)據(jù)使用人員通過任何方式確認數(shù)據(jù)表中某條數(shù)據(jù)屬于某個人時,稱為個人標識泄露。個人標識泄露最為嚴重,因為一旦發(fā)生個人標識泄露,數(shù)據(jù)使用人員就可以得到具體個人的敏感信息。
屬性泄露,當(dāng)數(shù)據(jù)使用人員根據(jù)其訪問的數(shù)據(jù)表了解到某個人新的屬性信息時,稱為屬性泄露。個人標識泄露肯定會導(dǎo)致屬性泄露,但屬性泄露也有可能單獨發(fā)生。
成員關(guān)系泄露。當(dāng)數(shù)據(jù)使用人員可以確認某個人的數(shù)據(jù)存在于數(shù)據(jù)表中時,稱為成員關(guān)系泄露。成員關(guān)系泄露相對風(fēng)險較小,個人標識泄露與屬性泄露肯定意味著成員關(guān)系泄露,但成員關(guān)系泄露也有可能單獨發(fā)生。
隱私數(shù)據(jù)泄露風(fēng)險模型
將數(shù)據(jù)開放給數(shù)據(jù)分析人員,同時就引入了隱私數(shù)據(jù)泄露的風(fēng)險。在限制隱私數(shù)據(jù)泄露風(fēng)險在一定范圍內(nèi)的同時,大化數(shù)據(jù)分析挖掘的潛力,是數(shù)據(jù)脫敏技術(shù)的最終目標。目前在隱私數(shù)據(jù)脫敏領(lǐng)域,有幾個不同的模型可以用來從不同角度衡量數(shù)據(jù)可能存在的隱私數(shù)據(jù)泄露風(fēng)險。
關(guān)于什么是大數(shù)據(jù)脫敏問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道了解更多相關(guān)知識。