上次我們理解了維度表,哪什么是緩慢變化維呢,比如我們有這樣的一個(gè)場(chǎng)景, A 客戶在 4 月份的時(shí)候歸屬于 X 部門,在 5 月的時(shí)候歸屬于 Y 部門,如果 A 客戶的銷售額需要體現(xiàn)歸屬部門的變化關(guān)系。此時(shí)就需要用到緩慢變化維了。如下圖就是對(duì)客戶表的一個(gè)緩慢變化。
創(chuàng)新互聯(lián)專注于白山企業(yè)網(wǎng)站建設(shè),響應(yīng)式網(wǎng)站,電子商務(wù)商城網(wǎng)站建設(shè)。白山網(wǎng)站建設(shè)公司,為白山等地區(qū)提供建站服務(wù)。全流程定制設(shè)計(jì),專業(yè)設(shè)計(jì),全程項(xiàng)目跟蹤,創(chuàng)新互聯(lián)專業(yè)和態(tài)度為您提供的服務(wù)
上面設(shè)計(jì)就是對(duì)每個(gè)月把客戶生成一份數(shù)據(jù),但如果我們的客戶有 100 萬(wàn)個(gè)呢,每月生成一份,一年后就有 1200 萬(wàn)了,這樣導(dǎo)致數(shù)據(jù)量會(huì)很大,在關(guān)聯(lián)的時(shí)候會(huì)嚴(yán)重影響性能。哪么我們就需要用緩慢變化維的設(shè)計(jì)方案了,采用代理鍵方案來(lái)達(dá)到最少數(shù)據(jù)量。如下圖:
我們通過(guò)對(duì)客戶表的開(kāi)始日期和結(jié)束日期框定每個(gè)客戶的當(dāng)前版本,然后落地?cái)?shù)據(jù)時(shí)把客戶的代理鍵帶上,這樣以后在做數(shù)據(jù)分析時(shí),如果結(jié)果表帶的客戶維度信息不全,就可以直接用代理鍵關(guān)聯(lián)客戶維表帶出需要的維度,如果此時(shí)沒(méi)有代理鍵做關(guān)聯(lián),采用客戶代碼做關(guān)聯(lián),就會(huì)出現(xiàn)數(shù)據(jù)笛卡爾積,如下圖,當(dāng)我們需要對(duì)結(jié)果表增加客戶的“歸屬部門名稱”時(shí),有“代理鍵”信息時(shí),則直接按代理鍵做關(guān)聯(lián)條件帶出客戶維表里的“歸屬部門名稱”信息,如果按“客戶代碼”關(guān)聯(lián),則會(huì)導(dǎo)致數(shù)據(jù)翻倍,見(jiàn)紅色數(shù)據(jù)記錄, 4 月的由 100 變化到 200 了, 5 月份的 200 變化到 400 了,不然就需要重新計(jì)算每個(gè)月的數(shù)據(jù)才能達(dá)到增加“歸屬部門名稱”信息的目的。
生成緩慢變化維的 SQL 代碼見(jiàn) :
https://github.com/blt328/dw_blt
更多技術(shù)文章請(qǐng)關(guān)注公眾號(hào) ( 長(zhǎng)按后點(diǎn)識(shí)別圖中二維碼 ):