這篇文章給大家介紹大數(shù)據(jù)中緩慢變化維常見解決方案是什么,內(nèi)容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
青州ssl適用于網(wǎng)站、小程序/APP、API接口等需要進行數(shù)據(jù)傳輸應(yīng)用場景,ssl證書未來市場廣闊!成為成都創(chuàng)新互聯(lián)的ssl證書銷售渠道,可以享受市場價格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:13518219792(備注:SSL證書合作)期待與您的合作!
緩慢變化維:
數(shù)據(jù)倉庫的重要特點之一是反映歷史變化,所以如何處理維度的變化是維度設(shè)計的重要工作之一。緩慢變化維的提出是因為在現(xiàn)實世界中,維度的屬性并不是靜態(tài)的,它會隨著時間的流逝發(fā)生緩慢的變化,與數(shù)據(jù)增長較為快速的事實表相比,維度變化相對緩慢。
在一些情況下,保留歷史數(shù)據(jù)沒有什么分析價值,而在另一些情況下,保留歷史數(shù)據(jù)是非常重要的,在kimball理論中,有三種處理緩慢變化維的方式
采用此種方式,不保留歷史數(shù)據(jù),始終取最新數(shù)據(jù)
###變化前商品表和訂單表
商品key | 商品id | 商品標(biāo)題 | 所屬類目 | 其他維度屬性 |
1000 | item1 | titile1 | 類目1 | ... |
訂單key | 日期key | 商品key | 交易金額 | 其他事實 |
9000 | 2020-04-10 | 1000 | 131.00 | ... |
###變化后商品表和訂單表
商品key | 商品id | 商品標(biāo)題 | 所屬類目 | 其他維度屬性 |
1000 | item1 | titile1 | 類目2 | ... |
訂單key | 日期key | 商品key | 交易金額 | 其他事實 |
9000 | 2020-04-10 | 1000 | 131.00 | ... |
9001 | 2020-04-13 | 1000 | 52.00 | ... |
2.插入新的維度行
插人新的維度行。采用此種方式,保留歷史數(shù)據(jù),
維度值變化前的事實和過去的維度值關(guān)聯(lián),維度值變化后的事實和當(dāng)前的維度值關(guān)聯(lián)
###變化后商品表和訂單表
商品key | 商品id | 商品標(biāo)題 | 所屬類目 | 其他維度屬性 |
1000 | item1 | titile1 | 類目1 | ... |
1001 | item1 | titile1 | 類目2 | ... |
訂單key | 日期key | 商品key | 交易金額 | 其他事實 |
9000 | 2020-04-10 | 1000 | 131.00 | ... |
9001 | 2020-04-13 | 1001 | 52.00 | ... |
3.添加維度列
采用第二種處理方式不能將變化前后記錄的事實歸一為變化前的維度或者歸一為變化后的維度。比如根據(jù)業(yè)務(wù)需求,需要將4月份的交易金額全部統(tǒng)計到類目2上,采用第二種處理方式無法實現(xiàn)。針對此問題,采用第三種處理方式,保留歷史數(shù)據(jù),可以使用任何一個屬性列
###變化前商品表和訂單表
商品key | 商品id | 商品標(biāo)題 | 所屬新類目 | 所屬舊類目 | 其他維度屬性 |
1000 | item1 | titile1 | 類目1 | 類目1 | ... |
訂單key | 日期key | 商品key | 交易金額 | 其他事實 |
9000 | 2020-04-10 | 1000 | 131.00 | ... |
###變化后商品表和訂單表
商品key | 商品id | 商品標(biāo)題 | 所屬新類目 | 所屬舊類目 | 其他維度屬性 |
1000 | item1 | titile1 | 類目2 | 類目1 | ... |
訂單key | 日期key | 商品key | 交易金額 | 其他事實 |
9000 | 2020-04-10 | 1000 | 131.00 | ... |
9001 | 2020-04-13 | 1000 | 52.00 | ... |
對于選擇哪種方式處理緩慢變化維,并沒有一個完全正確的答案,可以根據(jù)業(yè)務(wù)需求來進行選擇。比如根據(jù)商品所屬的類目統(tǒng)計2020年4月的成交額,商品所屬的類目于 2020年4月 13 日由 類目 1變成類目2 ,假設(shè)業(yè)務(wù)需求方不關(guān)心歷史數(shù)據(jù),將所有的成交額都統(tǒng)計到最新的類目2上 ,則不需要保存歷史數(shù)據(jù):假設(shè)類目1屬于某個業(yè)務(wù)部門 ,類目2屬于另一個業(yè)務(wù)部門,不同業(yè)務(wù)部門需要統(tǒng)計各自的業(yè)績,則需要保留歷史數(shù)據(jù)。
關(guān)于大數(shù)據(jù)中緩慢變化維常見解決方案是什么就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。