這篇文章主要為大家展示了“大數(shù)據(jù)中什么是數(shù)據(jù)集市”,內(nèi)容簡(jiǎn)而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“大數(shù)據(jù)中什么是數(shù)據(jù)集市”這篇文章吧。
在神木等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強(qiáng)發(fā)展的系統(tǒng)性、市場(chǎng)前瞻性、產(chǎn)品創(chuàng)新能力,以專(zhuān)注、極致的服務(wù)理念,為客戶提供成都做網(wǎng)站、網(wǎng)站建設(shè) 網(wǎng)站設(shè)計(jì)制作定制網(wǎng)站,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),成都品牌網(wǎng)站建設(shè),成都全網(wǎng)營(yíng)銷(xiāo),成都外貿(mào)網(wǎng)站建設(shè),神木網(wǎng)站建設(shè)費(fèi)用合理。
1. 什么是數(shù)據(jù)集市?數(shù)據(jù)集市與數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別?
數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse) 是一個(gè)面向主題的(Subject Oriented) 、集成的( Integrate ) 、相對(duì)穩(wěn)定的(Non -Volatile ) 、反映歷史變化( Time Variant) 的數(shù)據(jù)集合用于支持管理決策。對(duì)于數(shù)據(jù)倉(cāng)庫(kù)的概念我們可以從兩個(gè)層次予以理解,首先,數(shù)據(jù)倉(cāng)庫(kù)用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫(kù);其次,數(shù)據(jù)倉(cāng)庫(kù)是對(duì)多個(gè)異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進(jìn)行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)一般不再修改。(注:該定義來(lái)自于著名的數(shù)據(jù)倉(cāng)庫(kù)專(zhuān)家W. H. Inmon 的著作《Buildingthe Data Warehouse》一書(shū))。
數(shù)據(jù)集市也叫數(shù)據(jù)市場(chǎng),是一個(gè)從操作的數(shù)據(jù)和其他的為某個(gè)特殊的專(zhuān)業(yè)人員團(tuán)體服務(wù)的數(shù)據(jù)源中收集數(shù)據(jù)的倉(cāng)庫(kù)。從范圍上來(lái)說(shuō),數(shù)據(jù)是從企業(yè)范圍的數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù),或者是更加專(zhuān)業(yè)的數(shù)據(jù)倉(cāng)庫(kù)中抽取出來(lái)的。數(shù)據(jù)中心的重點(diǎn)就在于它迎合了專(zhuān)業(yè)用戶群體的特殊需求,在分析、內(nèi)容、表現(xiàn),以及易用方面。數(shù)據(jù)中心的用戶希望數(shù)據(jù)是由他們熟悉的術(shù)語(yǔ)表現(xiàn)的。
數(shù)據(jù)集市是企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)子集,他主要面向部門(mén)級(jí)業(yè)務(wù),并且只面向某個(gè)特定的主題。為了解決靈活性和性能之間的矛盾,數(shù)據(jù)集市就是數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)中增加的一種小型的部門(mén)或工作組級(jí)別的數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)集市存儲(chǔ)為特定用戶預(yù)先計(jì)算好的數(shù)據(jù),從而滿足用戶對(duì)性能的需求。數(shù)據(jù)集市可以在一定程度上緩解訪問(wèn)數(shù)據(jù)倉(cāng)庫(kù)的瓶頸。
數(shù)據(jù)集市的特征主要有:1)規(guī)模??;2)面向部門(mén);3)有特定的應(yīng)用;4)由業(yè)務(wù)部門(mén)定義、設(shè)計(jì)和開(kāi)發(fā);5)業(yè)務(wù)部門(mén)管理和維護(hù);6)能快速實(shí)現(xiàn);7)購(gòu)買(mǎi)比較便宜;8)投資快速回收;9)工具集的緊密集成;10)提供更詳細(xì)的、預(yù)先存在的、數(shù)據(jù)倉(cāng)庫(kù)的摘要子集;11)可升級(jí)到完整的數(shù)據(jù)倉(cāng)庫(kù)。
數(shù)據(jù)集市和數(shù)據(jù)倉(cāng)庫(kù)的主要區(qū)別:數(shù)據(jù)倉(cāng)庫(kù)是企業(yè)級(jí)的,能為整個(gè)企業(yè)各個(gè)部門(mén)的運(yùn)行提供決策支持手段;而數(shù)據(jù)集市則是一種微型的數(shù)據(jù)倉(cāng)庫(kù),它通常有更少的數(shù)據(jù),更少的主題區(qū)域,以及更少的歷史數(shù)據(jù),因此是部門(mén)級(jí)的,一般只能為某個(gè)局部范圍內(nèi)的管理人員服務(wù),因此也稱(chēng)之為部門(mén)級(jí)數(shù)據(jù)倉(cāng)庫(kù)。
| 數(shù)據(jù)倉(cāng)庫(kù) | 數(shù)據(jù)集市 |
數(shù)據(jù)的來(lái)源 | 生產(chǎn)系統(tǒng)、外部數(shù)據(jù)等 | 數(shù)據(jù)倉(cāng)庫(kù) |
范圍規(guī)模 | 企業(yè)級(jí) | 部門(mén)級(jí)或工作組級(jí) |
主題 | 以企業(yè)為主題 | 以部門(mén)或特殊的分析為主題 |
數(shù)據(jù)粒度 | 最細(xì)的粒度 | 較粗的粒度 |
數(shù)據(jù)結(jié)構(gòu) | 第三范式,規(guī)范化結(jié)構(gòu) | 星型模型、雪花模型、星座模型 |
歷史數(shù)據(jù) | 大量的歷史數(shù)據(jù) | 適度的歷史數(shù)據(jù) |
優(yōu)化 | 處理海量數(shù)據(jù)、數(shù)據(jù)探索 | 便于訪問(wèn)和分析、快速查詢 |
索引 | 高度索引 | 高度索引 |
數(shù)據(jù)集市可以分為兩種類(lèi)型——獨(dú)立型數(shù)據(jù)集市和從屬型數(shù)據(jù)集市。獨(dú)立型數(shù)據(jù)集市直接從操作型環(huán)境獲取數(shù)據(jù),從屬型數(shù)據(jù)集市從企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)獲取數(shù)據(jù),帶有從屬型數(shù)據(jù)集市的體系結(jié)構(gòu)如圖2所示。
數(shù)據(jù)倉(cāng)庫(kù)規(guī)模大、周期長(zhǎng),一些規(guī)模比較小的企業(yè)用戶難以承擔(dān)。因此,作為快速解決企業(yè)當(dāng)前存在的實(shí)際問(wèn)題的一種有效方法,獨(dú)立型數(shù)據(jù)集市成為一種既成事實(shí)。獨(dú)立型數(shù)據(jù)集市是為滿足特定用戶(一般是部門(mén)級(jí)別的)的需求而建立的一種分析型環(huán)境,它能夠快速地解決某些具體的問(wèn)題,而且投資規(guī)模也比數(shù)據(jù)倉(cāng)庫(kù)小很多。
獨(dú)立型數(shù)據(jù)集市的存在會(huì)給人造成一種錯(cuò)覺(jué),似乎可以先獨(dú)立地構(gòu)建數(shù)據(jù)集市,當(dāng)數(shù)據(jù)集市達(dá)到一定的規(guī)模再直接轉(zhuǎn)換為數(shù)據(jù)倉(cāng)庫(kù)。有些銷(xiāo)售人員會(huì)推銷(xiāo)這種觀點(diǎn),其實(shí)質(zhì)卻常常是因?yàn)榻⑵髽I(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)的銷(xiāo)售周期太長(zhǎng)以至于不好操作。
多個(gè)獨(dú)立的數(shù)據(jù)集市的累積,是不能形成一個(gè)企業(yè)級(jí)的數(shù)據(jù)倉(cāng)庫(kù)的,這是由數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市本身的特點(diǎn)決定的——數(shù)據(jù)集市為各個(gè)部門(mén)或工作組所用,各個(gè)集市之間存在不一致性是難免的。因?yàn)槊撾x數(shù)據(jù)倉(cāng)庫(kù)的緣故,當(dāng)多個(gè)獨(dú)立型數(shù)據(jù)集市增長(zhǎng)到一定規(guī)模之后,由于沒(méi)有統(tǒng)一的數(shù)據(jù)倉(cāng)庫(kù)協(xié)調(diào),企業(yè)只會(huì)又增加一些信息孤島,仍然不能以整個(gè)企業(yè)的視圖分析數(shù)據(jù)。借用Inmon的比喻:我們不可能將大海里的小魚(yú)堆在一起就構(gòu)成一頭大鯨魚(yú),這也說(shuō)明了數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市有本質(zhì)的不同。
如果企業(yè)最終想建設(shè)一個(gè)全企業(yè)統(tǒng)一的數(shù)據(jù)倉(cāng)庫(kù),想要以整個(gè)企業(yè)的視圖分析數(shù)據(jù),獨(dú)立型數(shù)據(jù)集市恐怕不是合適的選擇;也就是說(shuō)“先獨(dú)立地構(gòu)建數(shù)據(jù)集市,當(dāng)數(shù)據(jù)集市達(dá)到一定的規(guī)模再直接轉(zhuǎn)換為數(shù)據(jù)倉(cāng)庫(kù)”是不合適的。從長(zhǎng)遠(yuǎn)的角度看,從屬型數(shù)據(jù)集市在體系結(jié)構(gòu)上比獨(dú)立型數(shù)據(jù)集市更穩(wěn)定,可以說(shuō)是數(shù)據(jù)集市未來(lái)建設(shè)的主要方向。
2. 為什么要有數(shù)據(jù)集市?良好的數(shù)據(jù)集市有什么特點(diǎn)?
雖然 OLTP 和遺留系統(tǒng)擁有寶貴的信息,但是可能難以從這些系統(tǒng)中提取有意義的信息并且速度也較慢。而且這些系統(tǒng)雖然一般可支持預(yù)先定義操作的報(bào)表,但卻經(jīng)常無(wú)法支持一個(gè)組織對(duì)于歷史的、聯(lián)合的、智能的或易于訪問(wèn)的信息的需求。因?yàn)閿?shù)據(jù)分布在許多跨系統(tǒng)和平臺(tái)的表中,而且通常是“臟的”,包含了不一致的和無(wú)效的值,使得難于分析。
數(shù)據(jù)集市將合并不同系統(tǒng)的數(shù)據(jù)源來(lái)滿足業(yè)務(wù)信息需求。若能有效地得以實(shí)現(xiàn),數(shù)據(jù)集市將可以快速且方便地訪問(wèn)簡(jiǎn)單信息以及系統(tǒng)的和歷史的視圖。一個(gè)設(shè)計(jì)良好的數(shù)據(jù)集市有如下特點(diǎn)(有些特點(diǎn)數(shù)據(jù)倉(cāng)庫(kù)也具有,有些特點(diǎn)是相對(duì)于數(shù)據(jù)倉(cāng)庫(kù)來(lái)講的):
(1) 特定用戶群體所需的信息,通常是一個(gè)部門(mén)或者一個(gè)特定組織的用戶,且無(wú)需受制于源系統(tǒng)的大量需求和操作性危機(jī)(相對(duì)于數(shù)據(jù)倉(cāng)庫(kù))。
(2) 支持訪問(wèn)非易變(nonvolatile)的業(yè)務(wù)信息。(非易變的信息是以預(yù)定的時(shí)間間隔進(jìn)行更新的,并且不受 OLTP 系統(tǒng)進(jìn)行中的更新的影響。)
(3) 調(diào)和來(lái)自于組織里多個(gè)運(yùn)行系統(tǒng)的信息,比如賬目、銷(xiāo)售、庫(kù)存和客戶管理以及組織外部的行業(yè)數(shù)據(jù)。
(4) 通過(guò)默認(rèn)有效值、使各系統(tǒng)的值保持一致以及添加描述以使隱含代碼有意義,從而提供凈化的(cleansed)數(shù)據(jù)。
(5) 為即席分析和預(yù)定義報(bào)表提供合理的查詢響應(yīng)時(shí)間(由于數(shù)據(jù)集市是部門(mén)級(jí)的,相對(duì)于龐大的數(shù)據(jù)倉(cāng)庫(kù)來(lái)講,其查詢和分析的響應(yīng)時(shí)間會(huì)大大縮短)。
3. 數(shù)據(jù)集市的數(shù)據(jù)結(jié)構(gòu)
數(shù)據(jù)集市中數(shù)據(jù)的結(jié)構(gòu)通常被描述為星型結(jié)構(gòu)或雪花結(jié)構(gòu)。一個(gè)星型結(jié)構(gòu)包含兩個(gè)基本部分——一個(gè)事實(shí)表和各種支持維表。
(1) 事實(shí)表
事實(shí)表描述數(shù)據(jù)集市中最密集的數(shù)據(jù)。在電話公司中,用于呼叫的數(shù)據(jù)是典型的最密集數(shù)據(jù);在銀行中,與賬目核對(duì)和自動(dòng)柜員機(jī)有關(guān)的數(shù)據(jù)是典型的最密集數(shù)據(jù)。對(duì)于零售業(yè)而言,銷(xiāo)售和庫(kù)存數(shù) 據(jù)是最密集的數(shù)據(jù)等等。
事實(shí)表是預(yù)先被連接到一起的多種類(lèi)型數(shù)據(jù)的組合體,它包括:一個(gè)反映事實(shí)表建立目的的實(shí)體的主鍵,如一張訂單、一次銷(xiāo)售、一個(gè)電話等等,主鍵信息,連接事實(shí)表與維表的外鍵,外鍵攜帶的非鍵值外部數(shù)據(jù)。如果這種非鍵外部數(shù)據(jù)經(jīng)常用于事實(shí)表中的數(shù)據(jù)分析,它就會(huì)被包括在事實(shí)表的范圍內(nèi)。事實(shí)表是高度索引化的。事實(shí)表中出現(xiàn)30到40條索引非常常見(jiàn)。有時(shí)實(shí)事表的每列都建了索引,這樣作的結(jié)果是使事實(shí)表中的數(shù)據(jù)非常容易讀取。但是,導(dǎo)入索引所需的資源數(shù)量必須為等式提供因數(shù)。通常,事實(shí)表的數(shù)據(jù)不能更改,但可以輸入數(shù)據(jù),一旦正確輸入一個(gè)記錄,就不能更改此記錄的任何內(nèi)容了。
(2) 維表
維表是圍繞事實(shí)表建立的。維表包含非密集型數(shù)據(jù),它通過(guò)外鍵與事實(shí)表相連。典型的維表建立在數(shù)據(jù)集市的基礎(chǔ)上,包括產(chǎn)品目錄、客戶名單、廠商列表等等。
數(shù)據(jù)集市中的數(shù)據(jù)來(lái)源于企業(yè)數(shù)據(jù)倉(cāng)庫(kù)。所有數(shù)據(jù),除了一個(gè)例外,在導(dǎo)入到數(shù)據(jù)集市之前都應(yīng)該經(jīng)過(guò)企業(yè)數(shù)據(jù)倉(cāng)庫(kù)。這個(gè)例外就是用于數(shù)據(jù)集市的特定數(shù)據(jù),它不能用于數(shù)據(jù)倉(cāng)庫(kù)的其他地方。外部數(shù)據(jù)通常屬于這類(lèi)范疇。如果情況不是這樣,數(shù)據(jù)就會(huì)用于決策支持系統(tǒng)的其他地方,那么這些數(shù)據(jù)就必須經(jīng)過(guò)企業(yè)數(shù)據(jù)倉(cāng)庫(kù)。
數(shù)據(jù)集市包含兩種類(lèi)型的數(shù)據(jù),通常是詳細(xì)數(shù)據(jù)和匯總數(shù)據(jù)。
(1) 詳細(xì)數(shù)據(jù)
數(shù)據(jù)集市中的詳細(xì)數(shù)據(jù)包含在星型結(jié)構(gòu)中。當(dāng)數(shù)據(jù)通過(guò)企業(yè)數(shù)據(jù)倉(cāng)庫(kù)時(shí),星型結(jié)構(gòu)就會(huì)很好的匯總。在這種情況下,企業(yè)數(shù)據(jù)倉(cāng)庫(kù)包含必需的基本數(shù)據(jù),而數(shù)據(jù)集市則包含更高間隔尺寸的數(shù)據(jù)。但是,在數(shù)據(jù)集市使用者的心目中,星型結(jié)構(gòu)的數(shù)據(jù)和數(shù)據(jù)獲取時(shí)一樣詳細(xì)。
(2) 匯總數(shù)據(jù)
數(shù)據(jù)集市包含的第二種類(lèi)型數(shù)據(jù)是匯總數(shù)據(jù)。分析人員通常從星型結(jié)構(gòu)中的數(shù)據(jù)創(chuàng)建各種匯總數(shù)據(jù)。典型的匯總可能是銷(xiāo)售區(qū)域的月銷(xiāo)售總額。因?yàn)閰R總的基礎(chǔ)不斷發(fā)展變化,所以歷史數(shù)據(jù)就在數(shù)據(jù)集市中。但是這些歷史數(shù)據(jù)優(yōu)勢(shì)在于它存儲(chǔ)的概括水平。星型結(jié)構(gòu)中保存的歷史數(shù)據(jù)非常少。
數(shù)據(jù)集市以企業(yè)數(shù)據(jù)倉(cāng)庫(kù)為基礎(chǔ)進(jìn)行更新。對(duì)于數(shù)據(jù)集市來(lái)說(shuō)大約每周更新一次非常平常。但是,數(shù)據(jù)集市的更新時(shí)間可以少于一周也可以多于一周,這主要是由數(shù)據(jù)集市所屬部門(mén)的需求來(lái)決定的。
4. 如何建立數(shù)據(jù)集市?
數(shù)據(jù)倉(cāng)庫(kù)(集市)的設(shè)計(jì)可以采用迭代式的方法。在迭代式開(kāi)發(fā)中,每個(gè)迭代為上一次的結(jié)果增加了新的功能。功能增加的順序要考慮到迭代平衡以及盡早發(fā)現(xiàn)重大風(fēng)險(xiǎn)。通俗地說(shuō),就是在正式交貨之前多次給客戶交付不完善的中間產(chǎn)品“試用”。這些中間產(chǎn)品會(huì)有一些功能還沒(méi)有添加進(jìn)去、還不穩(wěn)定,但是客戶提出修改意見(jiàn)以后,開(kāi)發(fā)人員能夠更好地理解客戶的需求。如此反復(fù),使得產(chǎn)品在質(zhì)量上能夠逐漸逼近客戶的要求。這種開(kāi)發(fā)方法周期長(zhǎng)、成本高,但是它能夠避免整個(gè)項(xiàng)目推倒重來(lái)的風(fēng)險(xiǎn),比較適合大項(xiàng)目、高風(fēng)險(xiǎn)項(xiàng)目。
理論上講,應(yīng)該有一個(gè)總的數(shù)據(jù)倉(cāng)庫(kù)的概念,然后才有數(shù)據(jù)集市。實(shí)際建設(shè)數(shù)據(jù)倉(cāng)庫(kù)(集市)的時(shí)候,國(guó)內(nèi)很少這么做。國(guó)內(nèi)一般會(huì)先從數(shù)據(jù)集市入手,就某一個(gè)特定的主題(比如企業(yè)的客戶信息)先做數(shù)據(jù)集市,再建設(shè)數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市建立的先后次序之分,是和設(shè)計(jì)方法緊密相關(guān)的。而數(shù)據(jù)倉(cāng)庫(kù)作為工程學(xué)科,并沒(méi)有對(duì)錯(cuò)之分,主要判別方式應(yīng)該是能否解決目前存在的實(shí)際問(wèn)題,并為今后可能發(fā)生的問(wèn)題保持一定的可伸縮性。
5. 數(shù)據(jù)倉(cāng)庫(kù)建模與數(shù)據(jù)集市建模
數(shù)據(jù)只是所有業(yè)務(wù)活動(dòng)、資源以及企業(yè)結(jié)果的記錄。數(shù)據(jù)模型是對(duì)那些數(shù)據(jù)的組織良好的抽象,因此數(shù)據(jù)模型成為理解和管理企業(yè)業(yè)務(wù)的最佳方法是極其自然的。數(shù)據(jù)模型起到了指導(dǎo)或計(jì)劃數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)的作用。在真正的實(shí)現(xiàn)開(kāi)始之前,聯(lián)合每個(gè)業(yè)務(wù)領(lǐng)域的數(shù)據(jù)模型可以幫助確保其結(jié)果是有效的數(shù)據(jù)倉(cāng)庫(kù),并且可以幫助減少實(shí)現(xiàn)的成本。
(1)數(shù)據(jù)倉(cāng)庫(kù)的建模
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)的建模是將需求轉(zhuǎn)換成圖畫(huà)以及支持表示那些需求的元數(shù)據(jù)的過(guò)程。出于易讀性目的,本文將關(guān)于需求和建模的討論相分離,但實(shí)際上這些步驟通常是重疊的。一旦在文檔中記錄一些初始需求,初始模型就開(kāi)始成型。隨著需求變得更加完整,模型也會(huì)如此。
最重要的是向終端用戶提供良好集成并易于解釋的數(shù)據(jù)倉(cāng)庫(kù)的邏輯模型。這些邏輯模型是數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)的核心之一。為終端用戶提供的簡(jiǎn)單性以及歷史數(shù)據(jù)的集成和聯(lián)合是建模方法應(yīng)該幫助提供的關(guān)鍵原則。
(2)數(shù)據(jù)集市的數(shù)據(jù)建模
因?yàn)閭}(cāng)庫(kù)終端用戶直接與數(shù)據(jù)集市進(jìn)行交互,所以數(shù)據(jù)集市的建模是捕獲終端用戶業(yè)務(wù)需求的最有效工具之一。數(shù)據(jù)集市的建模過(guò)程取決于許多因素。下面描述了三個(gè)最重要的:
數(shù)據(jù)集市的建模是終端用戶驅(qū)動(dòng)的。終端用戶必須參與數(shù)據(jù)集市的建模過(guò)程,因?yàn)樗麄冿@然是要使用該數(shù)據(jù)集市的人。因?yàn)槟鷳?yīng)期望終端用戶完全不熟悉復(fù)雜的數(shù)據(jù)模型,所以應(yīng)該將建模技術(shù)和建模過(guò)程作為整體進(jìn)行組織,以便使復(fù)雜性對(duì)終端用戶透明。
數(shù)據(jù)集市的建模是由業(yè)務(wù)需求驅(qū)動(dòng)的。數(shù)據(jù)集市模型對(duì)于捕獲業(yè)務(wù)需求十分有用,因?yàn)樗鼈兺ǔS山K端用戶直接使用,且易于理解。
數(shù)據(jù)集市的建模極大地受到了數(shù)據(jù)分析技術(shù)的影響。數(shù)據(jù)分析技術(shù)可以影響所選擇的數(shù)據(jù)模型的類(lèi)型及其內(nèi)容。目前,有幾種常用的數(shù)據(jù)分析技術(shù):查詢和報(bào)表制作、多維分析以及數(shù)據(jù)挖掘。
如果僅僅意圖提供查詢和報(bào)表制作功能,那么帶有正規(guī)(normalized)或非正規(guī)(denormalized)數(shù)據(jù)結(jié)構(gòu)的 ER 模型就是最合適的。維度數(shù)據(jù)模型也可能是較好的選擇,因?yàn)樗怯脩粲押玫?,并具有更好的性能。如果其目?biāo)是執(zhí)行多維數(shù)據(jù)分析,那么維度數(shù)據(jù)模型就是這里的惟一選擇。然而,數(shù)據(jù)挖掘通常在可用的最低細(xì)節(jié)級(jí)(level of detail)工作得最好。因此,如果數(shù)據(jù)倉(cāng)庫(kù)是用于數(shù)據(jù)挖掘的,就應(yīng)該在模型中包含較低細(xì)節(jié)級(jí)(level of detail)的數(shù)據(jù)。
以上是“大數(shù)據(jù)中什么是數(shù)據(jù)集市”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!