商業(yè)智能已有的應用解決方案及產(chǎn)品現(xiàn)狀
創(chuàng)新互聯(lián)公司是一家專業(yè)提供江油企業(yè)網(wǎng)站建設,專注與成都網(wǎng)站設計、網(wǎng)站制作、成都h5網(wǎng)站建設、小程序制作等業(yè)務。10年已為江油眾多企業(yè)、政府機構等服務。創(chuàng)新互聯(lián)專業(yè)網(wǎng)站設計公司優(yōu)惠進行中。
從聽到關于沃爾瑪超市的“啤酒”與“尿布”的故事,我們知道了商業(yè)智能的應用可以如此神奇地分析出兩種看似毫不相干的東西之間原來還有著千絲萬縷的聯(lián)系,如今以數(shù)據(jù)倉庫為核心的BI應用正在成為國內(nèi)很多用戶實施的熱點。據(jù)最新調查結果顯示,商業(yè)智能將成為2007年各企業(yè)IT高管的最大開支項目,企業(yè)投資的重點將繼續(xù)放在收集和分析與企業(yè)運營有關的各種數(shù)據(jù)上。市場調查公司Saugatuck Technology和BusinessWeek Research Services稱,在2005年和2006年,商業(yè)智能分別在當年的重點開支項目中排第5位和第3位l”。易觀國際研究表明,中國商業(yè)智能市場2007年第一季度總體市場規(guī)模達到2.38億人民幣,與去年同期相比增長,增長保持良好勢頭。
NCR等廠商處于領先位置,占據(jù)了絕大部分市場。廠商格局方面有較大的變化,NcR宣布分離數(shù)據(jù)倉庫事業(yè)部門Teradata:甲骨文宣布并購商業(yè)智能和企業(yè)績效廠商Hyperion;Business Objects公司(簡稱B0)收購Crystal Decisions.誕生了一個年營業(yè)額達7.36億美元的全球最大的BI廠商。從廠商格局變化來看,商業(yè)智能以及相關的其他應用,已經(jīng)越來越成為軟件廠商的主要關注方向嘲。傳統(tǒng)的數(shù)據(jù)倉庫和挖掘廠商在未來商業(yè)智能發(fā)展中表現(xiàn)出強大的競爭能力,它們立足于提供全面的行業(yè)解決方案并完善強大的數(shù)據(jù)庫產(chǎn)品,支持更多的分析挖掘功能;IBM建立了專門從事BI方案設計的研究中心,ORACLE等公司紛紛推出了支持BI開發(fā)和應用的軟件系統(tǒng),有的直接進入了BI的開發(fā)領域:Sybase已經(jīng)將其業(yè)務全面轉向為商業(yè)智能服務的數(shù)據(jù)倉庫業(yè)務;微軟也在其新一代產(chǎn)品SQLServer2005中加強了商業(yè)智能的支持,并結合O伍ce2007提供從后端到前端的整體商業(yè)智能解決方案。國內(nèi)知名的BI獨立軟件開發(fā)商數(shù)量較少,規(guī)模仍然較小,但是發(fā)展迅速,基本都處于良性循環(huán)。例如:廣州尚南、潤乾軟件、奧威智動等都是國內(nèi)知名的BI獨立軟件開發(fā)商。據(jù)市場分析員介紹,BI已經(jīng)成了企業(yè)信息技術最為重要并且極具潛力的領域。
1.2.3 商業(yè)智能在勞動密集型企業(yè)中的應用現(xiàn)狀
商業(yè)智能產(chǎn)品正日益得到企業(yè)的認可。美國Palo Alt0管理集團公司對歐洲、北美和日本375家大中型企業(yè)的商務智能技術的采用情況進行了調查。結果顯示,在金融領域,商務智能技術的應用水平己經(jīng)達到或接近70%,在營銷領域也達到5004,預測在未來的3年中,各個應用領域對該技術的采納水平都將提高約5004。現(xiàn)在,許多企業(yè)都把數(shù)據(jù)看成寶貴的財富,紛紛利用商務智能發(fā)現(xiàn)其中隱藏的信息,借此獲得巨額的回報。
目前,國外已經(jīng)有了很多實施商業(yè)智能的成功案例,而關于商業(yè)智能在勞動密集型企業(yè)的應用的文獻比較少,應用比較零星,技術也很不成熟,遠遠無法與電信、銀行、證券、保險、航空、郵政、大型零售業(yè)等行業(yè)產(chǎn)生的價值和成熟度相提并論。在國內(nèi)更是少之又少,這與我國信息技術起步較晚,缺乏有效的規(guī)劃和管理,相關人才匱乏以及數(shù)據(jù)積累相對較少等多方面因素有著直接或間接的關系。BI在勞動密集型企業(yè)的應用主要體現(xiàn)在銷售/營銷方面采取更主動的行動以吸引客戶,預測需求,及時訂貨和補貨,實時了解供應商和代理商的情況,實現(xiàn)低庫存水平等方面發(fā)揮BI應有的作用。
隨著信息化建設的逐步完善和企業(yè)對商業(yè)智能應用意識的提高,企業(yè)逐步認識到商業(yè)智能發(fā)展、應用的總體趨勢,意識到BI會為企業(yè)發(fā)展帶來的巨大經(jīng)濟效益。勞動密集型企業(yè)可借鑒這些成熟行業(yè)的解決方案,再結合本行業(yè)的特點。
1.3 本文主要的工作
在勞動密集型企業(yè)中,隨著管理信息系統(tǒng)的發(fā)展,企業(yè)積累了大量的基礎數(shù)據(jù),這些數(shù)據(jù)記錄了企業(yè)的運作情況,是企業(yè)最寶貴的數(shù)據(jù)資源,但卻沒有充分發(fā)揮其作用,無法使決策者更好地利用數(shù)據(jù)做出迅速、正確而又及時的決策。本文的研究工作主要是運用商業(yè)智能技術的理論和方法,根據(jù)義烏市新光飾品有限公司管理信息系統(tǒng)的應用現(xiàn)狀和需求,提出了一套產(chǎn)品營銷商業(yè)智能系統(tǒng)的解決方案。利用企業(yè)的現(xiàn)有數(shù)據(jù)建立數(shù)據(jù)倉庫,并在數(shù)據(jù)倉庫的基礎上對銷售數(shù)據(jù)、客戶信息及飾品流行趨勢進行分析、預測,為企業(yè)管理提供決策支持,降低企業(yè)的經(jīng)營成本,提高企業(yè)公眾形象,從而增強企業(yè)競爭力。本課題研究主要完成以下幾方面的工作:
(1)在深入企業(yè)調研的基礎上,充分了解了企業(yè)對商業(yè)智能的需求,以及企業(yè)的業(yè)務特點,分析了義烏市新光飾品有限公司業(yè)務數(shù)據(jù)在產(chǎn)品營銷決策支持方面的不足,利用商業(yè)智能技術研究并提出了一套切合實際的勞動密集型企業(yè)產(chǎn)品營銷商業(yè)智能系統(tǒng)的解決方案。
(2)以企業(yè)內(nèi)部的ERP系統(tǒng)、OA(Office Automation)系統(tǒng)和BOM系統(tǒng)為數(shù)據(jù)源,進行BI系統(tǒng)的總體規(guī)劃設計,確定數(shù)據(jù)倉庫的各個主題域;選擇數(shù)據(jù)倉庫產(chǎn)品,進行數(shù)據(jù)倉庫的建模。
(3)本文從實際需求出發(fā),運用SQL Server2005 Analysis Services實現(xiàn)了在數(shù)據(jù)倉庫的基礎上進行OLAP分析,諸如上卷、下鉆、切片、切塊和旋轉查詢等操作,并用Reporting Services開發(fā)基于Web的前端數(shù)據(jù)展現(xiàn)和Pivot Table開發(fā)基于客戶端的數(shù)據(jù)分析,實現(xiàn)及時準確的產(chǎn)品營銷分析、客戶,市場分析等等,為企業(yè)的管理、決策提供及時可靠的參考信息依據(jù)。
(4)建立了基于數(shù)據(jù)倉庫的客戶分群預測和銷售預測分析模型。利用SQLServcr 2005 Analysis Services的數(shù)據(jù)挖掘算法實現(xiàn)了企業(yè)數(shù)據(jù)挖掘的目標。
如果你要用進行簡單學習的話 這兩個是沒什么區(qū)別的 兩個都可以用 不過搞開發(fā)的時候建議還是使用2005 畢竟版本低 穩(wěn)定 一點
總的來說 SQL Server2008有十大新特性
1.Report Builder 3.0
Report Builder是一個工具集,通過它可以開發(fā)出發(fā)布到Web上的報表,通過Report Builder可以創(chuàng)建包含圖像,圖表,表格和打印控件的報表,此外,Report Builder也支持下鉆和排序,如果你熟悉第三方報表工具,圖Crystal Reports(水晶報表),那么你一定會使用Report Builder。
SQL Server 2008 R2/Report Builder 3.0中的新特性包括:○1地圖圖層,它可以容納空間和分析數(shù)據(jù),可以和微軟的虛擬地球(Microsoft Virtual Earth)無縫集成;○2指示器,用于顯示一個值的狀態(tài);○3報表部件,這個對象可以重復使用或在多個報表之間共享;○4聚合計算(Aggregate Calculating),允許你計算其它聚合計算結果的匯總值。
2.SQL Server 2008 R2 Datacenter
SQL Server 2008 R2的數(shù)據(jù)中心版的目標是企業(yè)版用戶,他們要求更好的性能,新版本支持256顆邏輯處理器,更多的實例數(shù)和更多的內(nèi)存。
3.SQL Server 2008 R2 Parallel Data Warehouse
SQL Server 2008 R2的另一個新版本是并行數(shù)據(jù)倉庫版,正式代號是“Madison”,它主要目標是處理非常大的數(shù)據(jù)量,它使用大規(guī)模并行處理功能將大表分散到多個SQL節(jié)點,這些節(jié)點通過微軟的專利技術Ultra Shared Nothing進行控制,它可以將查詢?nèi)蝿辗峙涞礁鱾€計算節(jié)點上,然后從各個節(jié)點收集計算結果。
4.StreamInsight
SQL Server 2008 R2中出現(xiàn)了一個新組件,叫做StreamInsight,這個有趣的組件允許在運行中分析流數(shù)據(jù),也就是直接從源數(shù)據(jù)流進行處理,然后再保存到數(shù)據(jù)表中。如果你的系統(tǒng)是一個實時系統(tǒng),這個功能就非常非常的有用,因為實時系統(tǒng)需要分析數(shù)據(jù),但又不能引起數(shù)據(jù)寫入時的延遲,一些常見的例子如股票交易數(shù)據(jù)流,Web點擊分析流和工業(yè)處理控制,可以同時監(jiān)控多個輸入數(shù)據(jù)流。
5.主數(shù)據(jù)服務
主數(shù)據(jù)服務(Master Data Services,MDS)既是一個概念又是一個產(chǎn)品,主數(shù)據(jù)服務的概念是對核心業(yè)務數(shù)據(jù)有一個集中的數(shù)據(jù)入口看守人,數(shù)據(jù)項如客戶賬單地址,雇員/客戶姓名,以及產(chǎn)品名稱應該集中管理,以便讓所有消費應用系統(tǒng)都具有相同的信息。微軟提供了一個示例,在customer表中記錄了一個顧客地址,但在mailing表中記錄了一個不同的地址。主數(shù)據(jù)服務應用程序可以保證所有表只有一個正確的地址,而一個MDS可以是一個本地應用程序,SQL Server 2008 R2包括一個應用程序和一個接口管理核心數(shù)據(jù)。
6.PowerPivot for SharePoint
PowerPivot是一個終端用戶工具,它與SharePoint,SQL Server 2008 R2和Excel 2010聯(lián)合使用,可以在幾秒內(nèi)處理大量數(shù)據(jù),PowerPivot的作用有點像Excel中的數(shù)據(jù)透視表,提供了分析功能。
7.數(shù)據(jù)層應用
數(shù)據(jù)層應用(Data-Tier Application,縮寫為DAC,不知道C代表什么含義,不要與Windows數(shù)據(jù)訪問組件混淆了,因為它的縮寫也是DAC)是一個對象,它可以為一個工程存儲所有需要的數(shù)據(jù)庫信息,如登錄,表和Visual Studio可以使用的存儲過程。通過創(chuàng)建一個數(shù)據(jù)層應用,SQL Server包版本和每個Visual Studio編譯版本一起保存,也就是可以將應用程序和數(shù)據(jù)庫構建成一個統(tǒng)一的版本,方便后期維護和管理。
8.Unicode壓縮
SQL Server 2008 R2使用一個新的算法,為Unicode存儲提供了一個簡單的壓縮方案,通過Unicode壓縮,可以減少Unicode字符對空間的占用,它由SQL Server引擎自動管理,因此不需要修改現(xiàn)有應用程序,DBA也無須做任何干涉。
9.SQL Server Utility
新的SQL Server Utility是一個集中控制多個SQL Server實例的倉庫對象,性能數(shù)據(jù)和配置策略可以存儲在一個單一的Utility中,Utility也包括一個資源管理器工具,可以創(chuàng)建多個服務器儀表板。
10.多服務器儀表板
雖然SQL Server Management Studio也可以連接到多個服務器,但不能在一個集中的視圖上查看所有的數(shù)據(jù)庫,每個數(shù)據(jù)庫服務器需要獨立管理,在SQL Server 2008 R2中,可以創(chuàng)建同時顯示多個服務器的儀表板。
1 CRM系統(tǒng)
1.1 CRM簡介
一個完整的CRM主要可分成3個部分:操作型CRM、協(xié)作型CRM和分析型CRM。操作型CRM是CRM中最基本的功能系統(tǒng),它提供整個CRM的流程管理功能,主要是提供以客戶為中心的市場、銷售,服務與支持等業(yè)務流程的自動化。協(xié)作型CRM是以客戶服務中心為主要表現(xiàn)形式,以計算機電話集成技術為核心,使客戶可以通過電話、傳真、E-mail、Web站點等方式更快捷、更有效地與企業(yè)進行交互。
分析型CRM是通過對操作型CRM、協(xié)作型CRM、其它企業(yè)應用系統(tǒng)和外部數(shù)據(jù)源中保存的與客戶相關的數(shù)據(jù)的集成,建立以客戶為中心的數(shù)據(jù)倉庫,獲得企業(yè)范圍內(nèi)客戶數(shù)據(jù)的一致視圖,并以集成后的客戶數(shù)據(jù)為基礎,通過查詢與報表分析、OLAP分析和數(shù)據(jù)挖掘等手段獲取關于客戶的知識,為客戶提供個性化的產(chǎn)品和服務,提高客戶的滿意度和忠誠度,實現(xiàn)客戶終身價值的最大化。本文主要針對的是分析型CRM。
1.2在CRM中應用數(shù)據(jù)倉庫的必然性
數(shù)據(jù)倉庫是CRM的中心環(huán)節(jié)甚至是CRM的靈魂所在,它存儲了企業(yè)內(nèi)部和外部的各種數(shù)據(jù),并將這些源數(shù)據(jù)整理成一致的、隨時間變化的以及最大限度優(yōu)化分析的客戶信息庫,通過OLAF分析和數(shù)據(jù)挖掘來發(fā)現(xiàn)大量客戶信息中所隱藏的規(guī)律,為企業(yè)進行經(jīng)營決策提供支持。另一方面,它將CRM的業(yè)務平臺與分析平臺進行了有效地分離,使得業(yè)務型數(shù)據(jù)庫可以專注于事務處理,既提高了事務處理的效率又優(yōu)化了分析處理的能力。
傳統(tǒng)的企業(yè)事務處理系統(tǒng)部是各個部門根據(jù)自身事務處理的需要保留部分數(shù)據(jù),而且各個模塊之間的聯(lián)系并不緊密,雖然客戶的部分信息也能從這些系統(tǒng)中獲取,但遠遠不能滿足需要。例如,對于一個典型的以客戶行為為目標的分析,通常需要更多的日常積累的、反映歷史變化的數(shù)據(jù)才有可能進行有效地分析,然而在這一點上傳統(tǒng)的教據(jù)庫系統(tǒng)是很難做到的(不論是從數(shù)據(jù)的存儲量還是從數(shù)據(jù)的整合來考慮)。因此,數(shù)據(jù)倉庫的引入是必然的。
1.3分析型CRM的體系結構
將數(shù)據(jù)倉庫技術引入到對客戶信息的管理與組織上來,即建立一個面向CRM應用系統(tǒng)的客戶信息數(shù)掘倉庫,它實現(xiàn)了來自企業(yè)內(nèi)部及外部的多種分割應用的客戶信息的集成和統(tǒng)一,這正是分析型CRM的基本任務。如圖1所示為分析型CRM的體系結構。其中,客戶信息數(shù)據(jù)倉庫是分析型CRM的核心,它的任務主要是從OLTP系統(tǒng)中抽取數(shù)據(jù)、把抽取出的數(shù)據(jù)進行統(tǒng)一的格式轉換,將數(shù)據(jù)加載到數(shù)據(jù)倉庫環(huán)境中(以上3步稱為ETL,即extract,transform,load,抽取,轉換,裝載),管理和維護數(shù)據(jù)倉庫中的數(shù)據(jù)。最后,通過對這些數(shù)據(jù)的OLAP分析和數(shù)據(jù)挖掘,企業(yè)管理者可以得到許多有價值的信息,從而更好地為客戶服務。
建立數(shù)據(jù)倉庫時,這里采用的是一種可擴展的數(shù)據(jù)倉庫體系結構,即中間層包括兩種類型的數(shù)據(jù)庫:一種是基本的包含多個主題的數(shù)據(jù)倉庫;另一種足從屬的針對某一主題的數(shù)據(jù)集市。如圖1所示,這里根據(jù)數(shù)據(jù)倉庫中的4個主題分別設計了4千數(shù)據(jù)集市。采用可擴展的體系結構,可以縮短數(shù)據(jù)倉庫的建設周期,降低費用支出,并且避免了直接建立數(shù)據(jù)集市而不建立數(shù)據(jù)倉庫所存在的擴展性較差、多個教據(jù)集市間難以保持同步的鋏點。
2客戶信息數(shù)據(jù)倉庫的設計
設計客戶信息數(shù)據(jù)倉庫的第一步就是要確立主題。主題是一個抽象的概念,是在較高層次上將企業(yè)信息系統(tǒng)中的數(shù)據(jù)綜合、歸類并進行分析利用的對象。設計數(shù)據(jù)倉庫首先要從操作型環(huán)境中的數(shù)據(jù)入手,結合決策支持的實際需要,確定數(shù)據(jù)倉庫的主題。根據(jù)所涉及的分析型CRM的功能,該客戶信息數(shù)據(jù)倉庫包含了客戶發(fā)展、客戶購買、產(chǎn)品和市場營銷4個主題。其中,客戶購買主題主要是從不同的角度對客戶的購買行為進行分析,如客戶的購買行為同客戶的背景信息之間的關聯(lián),其中背景信息主要包括客戶的教育程度、收入水平、年齡、性別、是否已婚等。在客戶信息數(shù)據(jù)倉庫模型中,分3步來進行設計,分劇是概念模型、邏輯模型和物理模型設計。本文針對某網(wǎng)上書店,以客戶購買主題為例,給出該客戶信息數(shù)據(jù)倉庫模型的完整的設計方案。
2.1概念模型設計
數(shù)據(jù)倉庫設計中概念模型設計的目的是確定面向主題的信息包圍。信息包圖作為一種公共的、一致的和緊湊的概念模型設計工具,能夠明確反映用戶的需求以及實現(xiàn)該需求所需的各種要素及其之間的關系。信息包圖由名稱、維度、類別和度量組成,其中類別表述的是維的層次性。
該網(wǎng)上書店的客戶信息數(shù)據(jù)倉庫中客戶購買主題信息包圖如圖2所示。其中,對于圖書有3種分類方法,前兩種較常見,還有一種是按圖書存在形式分類,可分為普通圖書、Vbook和Ebook。普通圖書即傳統(tǒng)紙制圖書,Ebook指以計算機和網(wǎng)絡為載體的電子圖書,Vbook是一種新的多媒體演示、培訓、商業(yè)交流的載體,具備音頻和視頻的功能,如各領域專家的講座,教學考試類培訓課程等。隨著計算機的普及和網(wǎng)絡的發(fā)展,Ebook和Vbook越來越受到讀者的青睞。
2.2邏輯模型設計
數(shù)據(jù)倉庫的邏輯模型一般有星型模型和雪花模型兩種。星型模型是基于關系型數(shù)據(jù)庫的、面向OLAP的一種多維數(shù)據(jù)模型的數(shù)據(jù)組織形式,它由事實表和多個維度表組成,通過使用一個包括主題的事實表和多個包含事實的非正規(guī)化描述的維度表來執(zhí)行決策支持查詢,從而獲得比高度規(guī)范化設計結構更高的查詢性能。
雪花模型雖然較星型模型更符合規(guī)范化的設計結構,但它增加了查詢的復雜度,降低了查詢的性能,因此,這里采用星型模型。
星型模型的建立要以概念模型中的信息包圈為基礎,將信息包圖轉換為星型模型,具體方法為:將信息包圖中的度量實體放入星型模型的中心位置上,信息包圖中的維度實體放入度量實體的周邊。該客戶信息數(shù)據(jù)倉庫中客戶購買主題的邏輯模型。
2.3物理模型設計
物理模型是指教據(jù)在數(shù)據(jù)倉庫中的存放形式和組織形式。設計物理模型,要在星型模型或雪花模型的基礎上,確定事實表和維表的結構;明確二者的數(shù)據(jù)字段、數(shù)據(jù)類型、關聯(lián)字段、索引結構;確定數(shù)據(jù)倉庫中多維數(shù)據(jù)集的存儲結構,如物理存取方式、數(shù)據(jù)存儲結構、數(shù)據(jù)存放位置以廈存儲分配是否分區(qū)等。進行物理模型設計時,應重點考慮的因素有I/O存取時間、空間利用率和維護代價。
目前大多數(shù)數(shù)據(jù)倉庫都是建立在關系型數(shù)據(jù)庫的基礎上,基終數(shù)據(jù)的存儲是由數(shù)據(jù)庫系統(tǒng)進行管理的。在該數(shù)據(jù)倉庫的設計中,選用MSSQLServer2000及其組件分析服務器來作為數(shù)據(jù)庫和數(shù)據(jù)倉庫的管理系統(tǒng)。數(shù)據(jù)倉庫在邏輯上是多維的,但在物理存儲上其多維數(shù)據(jù)集的存儲方式可以有關系型聯(lián)機分析處理(relationalonlineanalyticalprocessing,ROLAP),多維聯(lián)機分析處理(multidimensionalonlineanalyticalprocessing,MOLAP)和混臺聯(lián)機分析處理(hybridonlineanalyticalprocessing,HOLAP)3種方式。
在該數(shù)據(jù)倉庫中,多維數(shù)據(jù)集的存儲選擇HOLAP方式,即基本數(shù)據(jù)保留在原有的關系數(shù)據(jù)庫中,而聚合體則存儲在分析服務器上的多維結構中,這樣不僅可以避免數(shù)據(jù)重復,還能夠提高查詢性能(因為聚合體存儲在多維數(shù)據(jù)集中),僅在頻繁訪問詳細數(shù)據(jù)時對性能影響較大。
3 實 現(xiàn)
針對該網(wǎng)上書店,此數(shù)據(jù)倉庫的實施是以MSSQLServer2000平臺為基礎。通過SQLServer中的DTS服務,并輔以VBScript來實現(xiàn)將源數(shù)據(jù)導入數(shù)據(jù)倉庫的ETL過程;通過AnalysisServices來建立多維數(shù)據(jù)集,實現(xiàn)OLAP操作,支持多維查詢袁達式(multidimensionalexpression,MDX)查詢,并通過自動構造MDX語句,實現(xiàn)上卷、下鉆、切片、切塊、旋轉等OLAP運算。
該客戶信息數(shù)據(jù)倉庫共包含了客戶發(fā)展、客戶購買、產(chǎn)品和市場營銷4個主題,對客戶購買主題的OLAP分析示例。其中,用戶可以從客戶所在地區(qū)、年齡層、性別、婚姻狀況,職業(yè)、年收入層、會員星級、圖書一按內(nèi)容分類、圖書按出版社分類、圖書一按存在形式分類及時間共11個維度,來分析客戶購買數(shù)量、金額、成本、利潤及平均單價這5個度量。
此外,利用AnalysisServices所提供的數(shù)據(jù)透視表服務,用戶可以用VB或其它語言開發(fā)自己想要的前端數(shù)據(jù)展現(xiàn)程序,也可以直接利用現(xiàn)有工具,如MSOffice套件中的Excel、Access,來實現(xiàn)對多維數(shù)據(jù)集的數(shù)據(jù)展現(xiàn)功能,從而可以方便地得到各種統(tǒng)計報表和分析圖形。利用Excel展現(xiàn)了對2005年不同年齡層的客戶對不同種類圖書的購買情況的利潤分析。
MATLAB(矩陣實驗室)是MATrix LABoratory的縮寫,是一款由美國The MathWorks公司出品的商業(yè)數(shù)學軟件。
MATLAB是一種用于算法開發(fā)、數(shù)據(jù)可視化、數(shù)據(jù)分析以及數(shù)值計算的高級技術計算語言和交互式環(huán)境。除了矩陣運算、繪制函數(shù)/數(shù)據(jù)圖像等常用功能外,MATLAB還可以用來創(chuàng)建用戶界面及與調用其它語言(包括C、C++、Java、Python和FORTRAN)編寫的程序。
擴展資料
盡管MATLAB主要用于數(shù)值運算,但利用為數(shù)眾多的附加工具箱(Toolbox)它也適合不同領域的應用,例如控制系統(tǒng)設計與分析、圖像處理、信號處理與通訊、金融建模和分析等。另外還有一個配套軟件包Simulink,提供一個可視化開發(fā)環(huán)境,常用于系統(tǒng)模擬、動態(tài)/嵌入式系統(tǒng)開發(fā)等方面。
主要功能
MATLAB的主要為工程應用提供以下功能:
可用于技術計算的高級語言。
可對代碼、文件和數(shù)據(jù)進行管理的開發(fā)環(huán)境。
可以按迭代的方式探查、設計及求解問題的交互式工具。
可用于線性代數(shù)、統(tǒng)計、傅立葉分析、篩選、優(yōu)化以及數(shù)值積分等的數(shù)學函數(shù)。
可用于可視化數(shù)據(jù)的二維和三維圖形函數(shù)。
可用于構建自定義的圖形用戶界面的各種工具。
可將基于MATLAB的算法與外部應用程序和語言(如C、C++、Fortran、Java、COM以及Microsoft Excel)集成的各種函數(shù)。
淺析商務智能系統(tǒng)的組成
在當前的全球化競爭日益激烈的經(jīng)濟環(huán)境下,企業(yè)的生存發(fā)展,關鍵在于它是否能夠對各種不同的用戶需求做出快速的反應及正確的決策并提供優(yōu)質的產(chǎn)品和服務。商業(yè)智能(Business Intelligence, BI)系統(tǒng)是指運用數(shù)據(jù)倉庫,聯(lián)機分析和數(shù)據(jù)挖掘技術來處理和分析商業(yè)數(shù)據(jù),針對不同的領域提供不同的應用解決方案,協(xié)助用戶解決商務活動中的復雜問題,從而幫助決策者面對商務環(huán)境的快速變化而做出敏捷反應和合理商業(yè)決策的管理系統(tǒng)。
商業(yè)智能的實質是從數(shù)據(jù)中有效地提取信息,從信息中及時地發(fā)現(xiàn),為人類的思維決策和企業(yè)戰(zhàn)略發(fā)展服務。傳統(tǒng)的信息系統(tǒng)是處理離散事務的。這些系統(tǒng)不是設計為讓用戶去從不同聚集層去抽取數(shù)據(jù),并使用高級的方法來分析企業(yè)數(shù)據(jù)的,而是適應用于服務于單一目的的商務過程或程序,如會計過程等,所以系統(tǒng)使用者很難通過傳統(tǒng)離散的事務處理系統(tǒng)對商務環(huán)境進行整體了解。
由于商務智能系統(tǒng)不是針對處理離散事務的系統(tǒng),所以它的組成與其他的信息系統(tǒng)與一定的區(qū)別。IBM商業(yè)智能專家Michael L. Gonzales在《IBM數(shù)據(jù)倉庫及IBM商業(yè)智能工具》中給出商業(yè)智能組成為數(shù)據(jù)倉庫、數(shù)據(jù)源、數(shù)據(jù)目標。
數(shù)據(jù)倉庫的典型工作是對集成、清洗、聚集、預計算和查詢服務所需的大量數(shù)據(jù)進行批處理。數(shù)據(jù)源可以是操作型數(shù)據(jù)庫、歷史數(shù)據(jù)、外部數(shù)據(jù)或是己有數(shù)據(jù)倉庫中的數(shù)據(jù)信息,也可以是相關數(shù)據(jù)庫或是其他任何支持商務應用的數(shù)據(jù)結構。數(shù)據(jù)源可以存在于多種不同的平臺,并且包括結構化信息,如電子表格,無結構信息,普通文本,圖片等等。
一般來說,數(shù)據(jù)預處理、建立數(shù)據(jù)倉庫、數(shù)據(jù)分析、指標展示是商業(yè)智能的數(shù)據(jù)流程。數(shù)據(jù)預處理是整合企業(yè)原始數(shù)據(jù)的第一步,包括數(shù)據(jù)抽取、轉換和裝載三個過程。源數(shù)據(jù)采集、篩選、整理及轉換基本上是從前臺作業(yè)系統(tǒng)、業(yè)務部門及企業(yè)外部的各種類型的數(shù)據(jù)庫(如:ORACLE, SYBASE, SQLSERVER, FOXPRO, ACCESS,工NFORMIX等)中獲取數(shù)據(jù)的,這些數(shù)據(jù)必須依用戶所需,按照數(shù)據(jù)倉庫的要求,以統(tǒng)一定義的格式從各個系統(tǒng)抽取出來,經(jīng)過數(shù)據(jù)篩選、整合、轉換納入數(shù)據(jù)倉庫。
建立數(shù)據(jù)倉庫
建立數(shù)據(jù)倉庫是處理海量數(shù)據(jù)的基礎。商業(yè)智能系統(tǒng)的核心構架是數(shù)據(jù)倉庫,其主要功能既包括傳統(tǒng)的聯(lián)機事務處理(OLAP)及統(tǒng)計查詢,又包括決策支持和聯(lián)機分析處理(OLAP),數(shù)據(jù)倉庫包括數(shù)據(jù)提取模塊、數(shù)據(jù)清洗模塊、數(shù)據(jù)轉換模塊,實現(xiàn)數(shù)據(jù)的提取、凈化、過濾及數(shù)據(jù)標準化。[page] 數(shù)據(jù)分析
數(shù)據(jù)分析是體現(xiàn)系統(tǒng)智能的關鍵,一般采用聯(lián)機分析處理和數(shù)據(jù)挖掘技術。聯(lián)機分析處理不僅進行數(shù)據(jù)匯總、聚集,同時還提供切片、切塊、下鉆、上卷和旋轉等數(shù)據(jù)分析功能,用戶可以方便地對海量數(shù)據(jù)進行多維分析。數(shù)據(jù)挖掘的目標則是挖掘數(shù)據(jù)背后隱藏的知識,通過關聯(lián)分析、聚類和分類等方法建立分析模型,預測企業(yè)未來發(fā)展趨勢和面臨的問題。
指標展現(xiàn)
通過數(shù)據(jù)分析,系統(tǒng)得出結論,并提交給決策者。指標展現(xiàn)的主要方式有以下幾種方式:
1. 查詢。定義查詢、動態(tài)查詢、OLAP查詢與決策支持智能查詢;
2. 報表。產(chǎn)生關系數(shù)據(jù)表格、復雜表格、OLAP表格、報告以及各種綜合報表;
3. 可視化。用易于理解的點線圖、直方圖、餅圖、網(wǎng)狀圖、交互式可視化、動態(tài)模擬、計算機動畫技術表現(xiàn)復雜數(shù)據(jù)及其相互關系;
4. 統(tǒng)計。進行平均值、最大值、最小值、期望、方差、匯總、排序等各種統(tǒng)計分析;
5. 挖掘。利用數(shù)據(jù)挖掘等方法,從數(shù)據(jù)中得到關于數(shù)據(jù)關系和模式的知識。
可見,商業(yè)智能涉及一個很寬的領域,集收集、合并、分析、提供信息存取功能于一體,包括抽取、轉換、裝載軟件工具、數(shù)據(jù)倉庫、數(shù)據(jù)查詢和報告、聯(lián)機數(shù)據(jù)分析、數(shù)據(jù)挖掘和可視化等工具。