創(chuàng)新互聯(lián)公司是一家專注網(wǎng)站建設、網(wǎng)絡營銷策劃、成都小程序開發(fā)、電子商務建設、網(wǎng)絡推廣、移動互聯(lián)開發(fā)、研究、服務為一體的技術型公司。公司成立十年以來,已經(jīng)為千余家格柵板各業(yè)的企業(yè)公司提供互聯(lián)網(wǎng)服務?,F(xiàn)在,服務的千余家客戶與我們一路同行,見證我們的成長;未來,我們一起分享成功的喜悅。
在對數(shù)據(jù)的質量進行分析后,接下來就可以對數(shù)據(jù)的特征進行分析和計算,也可以通過繪制圖表對數(shù)據(jù)的特征進行展示。數(shù)據(jù)的特征分析通過有以下幾種方式:分布分析、對比分析、統(tǒng)計量分析、周期性分析、貢獻度分析(帕累托分析)、相關性分析、正態(tài)性檢驗。
分布分析能揭示數(shù)據(jù)的分布特征和分布類型。
下面我們通過具體的示例來演示如何對數(shù)據(jù) 進行定量和定性的分布情況進行分析。下面是需要用到的測試數(shù)據(jù)。這是數(shù)碼相機在1998年整年的銷售訂單數(shù)據(jù)。下面是前10條數(shù)據(jù):
對數(shù)據(jù)進行定量分析,展示其分布情況最常用的方法就是直方圖(Histogram)。這種圖又稱質量分布圖,是一種統(tǒng)計報告圖,由一系列高度不等的縱向條紋或線段表示數(shù)據(jù)分布的情況。一般用橫軸表示數(shù)據(jù)類型,縱軸表示分布情況。
繪制直方圖一般可以按照下面的步驟進行:
繪制出的直方圖如下所示。
對數(shù)據(jù)的定性分析常常根據(jù)變量的分類類型來分組,展示其分布情況最常用的方法就是餅圖或者條形圖來描述定性變量的分布。例如,餅圖顯示一個數(shù)據(jù)系列中各項的大小與各項總和的比例。餅圖中的數(shù)據(jù)點顯示為整個餅圖的百分比。
下面以餅圖舉例說明,只需要將上面直方圖代碼中最后生成的DataFrame(result)直接使用餅圖繪制出,即可。如下所示。
繪制出的餅圖如下所示。