數據描述與分析
專注于為中小企業(yè)提供成都做網站、成都網站設計、成都外貿網站建設服務,電腦端+手機端+微信端的三站合一,更高效的管理,為中小企業(yè)北林免費做網站提供優(yōu)質的服務。我們立足成都,凝聚了一批互聯(lián)網行業(yè)人才,有力地推動了上1000+企業(yè)的穩(wěn)健成長,幫助中小企業(yè)通過網站建設實現規(guī)模擴充和轉變。
在進行數據分析之前,我們需要做的事情是對數據有初步的了解,這個了解就涉及對行業(yè)的了解和對數據本身的敏感程度,通俗來說就是對數據的分布有大概的理解,此時我們需要工具進行數據的描述,觀測數據的形狀等;而后才是對數據進行建模分析,挖掘數據中隱藏的位置信息。目前在數據描述和簡單分析方面做的比較好的是Pandas庫。當然,它還需要結合我們之前提到的Numpy,Scipy等科學計算相關庫才能發(fā)揮功效。
1.Pandas 數據結構
在進行Pandas相關介紹時我們首先需要知道的是Pandas 的兩個數據結構(即對象)Series 和 DataFrame,這是Pandas的核心結構,掌握了此二者結構和屬性要素,會在具體的數據處理過程中如虎添翼。
1.1 Series 簡介
Series 是一種類似于以為數據的對象,它由兩部分組成,第一部分是一維數據,另外一部分是與此一維數據對應的標簽數據。具體如下:
import pandas as pd centerSeries=pd.Series(["中國科學院","文獻情報中心","大樓","北四環(huán)西路",]) print (centerSeries)