Anaconda 是一個(gè)跨平臺(tái)的版本,通過(guò)命令行來(lái)管理安裝包。進(jìn)行大規(guī)模數(shù)據(jù)處理、預(yù)測(cè)分析和科學(xué)計(jì)算。它包括近 200 個(gè)工具包,大數(shù)據(jù)處理需要用到的常見(jiàn)包有 NumPy 、 SciPy 、 pandas 、 IPython 、 Matplotlib 、 Scikit-learn 、gensim、nltk、networkx、beautifulsoup4和statsmodels 等。
可以直接通過(guò)命令進(jìn)行安裝。如下圖,分別安裝上述相關(guān)文件(示例安裝pandas,其他類(lèi)似)。
創(chuàng)新互聯(lián)為企業(yè)提供:品牌網(wǎng)站設(shè)計(jì)、網(wǎng)絡(luò)營(yíng)銷(xiāo)策劃、重慶小程序開(kāi)發(fā)、營(yíng)銷(xiāo)型網(wǎng)站建設(shè)和網(wǎng)站運(yùn)營(yíng)托管,一站式網(wǎng)絡(luò)營(yíng)銷(xiāo)整體服務(wù)。實(shí)現(xiàn)不斷獲取潛在客戶之核心目標(biāo),建立了企業(yè)專(zhuān)屬的“全網(wǎng)營(yíng)銷(xiāo)推廣”,就用不著再為了獲取潛在客戶而苦惱,相反,客戶會(huì)主動(dòng)找您,生意就找上門(mén)來(lái)了!
一、NumPy(Numerical Python)
NumPy是 Python 語(yǔ)言的一個(gè)擴(kuò)展程序庫(kù),支持大量的維度數(shù)組與矩陣運(yùn)算,也針對(duì)數(shù)組運(yùn)算提供大量的數(shù)學(xué)函數(shù)庫(kù)。NumPy 為開(kāi)放源代碼并且由許多協(xié)作者共同維護(hù)開(kāi)發(fā),是一個(gè)運(yùn)行速度非??斓臄?shù)學(xué)庫(kù),用于數(shù)組計(jì)算。
NumPy 通常與 SciPy(Scientific Python)和 Matplotlib(繪圖庫(kù))一起使用,可廣泛用于替代 MatLab,是一個(gè)強(qiáng)大的科學(xué)計(jì)算環(huán)境,便于后期學(xué)習(xí)數(shù)據(jù)科學(xué)和者機(jī)器學(xué)習(xí)。 SciPy 是一個(gè)開(kāi)源的 Python 算法庫(kù)和數(shù)學(xué)工具包, 包含的模塊有最優(yōu)化、線性代數(shù)、積分、插值、特殊函數(shù)、快速傅里葉變換、信號(hào)處理和圖像處理、常微分方程求解和其他科學(xué)與工程中常用的計(jì)算。
Matplotlib 是 Python 編程語(yǔ)言及其數(shù)值數(shù)學(xué)擴(kuò)展包 NumPy 的可視化操作界面,是為利用通用的圖形用戶界面工具包,如 Tkinter, wxPython, Qt 或 GTK+ 向應(yīng)用程序嵌入式繪圖提供了應(yīng)用程序接口(API),前期在數(shù)據(jù)可視化中做作過(guò)簡(jiǎn)單的介紹。
1、numpy中的數(shù)組操作及代碼
NumPy中的ndarray是一個(gè)多維數(shù)組對(duì)象,該對(duì)象由兩部分組成:實(shí)際的數(shù)據(jù)和描述這些數(shù)據(jù)的元數(shù)據(jù),大部分的數(shù)組操作僅僅修改元數(shù)據(jù)部分。
import numpy as np #導(dǎo)入numpy包,并另命令為np a= np.arange(5) # 調(diào)用numpy中的函數(shù)arange,函數(shù)創(chuàng)建數(shù)組 print(a.dtype) # 打印出數(shù)組a的數(shù)據(jù)類(lèi)型 print(a.shape) #數(shù)組的 shape 屬性返回一個(gè)元組(tuple),元組中的元素即為NumPy數(shù)組每一個(gè)維度上的大小 print('\n') #創(chuàng)建多維數(shù)組 m = np.array([np.arange(5), np.arange(5)]) #列表作為參數(shù)傳給array函數(shù),從而創(chuàng)建了一個(gè)5×2的數(shù)組 print(m) #選取數(shù)組元素 print(m[0,0]) print(m[0,1]) print(m[1,1]) print(m[1,2]) print(m[1,3]) # NumPy 自定義的異構(gòu)數(shù)據(jù)類(lèi)型,該數(shù)據(jù)類(lèi)型包括一個(gè)用字符串記錄的名字、一個(gè)用 # 整數(shù)記錄的數(shù)字以及一個(gè)用浮點(diǎn)數(shù)記錄的價(jià)格 t = np.dtype([('name', np.str_, 40), ('numitems', np.int32), ('price',np.float32)]) print(t) # 一維數(shù)組的索引和切片 a = np.arange(9) print(a[3:7]) print('\n') #多維數(shù)組的切片和索引 b = np.arange(24).reshape(2,3,4) #reshape函數(shù)的作用是改變數(shù)組的“形狀”,也就是改變數(shù)組的維度 #其參數(shù)為一個(gè)正整數(shù)元組,分別指定數(shù)組在每個(gè)維度上的大小 print(b.shape) print('\n') print(b) print('\n') print(b[0]) print('\n') print(b[:,0,0]) #下標(biāo)用英文標(biāo)點(diǎn)的冒號(hào):來(lái)代替,表示不限該位置的參數(shù),即打印出b的第1行,第1列的所有元組的數(shù)據(jù)。