創(chuàng)新互聯(lián)www.cdcxhl.cn八線動(dòng)態(tài)BGP香港云服務(wù)器提供商,新人活動(dòng)買多久送多久,劃算不套路!
小編這次要給大家分享的是詳解Python常用數(shù)據(jù)分析模塊,文章內(nèi)容豐富,感興趣的小伙伴可以來(lái)了解一下,希望大家閱讀完這篇文章之后能夠有所收獲。
前言
python是一門優(yōu)秀的編程語(yǔ)言,而是python成為數(shù)據(jù)分析軟件的是因?yàn)閜ython強(qiáng)大的擴(kuò)展模塊。也就是這些python的擴(kuò)展包讓python可以做數(shù)據(jù)分析,主要包括numpy,scipy,pandas,matplotlib,scikit-learn等等諸多強(qiáng)大的模塊,在結(jié)合上ipython交互工具 ,以及python強(qiáng)大的爬蟲數(shù)據(jù)獲取能力,字符串處理能力,讓python成為完整的數(shù)據(jù)分析工具。
numpy
官網(wǎng):https://www.scipy.org/
NumPy(Numerical Python的簡(jiǎn)稱)是高性能科學(xué)計(jì)算和數(shù)據(jù)分析的基礎(chǔ)包。NumPy最重要的一個(gè)特點(diǎn)就是其N維數(shù)組對(duì)象(即ndarray),該對(duì)象是一個(gè)快速而靈活的大數(shù)據(jù)集容器。可以利用這種數(shù)組對(duì)整塊數(shù)據(jù)執(zhí)行一些數(shù)學(xué)運(yùn)算,比python自帶的數(shù)組以及元組效率更高,其語(yǔ)法跟變量元素之間的運(yùn)算一樣,無(wú)需進(jìn)行循環(huán)操作。
在使用python進(jìn)行數(shù)據(jù)分析的過程中,我們大部分時(shí)候是不會(huì)直接使用numpy包,而是其他包要用到numpy??梢哉f(shuō)numpy是整個(gè)python數(shù)據(jù)分析工作的基石。
舉個(gè)簡(jiǎn)單的案例,我們要計(jì)算100000個(gè)隨機(jī)數(shù)的值,如果傳統(tǒng)編程需要寫循環(huán),用了2.2s,而使用numpy數(shù)據(jù)結(jié)構(gòu),則可以進(jìn)行向量化操作,無(wú)需循環(huán),只需要28.2ms節(jié)約大量時(shí)間。
In [1]: import numpy In [2]: my_arr = np.arange(1000000) In [3]: my_list = list(range(1000000)) In [4]: %time for _ in range(10): my_arr2 = my_arr * 2 Wall time: 28.2 ms In [5]: %time for _ in range(10): my_list2 = [x * 2 for x in my_list] Wall time: 2.2 s