首先,普及一下pandas與numpy的區(qū)別:
創(chuàng)新互聯(lián)專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于成都網(wǎng)站設(shè)計、網(wǎng)站建設(shè)、外貿(mào)網(wǎng)站建設(shè)、仁化網(wǎng)絡(luò)推廣、成都微信小程序、仁化網(wǎng)絡(luò)營銷、仁化企業(yè)策劃、仁化品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運營等,從售前售中售后,我們都將竭誠為您服務(wù),您的肯定,是我們最大的嘉獎;創(chuàng)新互聯(lián)為所有大學(xué)生創(chuàng)業(yè)者提供仁化建站搭建服務(wù),24小時服務(wù)熱線:18982081108,官方網(wǎng)址:www.cdcxhl.com
pandas操作的數(shù)據(jù)集是Series,本質(zhì)上是列表與字典的混合,常用的數(shù)據(jù)形式為DataFrame;
numpy操作的數(shù)據(jù)集是數(shù)組或矩陣。
1、對數(shù)組求均值、方差、標(biāo)準(zhǔn)差
2、對矩陣求標(biāo)準(zhǔn)差
注意:在求標(biāo)準(zhǔn)差時需要注意幾個問題:
1、在統(tǒng)計學(xué)中,標(biāo)準(zhǔn)差分為兩種:
(1)總體標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差公式根號內(nèi)除以n,是有偏的。
(2)樣本標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差公式根號內(nèi)除以n-1,是無偏的。
2、pandas與numpy在計算標(biāo)準(zhǔn)差時的區(qū)別
(1)numpy
? ? ?在numpy中計算標(biāo)準(zhǔn)差時,括號內(nèi)要指定ddof的值,ddof表示自由度,當(dāng)ddof=0時計算的是總體標(biāo)準(zhǔn)差;當(dāng)ddof=1時計算的是樣本標(biāo)準(zhǔn)差,當(dāng)不為ddof設(shè)置值時,其默認(rèn)為總體標(biāo)準(zhǔn)差。
(2)pandas
? ? ?在使用pandas計算標(biāo)準(zhǔn)差時,其與numpy的默認(rèn)情況是相反的,在默認(rèn)情況下,pandas計算的標(biāo)準(zhǔn)差為樣本標(biāo)準(zhǔn)差。
import?numpy?as?np
#可以直接用std函數(shù)
a?=?np.arange(10)
#array([0,?1,?2,?3,?4,?5,?6,?7,?8,?9])
np.std(a)
#2.8722813232690143
#或者按標(biāo)準(zhǔn)差公式寫
a?=?np.arange(10)
#array([0,?1,?2,?3,?4,?5,?6,?7,?8,?9])
mid?=?0
for?i?in?mid:
mid?=?mid?+?(i?-?np.mean(a))?**?2
np.sqrt(mid/a.size)
#2.8722813232690143
std()函數(shù)就是初高中學(xué)的標(biāo)準(zhǔn)差 numpy.std()
求標(biāo)準(zhǔn)差的時候默認(rèn)是除以 n 的,即是有偏的,np.std無偏樣本標(biāo)準(zhǔn)差方式為加入?yún)?shù) ddof = 1
def fangcha(): a=float(raw_input("請輸入a:")) b=float(raw_input("請輸入b:")) c=float(raw_input("請輸入C:")) d=(a+b+c)/3.0 e=((a-d)**2+(b-d)**2+(c-d)**2)/3.0 print "平均數(shù)是:%f方差是:%f" %(d,e) fangcha() Python2.7可用