從前有一個(gè)數(shù)字王國(guó),里面的數(shù)字們喜歡在一起玩,不過(guò)它們有點(diǎn)挑剔,總是想跟與自己接近的數(shù)字玩,他們覺(jué)得其他都是遠(yuǎn)房親戚,不親。我們?cè)趺磶椭鼈冋业胶线m的一組數(shù)字呢?
創(chuàng)新互聯(lián)是專業(yè)的天臺(tái)網(wǎng)站建設(shè)公司,天臺(tái)接單;提供網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站,網(wǎng)頁(yè)設(shè)計(jì),網(wǎng)站設(shè)計(jì),建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行天臺(tái)網(wǎng)站開(kāi)發(fā)網(wǎng)頁(yè)制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛(ài)的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊(duì),希望更多企業(yè)前來(lái)合作!平均數(shù)是統(tǒng)計(jì)中的一個(gè)重要概念。通常用來(lái)表示一組統(tǒng)計(jì)對(duì)象的集中趨勢(shì)。
平均數(shù)里面最常用的是算術(shù)平均數(shù)(或稱均值)。它是一組數(shù)字的和除以數(shù)字的個(gè)數(shù)。
在均值用于表示統(tǒng)計(jì)對(duì)象的一般水平,它是描述數(shù)據(jù)集中程度的一個(gè)統(tǒng)計(jì)量。我們既可以用它來(lái)反映一組數(shù)據(jù)的一般情況,也可以用它進(jìn)行不同組數(shù)據(jù)的比較,以看出組與組之間的差別。
例如數(shù)字20會(huì)跟下面兩組數(shù)字哪一組玩呢?
A | 19 | 23 | 19 | 21 | 23 | 20 | 21 | 20 | 18 | 22 |
---|---|---|---|---|---|---|---|---|---|---|
B | 43 | 45 | 36 | 45 | 38 | 36 | 39 | 38 | 39 | 41 |
通過(guò)計(jì)算均值,A組的均值為20.6,B組的均值為40,所以數(shù)字20去和A組玩。
為什么要用一個(gè)均值這樣的叫法,為什么不能直接叫平均數(shù)呢?
因?yàn)槠骄鶖?shù)有好多種:
STOP!好吧,我們就用均值。。
數(shù)字20又來(lái)找人玩,這次的數(shù)據(jù)組是它們,均值是20,好像沒(méi)什么問(wèn)題,但是20好像并不開(kāi)心:
C | 5 | 2 | 5 | 5 | 5 | 3 | 6 | 2 | 84 | 83 |
---|
這是怎么一回事?!
中位數(shù)是另一個(gè)表示集中趨勢(shì)的一個(gè)值,中位數(shù)不是所有數(shù)字計(jì)算得出,而是把所有的數(shù)按照大小的順序排列。如果數(shù)據(jù)的個(gè)數(shù)是奇數(shù),則中間那個(gè)數(shù)據(jù)就是這組數(shù)據(jù)的中位數(shù);如果數(shù)據(jù)的個(gè)數(shù)是偶數(shù),則中間那2個(gè)數(shù)據(jù)的平均值就是這組數(shù)據(jù)的中位數(shù)。
所以上面的這組數(shù)字,應(yīng)該用中位數(shù)來(lái)描述。
將所有數(shù)字從小到大排列后:
C | 2 | 2 | 3 | 5 | 5 | 5 | 5 | 6 | 83 | 84 |
---|
中位數(shù)為第5和第6個(gè)數(shù)的平均值,也就是5,說(shuō)明C組集中在了數(shù)字5的周圍,所以數(shù)字20不喜歡和它們一起玩。在這里,83,84偏離了整體,是異常值。
那就換一組數(shù)字吧,這次的數(shù)據(jù)組是它們,均值是20,中位數(shù)也是20,這次沒(méi)什么問(wèn)題了吧?
D | 3 | 5 | 5 | 5 | 6 | 34 | 34 | 36 | 36 | 36 |
---|
眾數(shù)指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)值。例如在(2,3,3,3)中,出現(xiàn)最多的是3,因此眾數(shù)是3,眾數(shù)可能是一個(gè)數(shù),但也可能是多個(gè)數(shù)。用眾數(shù)代表一組數(shù)據(jù),適合于數(shù)據(jù)量較多時(shí)使用,且眾數(shù)不受異常值的影響。
D組中出現(xiàn)次數(shù)最多的數(shù)字是5和36,表示數(shù)字分成了兩堆接近的數(shù),還是沒(méi)有和數(shù)字20接近的,數(shù)字20也不喜歡和它們玩。
數(shù)字20受夠了!它要求再找些靠譜的參考標(biāo)準(zhǔn),好吧,下面是一些參考:
全距又稱極差,用來(lái)表示一組數(shù)據(jù)中大值與最小值之間的差額,即大值減最小值后所得數(shù)值。全距為離散程度的最簡(jiǎn)單測(cè)度值,比較容易受到異常值影響。
上面的四組數(shù)據(jù)的全距為:
A | B | C | D | |
---|---|---|---|---|
全距 | 5 | 9 | 82 | 33 |
對(duì)于數(shù)字20來(lái)說(shuō),如果全距太大,就有可能是個(gè)坑。不過(guò)光看全距說(shuō)明不了更多問(wèn)題,還要進(jìn)一步來(lái)看。
百分位數(shù)是將一組數(shù)據(jù)從小到大排序,并計(jì)算相應(yīng)的累計(jì)百分位,則某一百分位所對(duì)應(yīng)數(shù)據(jù)的值就稱為這一百分位的百分位數(shù)。
上面四組數(shù)據(jù)的10%百分位數(shù)和90%百分位數(shù)分別為:
百分位數(shù) | A | B | C | D |
---|---|---|---|---|
10% | 18.9 | 36 | 2 | 4.8 |
90% | 23 | 45 | 83.1 | 36 |
百分位數(shù)對(duì)于數(shù)字20來(lái)說(shuō),是一個(gè)很好的參考,可以知道和他大小相仿的數(shù)字都集中在什么區(qū)域。但是這么多百分位數(shù),選哪個(gè)好呢?
四分位數(shù)可以理解為是特定的幾個(gè)百分位數(shù):25%,50%和75%。將一組數(shù)據(jù)從小到大排列后:
第一四分位數(shù)等于第25%的數(shù)字,也叫下四分位數(shù);
第二四分位數(shù)等于第50%的數(shù)字,也就是中位數(shù);
第三四分位數(shù)等于第75%的數(shù)字,也叫上四分位數(shù);
第三四分位數(shù)與第一四分位數(shù)的差距又稱四分位距。
四分位距提供了一個(gè)簡(jiǎn)單的判斷數(shù)字分散程度的指標(biāo),對(duì)于數(shù)字20來(lái)說(shuō),可以有效的避免使用百分位數(shù)時(shí)的選擇困難癥。
上面四組數(shù)據(jù)的四分位數(shù)以及四分位距為:
四分位數(shù) | A | B | C | D |
---|---|---|---|---|
下四分位數(shù) | 19.25 | 38 | 3.5 | 5 |
上四分位數(shù) | 21.75 | 42.5 | 5.75 | 35.5 |
四分位距 | 2.5 | 4.5 | 2.25 | 30.5 |
這樣看來(lái)C組似乎比A組還要好,還有沒(méi)有更靠譜一些的指標(biāo)?
方差用來(lái)描述一組數(shù)的離散程度,它將各個(gè)數(shù)和均值的差算一下平方,相加之后再除以總數(shù),這樣就可以算出各個(gè)數(shù)據(jù)分散的程度。
上面四組數(shù)據(jù)的方差為:
A | B | C | D | |
---|---|---|---|---|
方差 | 2.64 | 10.2 | 1009.8 | 232 |
C組和D組一下子就被排除了,偏離了太多。方差更好,不過(guò)由于平方了一下,如果想要更直觀的表示和均值的距離的話,就要用到下面的標(biāo)準(zhǔn)差:
標(biāo)準(zhǔn)差是方差開(kāi)平方,反映這組數(shù)字的離散程度。
標(biāo)準(zhǔn)差越大,代表大部分的數(shù)值和其平均值之間差異較大;標(biāo)準(zhǔn)差越小,代表這些數(shù)值較接近平均值。
上面四組數(shù)據(jù)的標(biāo)準(zhǔn)差為:(保留兩位小數(shù))
A | B | C | D | |
---|---|---|---|---|
標(biāo)準(zhǔn)差 | 1.62 | 3.19 | 31.78 | 15.23 |
標(biāo)準(zhǔn)差說(shuō)明A組數(shù)據(jù),平均和均值之間平均差距為1.62,大家都很接近,選這一組就沒(méi)錯(cuò)了。
數(shù)字20:你一開(kāi)始告訴我標(biāo)準(zhǔn)差不就好了?繞這么多彎子干什么?
上面的每一種值都有各自的適用場(chǎng)合,要根據(jù)關(guān)注的目標(biāo),使用合適的值進(jìn)行描述,才是最合理的,沒(méi)有唯一一個(gè)最好的衡量值。例如上面四組數(shù)據(jù),如果只看標(biāo)準(zhǔn)差,能說(shuō)明數(shù)字比較靠近,但并不能表明這一組數(shù)字靠近誰(shuí),還需要結(jié)合均值來(lái)一起考慮。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。