真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

數(shù)據(jù)分析--數(shù)字找朋友

從前有一個數(shù)字王國,里面的數(shù)字們喜歡在一起玩,不過它們有點(diǎn)挑剔,總是想跟與自己接近的數(shù)字玩,他們覺得其他都是遠(yuǎn)房親戚,不親。我們怎么幫助它們找到合適的一組數(shù)字呢?

10年積累的成都網(wǎng)站建設(shè)、網(wǎng)站設(shè)計(jì)經(jīng)驗(yàn),可以快速應(yīng)對客戶對網(wǎng)站的新想法和需求。提供各種問題對應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認(rèn)識你,你也不認(rèn)識我。但先網(wǎng)站制作后付款的網(wǎng)站建設(shè)流程,更有廬江免費(fèi)網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。

均值

平均數(shù)是統(tǒng)計(jì)中的一個重要概念。通常用來表示一組統(tǒng)計(jì)對象的集中趨勢。

平均數(shù)里面最常用的是算術(shù)平均數(shù)(或稱均值)。它是一組數(shù)字的和除以數(shù)字的個數(shù)。

在均值用于表示統(tǒng)計(jì)對象的一般水平,它是描述數(shù)據(jù)集中程度的一個統(tǒng)計(jì)量。我們既可以用它來反映一組數(shù)據(jù)的一般情況,也可以用它進(jìn)行不同組數(shù)據(jù)的比較,以看出組與組之間的差別。

例如數(shù)字20會跟下面兩組數(shù)字哪一組玩呢?

A19231921232021201822
B 43 45 36 45 38 36 39 38 39 41

通過計(jì)算均值,A組的均值為20.6,B組的均值為40,所以數(shù)字20去和A組玩。

為什么要用一個均值這樣的叫法,為什么不能直接叫平均數(shù)呢?

因?yàn)槠骄鶖?shù)有好多種:

  • 算術(shù)平均數(shù):n個數(shù)據(jù)相加后除以n。就是這里的均值。
  • 幾何平均數(shù):n個數(shù)據(jù)相乘后開n次方。
  • 調(diào)和平均數(shù):n個數(shù)據(jù)的倒數(shù)取算術(shù)平均,再取倒數(shù)。
  • 平方平均數(shù)(也稱“均方根”):n個數(shù)據(jù)的平方取算數(shù)平均,再開根號。
  • 移動平均數(shù)
  • 算術(shù)-幾何平均數(shù)
  • 幾何-調(diào)和平均數(shù)
  • 。。。。。。

STOP!好吧,我們就用均值。。

數(shù)字20又來找人玩,這次的數(shù)據(jù)組是它們,均值是20,好像沒什么問題,但是20好像并不開心:

C525553628483

這是怎么一回事?!

中位數(shù)

中位數(shù)是另一個表示集中趨勢的一個值,中位數(shù)不是所有數(shù)字計(jì)算得出,而是把所有的數(shù)按照大小的順序排列。如果數(shù)據(jù)的個數(shù)是奇數(shù),則中間那個數(shù)據(jù)就是這組數(shù)據(jù)的中位數(shù);如果數(shù)據(jù)的個數(shù)是偶數(shù),則中間那2個數(shù)據(jù)的平均值就是這組數(shù)據(jù)的中位數(shù)。

所以上面的這組數(shù)字,應(yīng)該用中位數(shù)來描述。

將所有數(shù)字從小到大排列后:

C223555568384

中位數(shù)為第5和第6個數(shù)的平均值,也就是5,說明C組集中在了數(shù)字5的周圍,所以數(shù)字20不喜歡和它們一起玩。在這里,83,84偏離了整體,是異常值。

那就換一組數(shù)字吧,這次的數(shù)據(jù)組是它們,均值是20,中位數(shù)也是20,這次沒什么問題了吧?

D355563434363636

眾數(shù)

眾數(shù)指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)值。例如在(2,3,3,3)中,出現(xiàn)最多的是3,因此眾數(shù)是3,眾數(shù)可能是一個數(shù),但也可能是多個數(shù)。用眾數(shù)代表一組數(shù)據(jù),適合于數(shù)據(jù)量較多時使用,且眾數(shù)不受異常值的影響。

D組中出現(xiàn)次數(shù)最多的數(shù)字是5和36,表示數(shù)字分成了兩堆接近的數(shù),還是沒有和數(shù)字20接近的,數(shù)字20也不喜歡和它們玩。

數(shù)字20受夠了!它要求再找些靠譜的參考標(biāo)準(zhǔn),好吧,下面是一些參考:

全距

全距又稱極差,用來表示一組數(shù)據(jù)中最大值與最小值之間的差額,即最大值減最小值后所得數(shù)值。全距為離散程度的最簡單測度值,比較容易受到異常值影響。

上面的四組數(shù)據(jù)的全距為:

ABCD
全距 5 9 82 33

對于數(shù)字20來說,如果全距太大,就有可能是個坑。不過光看全距說明不了更多問題,還要進(jìn)一步來看。

百分位數(shù)

百分位數(shù)是將一組數(shù)據(jù)從小到大排序,并計(jì)算相應(yīng)的累計(jì)百分位,則某一百分位所對應(yīng)數(shù)據(jù)的值就稱為這一百分位的百分位數(shù)。

上面四組數(shù)據(jù)的10%百分位數(shù)和90%百分位數(shù)分別為:

百分位數(shù)ABCD
10% 18.9 36 2 4.8
90% 23 45 83.1 36

百分位數(shù)對于數(shù)字20來說,是一個很好的參考,可以知道和他大小相仿的數(shù)字都集中在什么區(qū)域。但是這么多百分位數(shù),選哪個好呢?

四分位數(shù)

四分位數(shù)可以理解為是特定的幾個百分位數(shù):25%,50%和75%。將一組數(shù)據(jù)從小到大排列后:

第一四分位數(shù)等于第25%的數(shù)字,也叫下四分位數(shù);

第二四分位數(shù)等于第50%的數(shù)字,也就是中位數(shù);

第三四分位數(shù)等于第75%的數(shù)字,也叫上四分位數(shù);

第三四分位數(shù)與第一四分位數(shù)的差距又稱四分位距。

四分位距提供了一個簡單的判斷數(shù)字分散程度的指標(biāo),對于數(shù)字20來說,可以有效的避免使用百分位數(shù)時的選擇困難癥。

上面四組數(shù)據(jù)的四分位數(shù)以及四分位距為:

四分位數(shù)ABCD
下四分位數(shù) 19.25 38 3.5 5
上四分位數(shù) 21.75 42.5 5.75 35.5
四分位距 2.5 4.5 2.25 30.5

這樣看來C組似乎比A組還要好,還有沒有更靠譜一些的指標(biāo)?

方差

方差用來描述一組數(shù)的離散程度,它將各個數(shù)和均值的差算一下平方,相加之后再除以總數(shù),這樣就可以算出各個數(shù)據(jù)分散的程度。

上面四組數(shù)據(jù)的方差為:

ABCD
方差 2.64 10.2 1009.8 232

C組和D組一下子就被排除了,偏離了太多。方差更好,不過由于平方了一下,如果想要更直觀的表示和均值的距離的話,就要用到下面的標(biāo)準(zhǔn)差:

標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差是方差開平方,反映這組數(shù)字的離散程度。

標(biāo)準(zhǔn)差越大,代表大部分的數(shù)值和其平均值之間差異較大;標(biāo)準(zhǔn)差越小,代表這些數(shù)值較接近平均值。

上面四組數(shù)據(jù)的標(biāo)準(zhǔn)差為:(保留兩位小數(shù))

ABCD
標(biāo)準(zhǔn)差 1.62 3.19 31.78 15.23

標(biāo)準(zhǔn)差說明A組數(shù)據(jù),平均和均值之間平均差距為1.62,大家都很接近,選這一組就沒錯了。

該用哪一個?

數(shù)字20:你一開始告訴我標(biāo)準(zhǔn)差不就好了?繞這么多彎子干什么?

上面的每一種值都有各自的適用場合,要根據(jù)關(guān)注的目標(biāo),使用合適的值進(jìn)行描述,才是最合理的,沒有唯一一個最好的衡量值。例如上面四組數(shù)據(jù),如果只看標(biāo)準(zhǔn)差,能說明數(shù)字比較靠近,但并不能表明這一組數(shù)字靠近誰,還需要結(jié)合均值來一起考慮。


本文標(biāo)題:數(shù)據(jù)分析--數(shù)字找朋友
文章URL:http://weahome.cn/article/geegcp.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部