python概率概率函數(shù) python 概率分布函數(shù)

如何在Python中實現(xiàn)這五類強大的概率分布

R編程語言已經(jīng)成為統(tǒng)計分析中的事實標準。但在這篇文章中，我將告訴你在Python中實現(xiàn)統(tǒng)計學(xué)概念會是如此容易。我要使用Python實現(xiàn)一些離散和連續(xù)的概率分布。雖然我不會討論這些分布的數(shù)學(xué)細節(jié)，但我會以鏈接的方式給你一些學(xué)習(xí)這些統(tǒng)計學(xué)概念的好資料。在討論這些概率分布之前，我想簡單說說什么是隨機變量（random variable）。隨機變量是對一次試驗結(jié)果的量化。

“專業(yè)、務(wù)實、高效、創(chuàng)新、把客戶的事當(dāng)成自己的事”是我們每一個人一直以來堅持追求的企業(yè)文化。創(chuàng)新互聯(lián)是您可以信賴的網(wǎng)站建設(shè)服務(wù)商、專業(yè)的互聯(lián)網(wǎng)服務(wù)提供商! 專注于網(wǎng)站設(shè)計、做網(wǎng)站、軟件開發(fā)、設(shè)計服務(wù)業(yè)務(wù)。我們始終堅持以客戶需求為導(dǎo)向，結(jié)合用戶體驗與視覺傳達，提供有針對性的項目解決方案，提供專業(yè)性的建議，創(chuàng)新互聯(lián)建站將不斷地超越自我，追逐市場，引領(lǐng)市場！

舉個例子，一個表示拋硬幣結(jié)果的隨機變量可以表示成

Python

X = {1 如果正面朝上,

2 如果反面朝上}

隨機變量是一個變量，它取值于一組可能的值（離散或連續(xù)的），并服從某種隨機性。隨機變量的每個可能取值的都與一個概率相關(guān)聯(lián)。隨機變量的所有可能取值和與之相關(guān)聯(lián)的概率就被稱為概率分布（probability distributrion）。

我鼓勵大家仔細研究一下scipy.stats模塊。

概率分布有兩種類型：離散（discrete）概率分布和連續(xù)（continuous）概率分布。

離散概率分布也稱為概率質(zhì)量函數(shù)（probability mass function）。離散概率分布的例子有伯努利分布（Bernoulli distribution）、二項分布（binomial distribution）、泊松分布（Poisson distribution）和幾何分布（geometric distribution）等。

連續(xù)概率分布也稱為概率密度函數(shù)（probability density function），它們是具有連續(xù)取值（例如一條實線上的值）的函數(shù)。正態(tài)分布（normal distribution）、指數(shù)分布（exponential distribution）和β分布（beta distribution）等都屬于連續(xù)概率分布。

若想了解更多關(guān)于離散和連續(xù)隨機變量的知識，你可以觀看可汗學(xué)院關(guān)于概率分布的視頻。

二項分布（Binomial Distribution）

服從二項分布的隨機變量X表示在n個獨立的是/非試驗中成功的次數(shù)，其中每次試驗的成功概率為p。

E(X) =?np, Var(X) =?np(1?p)

如果你想知道每個函數(shù)的原理，你可以在IPython筆記本中使用help file命令。?E(X)表示分布的期望或平均值。

鍵入stats.binom?了解二項分布函數(shù)binom的更多信息。

二項分布的例子：拋擲10次硬幣，恰好兩次正面朝上的概率是多少？

假設(shè)在該試驗中正面朝上的概率為0.3，這意味著平均來說，我們可以期待有3次是硬幣正面朝上的。我定義擲硬幣的所有可能結(jié)果為k = np.arange(0,11)：你可能觀測到0次正面朝上、1次正面朝上，一直到10次正面朝上。我使用stats.binom.pmf計算每次觀測的概率質(zhì)量函數(shù)。它返回一個含有11個元素的列表（list），這些元素表示與每個觀測相關(guān)聯(lián)的概率值。

您可以使用.rvs函數(shù)模擬一個二項隨機變量，其中參數(shù)size指定你要進行模擬的次數(shù)。我讓Python返回10000個參數(shù)為n和p的二項式隨機變量。我將輸出這些隨機變量的平均值和標準差，然后畫出所有的隨機變量的直方圖。

泊松分布（Poisson Distribution）

一個服從泊松分布的隨機變量X，表示在具有比率參數(shù)（rate parameter）λ的一段固定時間間隔內(nèi)，事件發(fā)生的次數(shù)。參數(shù)λ告訴你該事件發(fā)生的比率。隨機變量X的平均值和方差都是λ。

E(X) =?λ, Var(X) =?λ

泊松分布的例子：已知某路口發(fā)生事故的比率是每天2次，那么在此處一天內(nèi)發(fā)生4次事故的概率是多少？

讓我們考慮這個平均每天發(fā)生2起事故的例子。泊松分布的實現(xiàn)和二項分布有些類似，在泊松分布中我們需要指定比率參數(shù)。泊松分布的輸出是一個數(shù)列，包含了發(fā)生0次、1次、2次，直到10次事故的概率。我用結(jié)果生成了以下圖片。

你可以看到，事故次數(shù)的峰值在均值附近。平均來說，你可以預(yù)計事件發(fā)生的次數(shù)為λ。嘗試不同的λ和n的值，然后看看分布的形狀是怎么變化的。

現(xiàn)在我來模擬1000個服從泊松分布的隨機變量。

正態(tài)分布（Normal Distribution）

正態(tài)分布是一種連續(xù)分布，其函數(shù)可以在實線上的任何地方取值。正態(tài)分布由兩個參數(shù)描述：分布的平均值μ和方差σ2?。

E(X) =?μ, Var(X) =?σ2

正態(tài)分布的取值可以從負無窮到正無窮。你可以注意到，我用stats.norm.pdf得到正態(tài)分布的概率密度函數(shù)。

β分布（Beta Distribution）

β分布是一個取值在?[0, 1]?之間的連續(xù)分布，它由兩個形態(tài)參數(shù)α和β的取值所刻畫。

β分布的形狀取決于α和β的值。貝葉斯分析中大量使用了β分布。

當(dāng)你將參數(shù)α和β都設(shè)置為1時，該分布又被稱為均勻分布（uniform distribution）。嘗試不同的α和β取值，看看分布的形狀是如何變化的。

指數(shù)分布（Exponential Distribution）

指數(shù)分布是一種連續(xù)概率分布，用于表示獨立隨機事件發(fā)生的時間間隔。比如旅客進入機場的時間間隔、打進客服中心電話的時間間隔、中文維基百科新條目出現(xiàn)的時間間隔等等。

我將參數(shù)λ設(shè)置為0.5，并將x的取值范圍設(shè)置為 $[0, 15]$ 。

接著，我在指數(shù)分布下模擬1000個隨機變量。scale參數(shù)表示λ的倒數(shù)。函數(shù)np.std中，參數(shù)ddof等于標準偏差除以 $n-1$ 的值。

結(jié)語（Conclusion）

概率分布就像蓋房子的藍圖，而隨機變量是對試驗事件的總結(jié)。我建議你去看看哈佛大學(xué)數(shù)據(jù)科學(xué)課程的講座，Joe Blitzstein教授給了一份摘要，包含了你所需要了解的關(guān)于統(tǒng)計模型和分布的全部。

python中randint是什么意思？

python中的randint用來生成隨機數(shù)，在使用randint之前，需要調(diào)用random庫。其表達是為random.randint(x,y)，參數(shù)x和y代表生成隨機數(shù)的區(qū)間范圍。

random() 函數(shù)命名來源于英文單詞random（隨機）。randint是random + integer拼接簡寫而成，代表隨機一個整數(shù)。

Python標準庫中的random函數(shù)，可以生成隨機浮點數(shù)、整數(shù)、字符串，甚至幫助你隨機選擇列表序列中的一個元素，打亂一組數(shù)據(jù)等。

函數(shù)randint的使用

1、OUT = RANDINT

產(chǎn)生一個“ 0 ”或“ 1 ”等概率。

2、OUT = RANDINT(M)

生成的M 矩陣的隨機二進制數(shù)字，“ 0 ”和“ 1 ”出現(xiàn)的概率均等。

3、OUT = RANDINT(M,N)

生成的（M,N) 矩陣的隨機二進制數(shù)字,“ 0 ”和“ 1 ”出現(xiàn)的概率均等。

4、OUT = RANDINT(M,N,RANGE)

生成的(M,N) 矩陣的隨機二進制數(shù)字，RANGE范圍可以是標量或向量。

標量：為正的話，取值為[0,RANGE-1] ，為負的話，取值為 [RANGE+1, 0]。

向量：取值為[RANGE(1), RANGE(2)]。

5、OUT = RANDINT(M,N,RANGE,STATE)

resets the state of RAND to STATE。

統(tǒng)計學(xué)入門級：常見概率分布+python繪制分布圖

如果隨機變量X的所有取值都可以逐個列舉出來，則稱X為離散型隨機變量。相應(yīng)的概率分布有二項分布，泊松分布。

如果隨機變量X的所有取值無法逐個列舉出來，而是取數(shù)軸上某一區(qū)間內(nèi)的任一點，則稱X為連續(xù)型隨機變量。相應(yīng)的概率分布有正態(tài)分布，均勻分布，指數(shù)分布，伽馬分布，偏態(tài)分布，卡方分布，beta分布等。(真多分布，好恐怖~~)

在離散型隨機變量X的一切可能值中，各可能值與其對應(yīng)概率的乘積之和稱為該隨機變量X的期望值，記作E(X) 。比如有隨機變量，取值依次為：2，2，2，4，5。求其平均值：(2+2+2+4+5)/5 = 3。

期望值也就是該隨機變量總體的均值。推導(dǎo)過程如下：

= (2+2+2+4+5)/5

= 1/5 2 3 + 4/5 + 5/5

= 3/5 2 + 1/5 4 + 1/5 5

= 0.6 2 + 0.2 4 + 0.2 5

= 60% 2 + 20% 4 + 20%*5

= 1.2 + 0.8 + 1

= 3

倒數(shù)第三步可以解釋為值為2的數(shù)字出現(xiàn)的概率為60%，4的概率為20%，5的概率為20%。所以E(X) = 60% 2 + 20% 4 + 20%*5 = μ = 3。

0-1分布（兩點分布），它的隨機變量的取值為1或0。即離散型隨機變量X的概率分布為：P{X=0} = 1-p, P{X=1} = p，即：

則稱隨機變量X服從參數(shù)為p的0-1分布，記作X~B（1，p)。

在生活中有很多例子服從兩點分布，比如投資是否中標，新生嬰兒是男孩還是女孩，檢查產(chǎn)品是否合格等等。

大家非常熟悉的拋硬幣試驗對應(yīng)的分布就是二項分布。拋硬幣試驗要么出現(xiàn)正面，要么就是反面，只包含這兩個結(jié)果。出現(xiàn)正面的次數(shù)是一個隨機變量，這種隨機變量所服從的概率分布通常稱為二項分布。

像拋硬幣這類試驗所具有的共同性質(zhì)總結(jié)如下：（以拋硬幣為例）

通常稱具有上述特征的n次重復(fù)獨立試驗為n重伯努利試驗。簡稱伯努利試驗或伯努利試驗概型。特別地，當(dāng)試驗次數(shù)為1時，二項分布服從0-1分布(兩點分布)。

舉個栗子：拋3次均勻的硬幣，求結(jié)果出現(xiàn)有2個正面的概率。

已知p = 0.5 (出現(xiàn)正面的概率) ，n = 3 ，k = 2

所以拋3次均勻的硬幣，求結(jié)果出現(xiàn)有2個正面的概率為3/8。

二項分布的期望值和方差分別為：

泊松分布是用來描述在一指定時間范圍內(nèi)或在指定的面積或體積之內(nèi)某一事件出現(xiàn)的次數(shù)的分布。生活中服從泊松分布的例子比如有每天房產(chǎn)中介接待的客戶數(shù)，某微博每月出現(xiàn)服務(wù)器癱瘓的次數(shù)等等。泊松分布的公式為：

其中 λ 為給定的時間間隔內(nèi)事件的平均數(shù)，λ = np。e為一個數(shù)學(xué)常數(shù)，一個無限不循環(huán)小數(shù)，其值約為2.71828。

泊松分布的期望值和方差分別為：

使用Python繪制泊松分布的概率分布圖：

因為連續(xù)型隨機變量可以取某一區(qū)間或整個實數(shù)軸上的任意一個值，所以通常用一個函數(shù)f(x)來表示連續(xù)型隨機變量，而f(x)就稱為概率密度函數(shù) 。

概率密度函數(shù)f(x)具有如下性質(zhì) ：

需要注意的是，f(x)不是一個概率，即f(x) ≠ P(X = x) 。在連續(xù)分布的情況下，隨機變量X在a與b之間的概率可以寫成：

正態(tài)分布（或高斯分布）是連續(xù)型隨機變量的最重要也是最常見的分布，比如學(xué)生的考試成績就呈現(xiàn)出正態(tài)分布的特征，大部分成績集中在某個范圍（比如60-80分），很小一部分往兩端傾斜（比如50分以下和90多分以上）。還有人的身高等等。

正態(tài)分布的定義：

如果隨機變量X的概率密度為( -∞x+∞)：

則稱X服從正態(tài)分布，記作X~N(μ,σ2)。其中-∞μ+∞，σ0， μ為隨機變量X的均值，σ為隨機變量X的標準差。正態(tài)分布的分布函數(shù)

正態(tài)分布的圖形特點：

使用Python繪制正態(tài)分布的概率分布圖：

正態(tài)分布有一個3σ準則，即數(shù)值分布在(μ-σ,μ+σ)中的概率為0.6827，分布在（μ-2σ,μ+2σ)中的概率為0.9545，分布在(μ-3σ,μ+3σ)中的概率為0.9973，也就是說大部分數(shù)值是分布在(μ-3σ,μ+3σ)區(qū)間內(nèi)，超出這個范圍的可能性很小很小，僅占不到0.3%，屬于極個別的小概率事件，所以3σ準則可以用來檢測異常值。

當(dāng)μ=0，σ=1時，有

此時的正態(tài)分布N(0,1) 稱為標準正態(tài)分布。因為μ，σ都是確定的取值，所以其對應(yīng)的概率密度曲線是一條形態(tài)固定的曲線。

對標準正態(tài)分布，通常用φ(x)表示概率密度函數(shù)，用Φ(x)表示分布函數(shù)：

假設(shè)有一次物理考試特別難，滿分100分，全班只有大概20個人及格。與此同時語文考試很簡單，全班絕大部分都考了90分以上。小明的物理和語文分別考了60分和80分，他回家后告訴家長，這時家長能僅僅從兩科科目的分值直接判斷出這次小明的語文成績要比物理好很多嗎？如果不能，應(yīng)該如何判斷呢？此時Z-score就派上用場了。 Z-Score的計算定義：

即將隨機變量X先減去總體樣本均值，再除以總體樣本標準差就得到標準分數(shù)啦。如果X低于平均值，則Z為負數(shù)，反之為正數(shù) 。通過計算標準分數(shù)，可以將任何一個一般的正態(tài)分布轉(zhuǎn)化為標準正態(tài)分布。

小明家長從老師那得知物理的全班平均成績?yōu)?0分，標準差為10，而語文的平均成績?yōu)?2分，標準差為4。分別計算兩科成績的標準分數(shù)：

物理：標準分數(shù) = (60-40)/10 = 2

語文：標準分數(shù) = (85-95)/4 = -2.5

從計算結(jié)果來看，說明這次考試小明的物理成績在全部同學(xué)中算是考得很不錯的，而語文考得很差。

指數(shù)分布可能容易和前面的泊松分布混淆，泊松分布強調(diào)的是某段時間內(nèi)隨機事件發(fā)生的次數(shù)的概率分布，而指數(shù)分布說的是隨機事件發(fā)生的時間間隔的概率分布。比如一班地鐵進站的間隔時間。如果隨機變量X的概率密度為：

則稱X服從指數(shù)分布，其中的參數(shù)λ0。對應(yīng)的分布函數(shù) 為：

均勻分布的期望值和方差分別為：

使用Python繪制指數(shù)分布的概率分布圖：

均勻分布有兩種，分為離散型均勻分布和連續(xù)型均勻分布。其中離散型均勻分布最常見的例子就是拋擲骰子啦。拋擲骰子出現(xiàn)的點數(shù)就是一個離散型隨機變量，點數(shù)可能有1，2，3，4，5，6。每個數(shù)出現(xiàn)的概率都是1/6。

設(shè)連續(xù)型隨機變量X具有概率密度函數(shù)：

則稱X服從區(qū)間(a,b)上的均勻分布。X在等長度的子區(qū)間內(nèi)取值的概率相同。對應(yīng)的分布函數(shù)為：

f(x)和F(x)的圖形分別如下圖所示：

均勻分布的期望值和方差分別為：

名稱欄目：python概率概率函數(shù) python 概率分布函數(shù)
鏈接URL：http://weahome.cn/article/dopdpsi.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

python概率概率函數(shù) python 概率分布函數(shù)

如何在Python中實現(xiàn)這五類強大的概率分布

python中randint是什么意思？

統(tǒng)計學(xué)入門級：常見概率分布+python繪制分布圖

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

python概率概率函數(shù) python 概率分布函數(shù)

如何在Python中實現(xiàn)這五類強大的概率分布

python中randint是什么意思？

統(tǒng)計學(xué)入門級：常見概率分布+python繪制分布圖

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管

python中randint是什么意思？