真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

python分布圖形函數(shù),python分布圖怎么做

如何用python繪制各種圖形

1.環(huán)境

創(chuàng)新互聯(lián)公司專注于企業(yè)全網(wǎng)營銷推廣、網(wǎng)站重做改版、左權(quán)網(wǎng)站定制設(shè)計(jì)、自適應(yīng)品牌網(wǎng)站建設(shè)、H5建站、商城網(wǎng)站建設(shè)、集團(tuán)公司官網(wǎng)建設(shè)、成都外貿(mào)網(wǎng)站建設(shè)公司、高端網(wǎng)站制作、響應(yīng)式網(wǎng)頁設(shè)計(jì)等建站業(yè)務(wù),價格優(yōu)惠性價比高,為左權(quán)等各大城市提供網(wǎng)站開發(fā)制作服務(wù)。

系統(tǒng):windows10

python版本:python3.6.1

使用的庫:matplotlib,numpy

2.numpy庫產(chǎn)生隨機(jī)數(shù)幾種方法

import numpy as np

numpy.random

rand(d0,?d1,?...,?dn) ?

In [2]: x=np.random.rand(2,5)

In [3]: x

Out[3]:

array([[ 0.84286554, ?0.50007593, ?0.66500549, ?0.97387807, ?0.03993009],

[ 0.46391661, ?0.50717355, ?0.21527461, ?0.92692517, ?0.2567891 ]])

randn(d0,?d1,?...,?dn)查詢結(jié)果為標(biāo)準(zhǔn)正態(tài)分布

In [4]: x=np.random.randn(2,5)

In [5]: x

Out[5]:

array([[-0.77195196, ?0.26651203, -0.35045793, -0.0210377 , ?0.89749635],

[-0.20229338, ?1.44852833, -0.10858996, -1.65034606, -0.39793635]])

randint(low,high,size) ?

生成low到high之間(半開區(qū)間 [low, high)),size個數(shù)據(jù)

In [6]: x=np.random.randint(1,8,4)

In [7]: x

Out[7]: array([4, 4, 2, 7])

random_integers(low,high,size) ?

生成low到high之間(閉區(qū)間 [low, high)),size個數(shù)據(jù)

In [10]: x=np.random.random_integers(2,10,5)

In [11]: x

Out[11]: array([7, 4, 5, 4, 2])

3.散點(diǎn)圖

x x軸

y y軸

s ? 圓點(diǎn)面積

c ? 顏色

marker ?圓點(diǎn)形狀

alpha ? 圓點(diǎn)透明度????????????????#其他圖也類似這種配置

N=50# height=np.random.randint(150,180,20)# weight=np.random.randint(80,150,20)

x=np.random.randn(N)

y=np.random.randn(N)

plt.scatter(x,y,s=50,c='r',marker='o',alpha=0.5)

plt.show()

4.折線圖

x=np.linspace(-10000,10000,100) #將-10到10等區(qū)間分成100份

y=x**2+x**3+x**7

plt.plot(x,y)

plt.show()

折線圖使用plot函數(shù)

5.條形圖

N=5

y=[20,10,30,25,15]

y1=np.random.randint(10,50,5)

x=np.random.randint(10,1000,N)

index=np.arange(N)

plt.bar(left=index,height=y,color='red',width=0.3)

plt.bar(left=index+0.3,height=y1,color='black',width=0.3)

plt.show()

orientation設(shè)置橫向條形圖

N=5

y=[20,10,30,25,15]

y1=np.random.randint(10,50,5)

x=np.random.randint(10,1000,N)

index=np.arange(N)# plt.bar(left=index,height=y,color='red',width=0.3)# plt.bar(left=index+0.3,height=y1,color='black',width=0.3)#plt.barh() 加了h就是橫向的條形圖,不用設(shè)置orientation

plt.bar(left=0,bottom=index,width=y,color='red',height=0.5,orientation='horizontal')

plt.show()

6.直方圖

m1=100

sigma=20

x=m1+sigma*np.random.randn(2000)

plt.hist(x,bins=50,color="green",normed=True)

plt.show()

# #雙變量的直方圖# #顏色越深頻率越高# #研究雙變量的聯(lián)合分布

#雙變量的直方圖#顏色越深頻率越高#研究雙變量的聯(lián)合分布

x=np.random.rand(1000)+2

y=np.random.rand(1000)+3

plt.hist2d(x,y,bins=40)

plt.show()

7.餅狀圖

#設(shè)置x,y軸比例為1:1,從而達(dá)到一個正的圓

#labels標(biāo)簽參數(shù),x是對應(yīng)的數(shù)據(jù)列表,autopct顯示每一個區(qū)域占的比例,explode突出顯示某一塊,shadow陰影

labes=['A','B','C','D']

fracs=[15,30,45,10]

explode=[0,0.1,0.05,0]#設(shè)置x,y軸比例為1:1,從而達(dá)到一個正的圓

plt.axes(aspect=1)#labels標(biāo)簽參數(shù),x是對應(yīng)的數(shù)據(jù)列表,autopct顯示每一個區(qū)域占的比例,explode突出顯示某一塊,shadow陰影

plt.pie(x=fracs,labels=labes,autopct="%.0f%%",explode=explode,shadow=True)

plt.show()

8.箱型圖

import matplotlib.pyplot as pltimport numpy as npdata=np.random.normal(loc=0,scale=1,size=1000)#sym 點(diǎn)的形狀,whis虛線的長度plt.boxplot(data,sym="o",whis=1.5)plt.show()

#sym 點(diǎn)的形狀,whis虛線的長度

python可視化數(shù)據(jù)分析常用圖大集合(收藏)

python數(shù)據(jù)分析常用圖大集合:包含折線圖、直方圖、垂直條形圖、水平條形圖、餅圖、箱線圖、熱力圖、散點(diǎn)圖、蜘蛛圖、二元變量分布、面積圖、六邊形圖等12種常用可視化數(shù)據(jù)分析圖,后期還會不斷的收集整理,請關(guān)注更新!

以下默認(rèn)所有的操作都先導(dǎo)入了numpy、pandas、matplotlib、seaborn

一、折線圖

折線圖可以用來表示數(shù)據(jù)隨著時間變化的趨勢

Matplotlib

plt.plot(x,?y)

plt.show()

Seaborn

df?=?pd.DataFrame({'x':?x,?'y':?y})

sns.lineplot(x="x",?y="y",?data=df)

plt.show()

二、直方圖

直方圖是比較常見的視圖,它是把橫坐標(biāo)等分成了一定數(shù)量的小區(qū)間,然后在每個小區(qū)間內(nèi)用矩形條(bars)展示該區(qū)間的數(shù)值

Matplotlib

Seaborn

三、垂直條形圖

條形圖可以幫我們查看類別的特征。在條形圖中,長條形的長度表示類別的頻數(shù),寬度表示類別。

Matplotlib

Seaborn

1plt.show()

四、水平條形圖

五、餅圖

六、箱線圖

箱線圖由五個數(shù)值點(diǎn)組成:最大值 (max)、最小值 (min)、中位數(shù) (median) 和上下四分位數(shù) (Q3, Q1)。

可以幫我們分析出數(shù)據(jù)的差異性、離散程度和異常值等。

Matplotlib

Seaborn

七、熱力圖

力圖,英文叫 heat map,是一種矩陣表示方法,其中矩陣中的元素值用顏色來代表,不同的顏色代表不同大小的值。通過顏色就能直觀地知道某個位置上數(shù)值的大小。

通過 seaborn 的 heatmap 函數(shù),我們可以觀察到不同年份,不同月份的乘客數(shù)量變化情況,其中顏色越淺的代表乘客數(shù)量越多

八、散點(diǎn)圖

散點(diǎn)圖的英文叫做 scatter plot,它將兩個變量的值顯示在二維坐標(biāo)中,非常適合展示兩個變量之間的關(guān)系。

Matplotlib

Seaborn

九、蜘蛛圖

蜘蛛圖是一種顯示一對多關(guān)系的方法,使一個變量相對于另一個變量的顯著性是清晰可見

十、二元變量分布

二元變量分布可以看兩個變量之間的關(guān)系

十一、面積圖

面積圖又稱區(qū)域圖,強(qiáng)調(diào)數(shù)量隨時間而變化的程度,也可用于引起人們對總值趨勢的注意。

堆積面積圖還可以顯示部分與整體的關(guān)系。折線圖和面積圖都可以用來幫助我們對趨勢進(jìn)行分析,當(dāng)數(shù)據(jù)集有合計(jì)關(guān)系或者你想要展示局部與整體關(guān)系的時候,使用面積圖為更好的選擇。

十二、六邊形圖

六邊形圖將空間中的點(diǎn)聚合成六邊形,然后根據(jù)六邊形內(nèi)部的值為這些六邊形上色。

原文至:

Python 數(shù)據(jù)可視化:數(shù)據(jù)分布統(tǒng)計(jì)圖和熱圖

本課將繼續(xù)介紹 Seaborn 中的統(tǒng)計(jì)圖。一定要牢記,Seaborn 是對 Matplotlib 的高級封裝,它優(yōu)化了很多古老的做圖過程,因此才會看到一個函數(shù)解決問題的局面。

在統(tǒng)計(jì)學(xué)中,研究數(shù)據(jù)的分布情況,也是一個重要的工作,比如某些數(shù)據(jù)是否為正態(tài)分布——某些機(jī)器學(xué)習(xí)模型很在意數(shù)據(jù)的分布情況。

在 Matplotlib 中,可以通過繪制直方圖將數(shù)據(jù)的分布情況可視化。在 Seaborn 中,也提供了繪制直方圖的函數(shù)。

輸出結(jié)果:

sns.distplot 函數(shù)即實(shí)現(xiàn)了直方圖,還順帶把曲線畫出來了——曲線其實(shí)代表了 KDE。

除了 sns.distplot 之外,在 Seaborn 中還有另外一個常用的繪制數(shù)據(jù)分布的函數(shù) sns.kdeplot,它們的使用方法類似。

首先看這樣一個示例。

輸出結(jié)果:

① 的作用是設(shè)置所得圖示的背景顏色,這樣做的目的是讓下面的 ② 繪制的圖像顯示更清晰,如果不設(shè)置 ①,在顯示的圖示中看到的就是白底圖像,有的部分看不出來。

② 最終得到的是坐標(biāo)網(wǎng)格,而且在圖中分為三部分,如下圖所示。

相對于以往的坐標(biāo)網(wǎng)格,多出了 B 和 C 兩個部分。也就是說,不僅可以在 A 部分繪制某種統(tǒng)計(jì)圖,在 B 和 C 部分也可以繪制。

繼續(xù)操作:

輸出結(jié)果:

語句 ③ 實(shí)現(xiàn)了在坐標(biāo)網(wǎng)格中繪制統(tǒng)計(jì)圖的效果,jp.plot 方法以兩個繪圖函數(shù)為參數(shù),分別在 A 部分繪制了回歸統(tǒng)計(jì)圖,在 B 和 C 部分繪制了直方圖,而且直方圖分別表示了對應(yīng)坐標(biāo)軸數(shù)據(jù)的分布,即:

我們把有語句 ② 和 ③ 共同實(shí)現(xiàn)的統(tǒng)計(jì)圖,稱為聯(lián)合統(tǒng)計(jì)圖。除了用 ② ③ 兩句可以繪制這種圖之外,還有一個函數(shù)也能夠“兩步并作一步”,具體如下:

輸出結(jié)果:

統(tǒng)計(jì)學(xué)入門級:常見概率分布+python繪制分布圖

如果隨機(jī)變量X的所有取值都可以逐個列舉出來,則稱X為離散型隨機(jī)變量。相應(yīng)的概率分布有二項(xiàng)分布,泊松分布。

如果隨機(jī)變量X的所有取值無法逐個列舉出來,而是取數(shù)軸上某一區(qū)間內(nèi)的任一點(diǎn),則稱X為連續(xù)型隨機(jī)變量。相應(yīng)的概率分布有正態(tài)分布,均勻分布,指數(shù)分布,伽馬分布,偏態(tài)分布,卡方分布,beta分布等。(真多分布,好恐怖~~)

在離散型隨機(jī)變量X的一切可能值中,各可能值與其對應(yīng)概率的乘積之和稱為該隨機(jī)變量X的期望值,記作E(X) 。比如有隨機(jī)變量,取值依次為:2,2,2,4,5。求其平均值:(2+2+2+4+5)/5 = 3。

期望值也就是該隨機(jī)變量總體的均值。 推導(dǎo)過程如下:

= (2+2+2+4+5)/5

= 1/5 2 3 + 4/5 + 5/5

= 3/5 2 + 1/5 4 + 1/5 5

= 0.6 2 + 0.2 4 + 0.2 5

= 60% 2 + 20% 4 + 20%*5

= 1.2 + 0.8 + 1

= 3

倒數(shù)第三步可以解釋為值為2的數(shù)字出現(xiàn)的概率為60%,4的概率為20%,5的概率為20%。 所以E(X) = 60% 2 + 20% 4 + 20%*5 = μ = 3。

0-1分布(兩點(diǎn)分布),它的隨機(jī)變量的取值為1或0。即離散型隨機(jī)變量X的概率分布為:P{X=0} = 1-p, P{X=1} = p,即:

則稱隨機(jī)變量X服從參數(shù)為p的0-1分布,記作X~B(1,p)。

在生活中有很多例子服從兩點(diǎn)分布,比如投資是否中標(biāo),新生嬰兒是男孩還是女孩,檢查產(chǎn)品是否合格等等。

大家非常熟悉的拋硬幣試驗(yàn)對應(yīng)的分布就是二項(xiàng)分布。拋硬幣試驗(yàn)要么出現(xiàn)正面,要么就是反面,只包含這兩個結(jié)果。出現(xiàn)正面的次數(shù)是一個隨機(jī)變量,這種隨機(jī)變量所服從的概率分布通常稱為 二項(xiàng)分布 。

像拋硬幣這類試驗(yàn)所具有的共同性質(zhì)總結(jié)如下:(以拋硬幣為例)

通常稱具有上述特征的n次重復(fù)獨(dú)立試驗(yàn)為n重伯努利試驗(yàn)。簡稱伯努利試驗(yàn)或伯努利試驗(yàn)概型。特別地,當(dāng)試驗(yàn)次數(shù)為1時,二項(xiàng)分布服從0-1分布(兩點(diǎn)分布)。

舉個栗子:拋3次均勻的硬幣,求結(jié)果出現(xiàn)有2個正面的概率 。

已知p = 0.5 (出現(xiàn)正面的概率) ,n = 3 ,k = 2

所以拋3次均勻的硬幣,求結(jié)果出現(xiàn)有2個正面的概率為3/8。

二項(xiàng)分布的期望值和方差 分別為:

泊松分布是用來描述在一 指定時間范圍內(nèi)或在指定的面積或體積之內(nèi)某一事件出現(xiàn)的次數(shù)的分布 。生活中服從泊松分布的例子比如有每天房產(chǎn)中介接待的客戶數(shù),某微博每月出現(xiàn)服務(wù)器癱瘓的次數(shù)等等。 泊松分布的公式為 :

其中 λ 為給定的時間間隔內(nèi)事件的平均數(shù),λ = np。e為一個數(shù)學(xué)常數(shù),一個無限不循環(huán)小數(shù),其值約為2.71828。

泊松分布的期望值和方差 分別為:

使用Python繪制泊松分布的概率分布圖:

因?yàn)檫B續(xù)型隨機(jī)變量可以取某一區(qū)間或整個實(shí)數(shù)軸上的任意一個值,所以通常用一個函數(shù)f(x)來表示連續(xù)型隨機(jī)變量,而f(x)就稱為 概率密度函數(shù) 。

概率密度函數(shù)f(x)具有如下性質(zhì) :

需要注意的是,f(x)不是一個概率,即f(x) ≠ P(X = x) 。在連續(xù)分布的情況下,隨機(jī)變量X在a與b之間的概率可以寫成:

正態(tài)分布(或高斯分布)是連續(xù)型隨機(jī)變量的最重要也是最常見的分布,比如學(xué)生的考試成績就呈現(xiàn)出正態(tài)分布的特征,大部分成績集中在某個范圍(比如60-80分),很小一部分往兩端傾斜(比如50分以下和90多分以上)。還有人的身高等等。

正態(tài)分布的定義 :

如果隨機(jī)變量X的概率密度為( -∞x+∞):

則稱X服從正態(tài)分布,記作X~N(μ,σ2)。其中-∞μ+∞,σ0, μ為隨機(jī)變量X的均值,σ為隨機(jī)變量X的標(biāo)準(zhǔn)差。 正態(tài)分布的分布函數(shù)

正態(tài)分布的圖形特點(diǎn) :

使用Python繪制正態(tài)分布的概率分布圖:

正態(tài)分布有一個3σ準(zhǔn)則,即數(shù)值分布在(μ-σ,μ+σ)中的概率為0.6827,分布在(μ-2σ,μ+2σ)中的概率為0.9545,分布在(μ-3σ,μ+3σ)中的概率為0.9973,也就是說大部分?jǐn)?shù)值是分布在(μ-3σ,μ+3σ)區(qū)間內(nèi),超出這個范圍的可能性很小很小,僅占不到0.3%,屬于極個別的小概率事件,所以3σ準(zhǔn)則可以用來檢測異常值。

當(dāng)μ=0,σ=1時,有

此時的正態(tài)分布N(0,1) 稱為標(biāo)準(zhǔn)正態(tài)分布。因?yàn)棣?,σ都是確定的取值,所以其對應(yīng)的概率密度曲線是一條 形態(tài)固定 的曲線。

對標(biāo)準(zhǔn)正態(tài)分布,通常用φ(x)表示概率密度函數(shù),用Φ(x)表示分布函數(shù):

假設(shè)有一次物理考試特別難,滿分100分,全班只有大概20個人及格。與此同時語文考試很簡單,全班絕大部分都考了90分以上。小明的物理和語文分別考了60分和80分,他回家后告訴家長,這時家長能僅僅從兩科科目的分值直接判斷出這次小明的語文成績要比物理好很多嗎?如果不能,應(yīng)該如何判斷呢?此時Z-score就派上用場了。 Z-Score的計(jì)算定義 :

即 將隨機(jī)變量X先減去總體樣本均值,再除以總體樣本標(biāo)準(zhǔn)差就得到標(biāo)準(zhǔn)分?jǐn)?shù)啦。如果X低于平均值,則Z為負(fù)數(shù),反之為正數(shù) 。通過計(jì)算標(biāo)準(zhǔn)分?jǐn)?shù),可以將任何一個一般的正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布。

小明家長從老師那得知物理的全班平均成績?yōu)?0分,標(biāo)準(zhǔn)差為10,而語文的平均成績?yōu)?2分,標(biāo)準(zhǔn)差為4。分別計(jì)算兩科成績的標(biāo)準(zhǔn)分?jǐn)?shù):

物理:標(biāo)準(zhǔn)分?jǐn)?shù) = (60-40)/10 = 2

語文:標(biāo)準(zhǔn)分?jǐn)?shù) = (85-95)/4 = -2.5

從計(jì)算結(jié)果來看,說明這次考試小明的物理成績在全部同學(xué)中算是考得很不錯的,而語文考得很差。

指數(shù)分布可能容易和前面的泊松分布混淆,泊松分布強(qiáng)調(diào)的是某段時間內(nèi)隨機(jī)事件發(fā)生的次數(shù)的概率分布,而指數(shù)分布說的是 隨機(jī)事件發(fā)生的時間間隔 的概率分布。比如一班地鐵進(jìn)站的間隔時間。如果隨機(jī)變量X的概率密度為:

則稱X服從指數(shù)分布,其中的參數(shù)λ0。 對應(yīng)的分布函數(shù) 為:

均勻分布的期望值和方差 分別為:

使用Python繪制指數(shù)分布的概率分布圖:

均勻分布有兩種,分為 離散型均勻分布和連續(xù)型均勻分布 。其中離散型均勻分布最常見的例子就是拋擲骰子啦。拋擲骰子出現(xiàn)的點(diǎn)數(shù)就是一個離散型隨機(jī)變量,點(diǎn)數(shù)可能有1,2,3,4,5,6。每個數(shù)出現(xiàn)的概率都是1/6。

設(shè)連續(xù)型隨機(jī)變量X具有概率密度函數(shù):

則稱X服從區(qū)間(a,b)上的均勻分布。X在等長度的子區(qū)間內(nèi)取值的概率相同。對應(yīng)的分布函數(shù)為:

f(x)和F(x)的圖形分別如下圖所示:

均勻分布的期望值和方差 分別為:


網(wǎng)頁標(biāo)題:python分布圖形函數(shù),python分布圖怎么做
當(dāng)前網(wǎng)址:http://weahome.cn/article/dsesghj.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部