這篇文章將為大家詳細(xì)講解有關(guān)怎么用Python為直方圖繪制擬合曲線,小編覺得挺實(shí)用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
目前創(chuàng)新互聯(lián)公司已為千余家的企業(yè)提供了網(wǎng)站建設(shè)、域名、虛擬主機(jī)、網(wǎng)站托管維護(hù)、企業(yè)網(wǎng)站設(shè)計、紅河哈尼網(wǎng)站維護(hù)等服務(wù),公司將堅持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。python的五大特點(diǎn):1.簡單易學(xué),開發(fā)程序時,專注的是解決問題,而不是搞明白語言本身。2.面向?qū)ο?,與其他主要的語言如C++和Java相比, Python以一種非常強(qiáng)大又簡單的方式實(shí)現(xiàn)面向?qū)ο缶幊獭?.可移植性,Python程序無需修改就可以在各種平臺上運(yùn)行。4.解釋性,Python語言寫的程序不需要編譯成二進(jìn)制代碼,可以直接從源代碼運(yùn)行程序。5.開源,Python是 FLOSS(自由/開放源碼軟件)之一。
直方圖是用于展示數(shù)據(jù)的分組分布狀態(tài)的一種圖形,用矩形的寬度和高度表示頻數(shù)分布,通過直方圖,用戶可以很直觀的看出數(shù)據(jù)分布的形狀、中心位置以及數(shù)據(jù)的離散程度等。
在python中一般采用matplotlib庫的hist來繪制直方圖,至于如何給直方圖添加擬合曲線(密度函數(shù)曲線),一般來說有以下兩種方法。
方法一:采用matplotlib中的mlab模塊
mlab模塊是Python中強(qiáng)大的3D作圖工具,立體感效果極佳。在這里使用mlab可以跳出直方圖二維平面圖形的限制,在此基礎(chǔ)上再添加一條曲線。在這里,我們以鳶尾花iris中的數(shù)據(jù)為例,來舉例說明。
import numpy as np import matplotlib.mlab as mlab import matplotlib.pyplot as plt import pandas # Load dataset url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data" names = ['sepal-length', 'sepal-width','petal-length', 'petal-width', 'class'] dataset = pandas.read_csv(url, names=names) print(dataset.head(10)) # descriptions print(dataset.describe()) x = dataset.iloc[:,0] #提取第一列的sepal-length變量 mu =np.mean(x) #計算均值 sigma =np.std(x) mu,sigma
以上為通過python導(dǎo)入鳶尾花iris數(shù)據(jù),然后提取第一列的sepal-length變量為研究對象,計算出其均值、標(biāo)準(zhǔn)差,接下來就繪制帶擬合曲線的直方圖。
num_bins = 30 #直方圖柱子的數(shù)量 n, bins, patches = plt.hist(x, num_bins,normed=1, facecolor='blue', alpha=0.5) #直方圖函數(shù),x為x軸的值,normed=1表示為概率密度,即和為一,綠色方塊,色深參數(shù)0.5.返回n個概率,直方塊左邊線的x值,及各個方塊對象 y = mlab.normpdf(bins, mu, sigma)#擬合一條最佳正態(tài)分布曲線y plt.plot(bins, y, 'r--') #繪制y的曲線 plt.xlabel('sepal-length') #繪制x軸 plt.ylabel('Probability') #繪制y軸 plt.title(r'Histogram : $\mu=5.8433$,$\sigma=0.8253$')#中文標(biāo)題 u'xxx' plt.subplots_adjust(left=0.15)#左邊距 plt.show()
以上命令主要采用mlab.normpdf基于直方圖的柱子數(shù)量、均值、方差來擬合曲線,然后再用plot畫出來,這種方法的一個缺點(diǎn)就是畫出的正態(tài)分布擬合曲線(紅色虛線)并不一定能很好反映數(shù)據(jù)的分布情況,如上圖所示。
方法二:采用seaborn庫中的distplot繪制
Seaborn其實(shí)是在matplotlib的基礎(chǔ)上進(jìn)行了更高級的API封裝,從而使得作圖更加容易,在大多數(shù)情況下使用seaborn就能做出很具有吸引力的圖,而使用matplotlib就能制作具有更多特色的圖。應(yīng)該把Seaborn視為matplotlib的補(bǔ)充,而不是替代物。
import seaborn as sns sns.set_palette("hls") #設(shè)置所有圖的顏色,使用hls色彩空間 sns.distplot(x,color="r",bins=30,kde=True) plt.show()
在這里主要使用sns.distplot(增強(qiáng)版dist),柱子數(shù)量bins也設(shè)置為30,kde=True表示是否顯示擬合曲線,如果為False則只出現(xiàn)直方圖。
在這里注意一下它與前邊mlab.normpdf方法不同的是,擬合曲線不是正態(tài)的,而是更好地擬合了數(shù)據(jù)的分布情況,如上圖,因此比mlab.normpdf更為準(zhǔn)確。
進(jìn)一步設(shè)置sns.distplot,可以采用kde_kws(擬合曲線的設(shè)置)、hist_kws(直方柱子的設(shè)置),可以得到:
import seaborn as sns import matplotlib as mpl sns.set_palette("hls") mpl.rc("figure", figsize=(6,4)) sns.distplot(x,bins=30,kde_kws={"color":"seagreen", "lw":3 }, hist_kws={ "color": "b" }) plt.show()
其中,lw為曲線粗細(xì)程度。
關(guān)于“怎么用Python為直方圖繪制擬合曲線”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學(xué)到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。