這篇文章給大家分享的是有關(guān)怎么用Matplotlib進行數(shù)據(jù)可視化的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
創(chuàng)新互聯(lián)是專業(yè)的寶雞網(wǎng)站建設(shè)公司,寶雞接單;提供網(wǎng)站設(shè)計制作、成都網(wǎng)站建設(shè),網(wǎng)頁設(shè)計,網(wǎng)站設(shè)計,建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進行寶雞網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團隊,希望更多企業(yè)前來合作!
01 導(dǎo)入Matplotlib
如果你安裝了完整的Python Anaconda,那么你已經(jīng)安裝了Matplotlib,可以開始了。否則,你可能要訪問官網(wǎng)獲取安裝說明。
http://matplotlib.org
就像我們用縮寫np來表示NumPy一樣,我們也會用一些標(biāo)準(zhǔn)的縮寫來表示Matplotlib導(dǎo)入:
import matplotlib as mpl
import matplotlib.pyplot as plt
plt是我們最常用的一個接口。
02 生成一個簡單的圖形
言歸正傳,讓我們創(chuàng)建第一個圖形。
假設(shè)我們要繪制正弦函數(shù)sin(x)的一個簡單線圖。我們希望函數(shù)求x軸(0≤x≤10)上的所有值。我們將使用NumPy的linspace函數(shù)在x軸上創(chuàng)建一個線性空間,x值從0到10,共100個樣本點:
import numpy as np
x = np.linspace(0, 10, 100)
我們可以使用NumPy的sin函數(shù)求sin函數(shù)的所有x值,并通過調(diào)用plt的plot函數(shù)可視化結(jié)果:
plt.plot(x, np.sin(x))
你親自試過了嗎?發(fā)生什么了?有什么發(fā)現(xiàn)嗎?
問題是,這取決于你在何處運行這個腳本,你可能什么都看不到。以下是可以考慮的可能性:
1. 從.py腳本繪圖
如果你正從一個腳本運行matplotlib,那么你只需要調(diào)用plt,如下所示:
plt.show()
調(diào)用后,圖形就會顯示出來!
2. 從IPython shell繪圖
這實際上是以交互方式運行matplotlib的最便捷的方式之一。要顯示繪圖,你需要在啟動IPython之后,調(diào)用%matplotlib魔術(shù)命令:
%matplotlib Using matplotlib backend: Qt5Agg
import matplotlib.pyplot as plt
然后,所有圖都會自動顯示出來,不必每次都調(diào)用plt.show()。
3. 從Jupyter Notebook繪圖
如果你從基于瀏覽器的Jupyter Notebook上查看這段代碼,你需要使用同樣的%matplotlib魔術(shù)命令??墒牵氵€可以選擇將圖形直接嵌入notebook中,這有兩種可能的結(jié)果:
%matplotlib notebook將生成的交互式圖嵌入notebook中。
%matplotlib inline將生成的靜態(tài)圖嵌入notebook中。
我們通常會選擇內(nèi)聯(lián)選項:
%matplotlib inline
現(xiàn)在,讓我們再試一次:
plt.plot(x, np.sin(x))
上述命令給出的輸出如圖2-4所示。
▲圖2-4 應(yīng)用內(nèi)聯(lián)選項生成的圖
稍后,如果你想保存圖表,可以直接從IPython或Jupyter Notebook的選項中保存:
plt.savefig('figures/02.03-sine.png')
只要保證使用所支持的文件后綴即可,例如.jpg、.png、.tif、.svg、.eps或者.pdf。
在導(dǎo)入matplotlib之后,運行plt.style.use(style_name),你可以更改繪圖的樣式。在plt.style.available中列出了所有可用的樣式。例如,試試plt.style.use('fivethirtyeight')、plt.style.use('ggplot')或者plt.style.use('seaborn-dark')。為了增加樂趣,可以運行plt.xkcd(),再嘗試?yán)L制其他內(nèi)容。
03 可視化外部數(shù)據(jù)集的數(shù)據(jù)
作為本文的最后一個測試,讓我們可視化一些來自外部數(shù)據(jù)集的數(shù)據(jù),例如scikit-learn的digits數(shù)據(jù)集。
具體來說,我們將需要3個可視化工具:
用于實際數(shù)據(jù)的scikit-learn
用于數(shù)據(jù)處理的NumPy
Matplotlib
首先,讓我們導(dǎo)入所有這些可視化工具:
import numpy as np from sklearn import datasets import matplotlib.pyplot as plt %matplotlib inline
第一步是實際加載數(shù)據(jù):
digits = datasets.load_digits()
如果我們沒有記錯的話,digits應(yīng)該有2個不同的字段:一個是data字段,包含實際的圖像數(shù)據(jù);另一個是target字段,包含圖像標(biāo)簽。
與其相信我們的記憶,不如讓我們研究一下digits對象。這通過輸入字段名稱、添加句點、再按下Tab鍵—digits.
print(digits.data.shape) print(digits.images.shape)
輸出結(jié)果:
(1797, 64) (1797, 8, 8)
在這兩個例子中,第一維都對應(yīng)于數(shù)據(jù)集中的圖像數(shù)。但是data將所有像素排列在一個大的向量中,而images則保留了每個圖像的8×8空間排列。
因此,如果我們想繪制單張圖像,images字段可能更合適。首先,使用NumPy的數(shù)組切割,從數(shù)據(jù)集中抓取一張圖像:
img = digits.images[0, :, :]
這里,我們說想要抓取長為1797項的數(shù)組中的第一行,以及所有對應(yīng)的8×8=64個像素。然后,我們可以使用plt的imshow函數(shù)繪制圖像:
plt.imshow(img, cmap='gray') plt.savefig('figures/02.04-digit0.png')
上述命令給出的輸出如圖2-5所示。請注意,圖像是模糊的,因為我們將該圖像調(diào)整到了更大的尺寸。原始圖像的大小只有8×8。
▲圖2-5 生成單張圖像的示例結(jié)果
此外,我們還可以使用cmap參數(shù)指定一個彩圖。在默認情況下,Matplotlib使用MATLAB的默認彩圖jet??墒牵瑢τ诨叶葓D像,gray彩圖更有意義。
最后,我們可以利用plt的subplot函數(shù)繪制一組數(shù)字樣本。subplot函數(shù)與在MATLAB中一樣,我們指定行數(shù)、列數(shù)以及當(dāng)前子圖的索引(從1開始)。我們將使用一個for循環(huán)遍歷數(shù)據(jù)集中的前10個圖像,每個圖像都有自己的子圖:
plt.figure(figsize=(14, 4)) for image_index in range(10): # images are 0-indexed, subplots are 1-indexed subplot_index = image_index + 1 plt.subplot(2, 5, subplot_index) plt.imshow(digits.images[image_index, :, :], cmap='gray')
生成的輸出如圖2-6所示。
▲圖2-6 生成包含10個數(shù)字的一組子圖
感謝各位的閱讀!關(guān)于“怎么用Matplotlib進行數(shù)據(jù)可視化”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!