真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

如何在Python中使用Yellowbrick實(shí)現(xiàn)可視化-創(chuàng)新互聯(lián)

如何在Python中使用Yellowbrick實(shí)現(xiàn)可視化?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。

目前創(chuàng)新互聯(lián)已為1000多家的企業(yè)提供了網(wǎng)站建設(shè)、域名、虛擬主機(jī)、成都網(wǎng)站托管、企業(yè)網(wǎng)站設(shè)計(jì)、柏鄉(xiāng)網(wǎng)站維護(hù)等服務(wù),公司將堅(jiān)持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。

Yellowbrick主要包含的組件如下:

Visualizers
Visualizers也是estimators(從數(shù)據(jù)中習(xí)得的對象),其主要任務(wù)是產(chǎn)生可對模型選擇過程有更深入了解的視圖。從Scikit-Learn來看,當(dāng)可視化數(shù)據(jù)空間或者封裝一個模型estimator時,其和轉(zhuǎn)換器(transformers)相似,就像"ModelCV" (比如 RidgeCV, LassoCV )的工作原理一樣。Yellowbrick的主要目標(biāo)是創(chuàng)建一個和Scikit-Learn類似的有意義的API。其中最受歡迎的visualizers包括:
 
特征可視化
Rank Features: 對單個或者兩兩對應(yīng)的特征進(jìn)行排序以檢測其相關(guān)性
Parallel Coordinates: 對實(shí)例進(jìn)行水平視圖
Radial Visualization: 在一個圓形視圖中將實(shí)例分隔開
PCA Projection: 通過主成分將實(shí)例投射
Feature Importances: 基于它們在模型中的表現(xiàn)對特征進(jìn)行排序
Scatter and Joint Plots: 用選擇的特征對其進(jìn)行可視化
分類可視化
Class Balance: 看類的分布怎樣影響模型
Classification Report: 用視圖的方式呈現(xiàn)精確率,召回率和F1值
ROC/AUC Curves: 特征曲線和ROC曲線子下的面積
Confusion Matrices: 對分類決定進(jìn)行視圖描述
回歸可視化
Prediction Error Plot: 沿著目標(biāo)區(qū)域?qū)δP瓦M(jìn)行細(xì)分
Residuals Plot: 顯示訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)中殘差的差異
Alpha Selection: 顯示不同alpha值選擇對正則化的影響
聚類可視化
K-Elbow Plot: 用肘部法則或者其他指標(biāo)選擇k值
Silhouette Plot: 通過對輪廓系數(shù)值進(jìn)行視圖來選擇k值
文本可視化
Term Frequency: 對詞項(xiàng)在語料庫中的分布頻率進(jìn)行可視化
t-SNE Corpus Visualization: 用隨機(jī)鄰域嵌入來投射文檔

這里以癌癥數(shù)據(jù)集為例繪制ROC曲線,如下:

def testFunc1(savepath='Results/breast_cancer_ROCAUC.png'):
 '''
 基于癌癥數(shù)據(jù)集的測試
 '''
 data=load_breast_cancer()
 X,y=data['data'],data['target']
 X_train, X_test, y_train, y_test = train_test_split(X, y)
 viz=ROCAUC(LogisticRegression())
 viz.fit(X_train, y_train)
 viz.score(X_test, y_test)
 viz.poof(outpath=savepath)

結(jié)果如下:

如何在Python中使用Yellowbrick實(shí)現(xiàn)可視化

結(jié)果看起來也是挺美觀的。

之后用平行坐標(biāo)的方法對高維數(shù)據(jù)進(jìn)行作圖,數(shù)據(jù)集同上:

def testFunc2(savepath='Results/breast_cancer_ParallelCoordinates.png'):
 '''
 用平行坐標(biāo)的方法對高維數(shù)據(jù)進(jìn)行作圖
 '''
 data=load_breast_cancer()
 X,y=data['data'],data['target']
 print 'X_shape: ',X.shape #X_shape: (569L, 30L)
 visualizer=ParallelCoordinates()
 visualizer.fit_transform(X,y)
 visualizer.poof(outpath=savepath)

結(jié)果如下:

如何在Python中使用Yellowbrick實(shí)現(xiàn)可視化

這個最初沒有看明白什么意思,其實(shí)就是高維特征數(shù)據(jù)的可視化分析,這個功能還可以對原始數(shù)據(jù)進(jìn)行采樣,之后再繪圖。

基于癌癥數(shù)據(jù)集,使用邏輯回歸模型來分類,繪制分類報告

def testFunc3(savepath='Results/breast_cancer_LR_report.png'):
 '''
 基于癌癥數(shù)據(jù)集,使用邏輯回歸模型來分類,繪制分類報告
 '''
 data=load_breast_cancer()
 X,y=data['data'],data['target']
 model=LogisticRegression()
 visualizer=ClassificationReport(model)
 X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3,random_state=42)
 visualizer.fit(X_train,y_train)
 visualizer.score(X_test,y_test)
 visualizer.poof(outpath=savepath)

結(jié)果如下:


如何在Python中使用Yellowbrick實(shí)現(xiàn)可視化

這樣的結(jié)果展現(xiàn)方式還是比較美觀的,在使用的時候發(fā)現(xiàn)了這個模塊的一個不足的地方,就是:如果連續(xù)繪制兩幅圖片的話,第一幅圖片就會累加到第二幅圖片中去,多幅圖片繪制亦是如此,在matplotlib中可以使用plt.clf()方法來清除上一幅圖片,這里沒有找到對應(yīng)的API,希望有找到的朋友告知一下。

接下來基于共享單車數(shù)據(jù)集進(jìn)行租借預(yù)測,具體如下:

首先基于特征對相似度分析方法來分析共享單車數(shù)據(jù)集中兩兩特征之間的相似度

def testFunc5(savepath='Results/bikeshare_Rank2D.png'):
 '''
 共享單車數(shù)據(jù)集預(yù)測
 '''
 data=pd.read_csv('bikeshare/bikeshare.csv')
 X=data[["season", "month", "hour", "holiday", "weekday", "workingday",
   "weather", "temp", "feelslike", "humidity", "windspeed"
   ]]
 y=data["riders"]
 visualizer=Rank2D(algorithm="pearson")
 visualizer.fit_transform(X)
 visualizer.poof(outpath=savepath)

如何在Python中使用Yellowbrick實(shí)現(xiàn)可視化

基于線性回歸模型實(shí)現(xiàn)預(yù)測分析

def testFunc7(savepath='Results/bikeshare_LinearRegression_ResidualsPlot.png'):
 '''
 基于共享單車數(shù)據(jù)使用線性回歸模型預(yù)測
 '''
 data = pd.read_csv('bikeshare/bikeshare.csv')
 X=data[["season", "month", "hour", "holiday", "weekday", "workingday",
   "weather", "temp", "feelslike", "humidity", "windspeed"]]
 y=data["riders"]
 X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3)
 visualizer=ResidualsPlot(LinearRegression())
 visualizer.fit(X_train, y_train)
 visualizer.score(X_test, y_test)
 visualizer.poof(outpath=savepath)

結(jié)果如下:

如何在Python中使用Yellowbrick實(shí)現(xiàn)可視化

基于共享單車數(shù)據(jù)使用AlphaSelection

def testFunc8(savepath='Results/bikeshare_RidgeCV_AlphaSelection.png'):
 '''
 基于共享單車數(shù)據(jù)使用AlphaSelection
 '''
 data=pd.read_csv('bikeshare/bikeshare.csv')
 X=data[["season", "month", "hour", "holiday", "weekday", "workingday",
   "weather", "temp", "feelslike", "humidity", "windspeed"]]
 y=data["riders"]
 alphas=np.logspace(-10, 1, 200)
 visualizer=AlphaSelection(RidgeCV(alphas=alphas))
 visualizer.fit(X, y)
 visualizer.poof(outpath=savepath)

結(jié)果如下:

如何在Python中使用Yellowbrick實(shí)現(xiàn)可視化

基于共享單車數(shù)據(jù)繪制預(yù)測錯誤圖

def testFunc9(savepath='Results/bikeshare_Ridge_PredictionError.png'):
 '''
 基于共享單車數(shù)據(jù)繪制預(yù)測錯誤圖
 '''
 data=pd.read_csv('bikeshare/bikeshare.csv')
 X=data[["season", "month", "hour", "holiday", "weekday", "workingday",
   "weather", "temp", "feelslike", "humidity", "windspeed"]]
 y=data["riders"]
 X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3)
 visualizer=PredictionError(Ridge(alpha=3.181))
 visualizer.fit(X_train, y_train)
 visualizer.score(X_test, y_test)
 visualizer.poof(outpath=savepath)
blog.csdn.net/Together_CZ/article/details/86640784

結(jié)果如下:

如何在Python中使用Yellowbrick實(shí)現(xiàn)可視化

看完上述內(nèi)容是否對您有幫助呢?如果還想對相關(guān)知識有進(jìn)一步的了解或閱讀更多相關(guān)文章,請關(guān)注創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計(jì)公司行業(yè)資訊頻道,感謝您對創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計(jì)公司的支持。

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、網(wǎng)站設(shè)計(jì)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。


文章標(biāo)題:如何在Python中使用Yellowbrick實(shí)現(xiàn)可視化-創(chuàng)新互聯(lián)
文章來源:http://weahome.cn/article/cssops.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部