這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)?lái)有關(guān)如何使用4個(gè)樣本畫(huà)出ROC曲線,文章內(nèi)容豐富且以專(zhuān)業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
創(chuàng)新互聯(lián)公司從2013年開(kāi)始,是專(zhuān)業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項(xiàng)目成都網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站網(wǎng)站策劃,項(xiàng)目實(shí)施與項(xiàng)目整合能力。我們以讓每一個(gè)夢(mèng)想脫穎而出為使命,1280元易縣做網(wǎng)站,已為上家服務(wù),為易縣各地企業(yè)和個(gè)人服務(wù),聯(lián)系電話:18982081108
ROC 曲線,作為評(píng)價(jià)機(jī)器學(xué)習(xí)模型敏感度的一條重要曲線,在分類(lèi)任務(wù)評(píng)價(jià)機(jī)制中應(yīng)用較多。
但是很多朋友對(duì)于 ROC 曲線的理解還是有些模糊,心想著 x 軸是 FPR
, y 軸是 TPR
, 組條曲線有些神秘。
今天,咱們用 4 個(gè)樣本,使用邏輯回歸,分類(lèi)閾值分別從 0.,0.2,0.4,0.6,0.8,1.0,依次變化,分別求出對(duì)應(yīng)分類(lèi)閾值的 FRP 和 TPR 值。
這樣不就得到 6 個(gè) (FRP,TPR) 點(diǎn),組個(gè)曲線,不就是 ROC 曲線嗎!
# 有監(jiān)督任務(wù),四個(gè)樣本的實(shí)際值:
target = np.array([1,0,1,0])
計(jì)算公式:
def TPR(TP,FN):
return TP / (TP + FN)
def FPR(FP,TN):
return FP / (FP + TN)
使用邏輯回歸 Logistic regression,得到 4 個(gè)樣本的概率分布為:[0.8,0.6,0.4,0.2]
當(dāng)分類(lèi)閾值參數(shù) alpha 為 0.0 時(shí):
y0 = np.array([1,1,1,1])
p00 = [TPR(2,0),FPR(2,0)]
p00
結(jié)果:
[1.0, 1.0]
當(dāng)分類(lèi)閾值參數(shù) alpha 為 0.2 時(shí):
# 同理,假如分類(lèi)閾值 alpha = 0.2
#
y02 = np.array([1,1,1,1])
p02 = [TPR(2,0),FPR(2,0)]
p02
結(jié)果:
[1.0, 1.0]
當(dāng)分類(lèi)閾值參數(shù) alpha 為 0.4 時(shí):
target = np.array([1,0,1,0])
y04 = np.array([1,1,1,0])
p04 = [TPR(2,0),FPR(1,1)]
p04
結(jié)果:
[1.0, 0.5]
當(dāng)分類(lèi)閾值參數(shù) alpha 為 0.6 時(shí):
# 同理,假如分類(lèi)閾值 alpha = 0.6
#
target = np.array([1,0,1,0])
y06 = np.array([1,1,0,0])
p06 = [TPR(1,1),FPR(1,1)]
p06
結(jié)果:
[0.5, 0.5]
當(dāng)分類(lèi)閾值參數(shù) alpha 為 0.8 時(shí):
# 同理,假如分類(lèi)閾值 alpha = 0.8
#
target = np.array([1,0,1,0])
y08 = np.array([1,0,0,0])
p08 = [TPR(1,1),FPR(0,2)]
p08
結(jié)果:
[0.5, 0.0]
當(dāng)分類(lèi)閾值參數(shù) alpha 為 1.0 時(shí):
# 同理,假如分類(lèi)閾值 alpha = 1.0
#
target = np.array([1,0,1,0])
y10 = np.array([0,0,0,0])
p10 = [TPR(0,2),FPR(0,2)]
p10
結(jié)果:
[0.0, 0.0]
繪制以上 6 個(gè)點(diǎn),得到 ROC 曲線:
npxy = np.array(xy)
fpr = npxy[:,1]
tpr = npxy[:,0]
plt.scatter(fpr,tpr)
plt.plot(fpr,tpr)
plt.grid()
alphas = [0.0,0.2,0.4,0.6,0.8,1.0]
for alpha,x,y in zip(alphas,fpr,tpr):
plt.annotate("alpha=%s" % (alpha,), xy=(x,y), xytext=(-20, 10), textcoords='offset points')
上述就是小編為大家分享的如何使用4個(gè)樣本畫(huà)出ROC曲線了,如果剛好有類(lèi)似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。