真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

IV基礎(chǔ)概念是什么

本篇內(nèi)容介紹了“IV基礎(chǔ)概念是什么”的有關(guān)知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!

10年積累的網(wǎng)站設(shè)計、成都做網(wǎng)站經(jīng)驗,可以快速應(yīng)對客戶對網(wǎng)站的新想法和需求。提供各種問題對應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認(rèn)識你,你也不認(rèn)識我。但先制作網(wǎng)站后付款的網(wǎng)站建設(shè)流程,更有中原免費(fèi)網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。

IV:
<0.03:無預(yù)測能力
0.03-0.09:弱
0.1-0.29:中等
0.3-0.49:高

0.5:極高
但是IV不是越高越好的,當(dāng)IV>1.2時候,可能分箱不好或者存在因果倒置關(guān)系

from numpy import log
from pandas import DataFrame as df
import  pandas as pd

def createDateset():
   dataSet=[
           [0, 1, 0],
           [0, 0, 0],
           [0, 1, 0],
           [1, 0, 1],
           [1, 0, 0],
           [1, 1, 1],
           [0, 1, 1],
           [1, 1, 1],
           [1, 0, 1],
           [1, 0, 1]]
   return dataSet

def calcWOE(dataset,col,targe):
   subdata=df(dataset.groupby(col)[col].count())
   suby=df(dataset.groupby(col)[targe].sum())
   data=df(pd.merge(subdata,suby,how="left",left_index=True,right_index=True))
   b_total=data[targe].sum()
   total=data[col].sum()
   g_total=total-b_total
   data["bad"]=data.apply(lambda x:round(x[targe]/b_total,3),axis=1)
   data["good"]=data.apply(lambda x:round((x[col]-x[targe])/g_total,3),axis=1)
   data["WOE"]=data.apply(lambda x:log(x.bad/x.good),axis=1)
   return data.loc[:,["bad","good","WOE"]]


def calcIV(dataset):
   dataset["IV"]=dataset.apply(lambda x:(x.bad-x.good)*x.WOE,axis=1)
   IV=sum(dataset["IV"])
   return IV


if __name__ == '__main__':
   data=createDateset()
   print(data)
   data=df(data,columns=["x1","x2","y"])
   print(data)
   data_WOE=calcWOE(data,"x2","y")
   print(data_WOE)
   data_IV=calcIV(data_WOE)
   print(data_IV)

IV的極端情況以及處理方式

IV依賴WOE,并且IV是一個很好的衡量自變量對目標(biāo)變量影響程度的指標(biāo)。但是,使用過程中應(yīng)該注意一個問題:變量的任何分組中,不應(yīng)該出現(xiàn)響應(yīng)數(shù)=0或非響應(yīng)數(shù)=0的情況。

原因很簡單,當(dāng)變量一個分組中,響應(yīng)數(shù)=0時,

此時對應(yīng)的IVi為+∞。

而當(dāng)變量一個分組中,沒有響應(yīng)的數(shù)量 = 0時,

此時的IVi為+∞。

IVi無論等于負(fù)無窮還是正無窮,都是沒有意義的。

由上述問題我們可以看到,使用IV其實有一個缺點(diǎn),就是不能自動處理變量的分組中出現(xiàn)響應(yīng)比例為0或100%的情況。那么,遇到響應(yīng)比例為0或者100%的情況,我們應(yīng)該怎么做呢?建議如下:

(1)如果可能,直接把這個分組做成一個規(guī)則,作為模型的前置條件或補(bǔ)充條件;

(2)重新對變量進(jìn)行離散化或分組,使每個分組的響應(yīng)比例都不為0且不為100%,尤其是當(dāng)一個分組個體數(shù)很小時(比如小于100個),強(qiáng)烈建議這樣做,因為本身把一個分組個體數(shù)弄得很小就不是太合理。

(3)如果上面兩種方法都無法使用,建議人工把該分組的響應(yīng)數(shù)和非響應(yīng)的數(shù)量進(jìn)行一定的調(diào)整。如果響應(yīng)數(shù)原本為0,可以人工調(diào)整響應(yīng)數(shù)為1,如果非響應(yīng)數(shù)原本為0,可以人工調(diào)整非響應(yīng)數(shù)為1.

“IV基礎(chǔ)概念是什么”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!


當(dāng)前文章:IV基礎(chǔ)概念是什么
標(biāo)題來源:http://weahome.cn/article/pcjees.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部