本文實例講述了Python pandas RFM模型應用。分享給大家供大家參考,具體如下:
成都創(chuàng)新互聯(lián)公司是一家集網(wǎng)站建設(shè),滎經(jīng)企業(yè)網(wǎng)站建設(shè),滎經(jīng)品牌網(wǎng)站建設(shè),網(wǎng)站定制,滎經(jīng)網(wǎng)站建設(shè)報價,網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,滎經(jīng)網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力。可充分滿足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。什么是RFM模型根據(jù)美國數(shù)據(jù)庫營銷研究所Arthur Hughes的研究,客戶數(shù)據(jù)庫中有3個神奇的要素,這3個要素構(gòu)成了數(shù)據(jù)分析最好的指標:
RFM模型的應用是有前提假設(shè)的,即R、F、M值越大價值越大,客戶未來的為企業(yè)帶來的價值越大。這個前提假
設(shè)其實已經(jīng)經(jīng)過大量的研究和實證,假設(shè)是成立的。不過為了更加嚴謹,確保RFM模型對于特殊案例是有效的,
本文還進行了前提假設(shè)驗證:
ps:Frequency、Monetary均為近6個月內(nèi)的數(shù)據(jù),即1-6月數(shù)據(jù);
利用相關(guān)性檢驗,驗證假設(shè):
簡單的做法,RFM三個指標以均值來劃分,高于均值的為高價值、低于均值的為低價值,如此可以將客戶劃分為8大類:
本文采取的方法是將三個指標進行標準化,然后按照分為數(shù)劃分為5個等級,數(shù)值越大代表價值越高;當然最終劃分的規(guī)則還是要結(jié)合業(yè)務(wù)來定。劃分為5個等級后,客戶可以細分為125種。
#讀取數(shù)據(jù) rfm<-read.csv('~/desktop/rfm1_7.csv',header=TRUE) summary(rfm) #數(shù)據(jù)分布 par(mfrow=c(1,3)) boxplot(rfm$rankR1) boxplot(rfm$rankF1) boxplot(rfm$rankM1) #rfm分級 breaks1<-quantile(rfm$Recency, probs = seq(0, 1, 0.2),names = FALSE) breaks1<-c(1,14,30,57,111,181) #以流失用戶的定義來設(shè)置分級 30天以上為流失用戶 breaks2<-quantile(rfm$Frequency, probs = seq(0, 1, 0.2),names = FALSE) breaks2<-c(1,2,3,6,14,164) breaks3<-quantile(rfm$Monetary, probs = seq(0, 1, 0.2),names = FALSE) rfm$rankR1<- cut(rfm$Recency,breaks1, 5,labels=F) rfm$rankR1<- 6-rfm$rankR1 rfm$rankF1<- cut(rfm$Frequency,breaks2, 5,labels=F) rfm$rankM1<- cut(rfm$Monetary,breaks3, 5,labels=F)