每個(gè)企業(yè)都有許多的數(shù)據(jù),但能否將數(shù)據(jù)轉(zhuǎn)化成商業(yè)價(jià)值,是企業(yè)非常關(guān)心的問題。阿里巴巴曾自嘲是一家坐在數(shù)據(jù)的金礦上啃著饅頭的企業(yè),前幾年集團(tuán)積累了很多的數(shù)據(jù),但這些數(shù)據(jù)并沒有真正應(yīng)用起來,受限于幾個(gè)原因,比如大數(shù)據(jù)的技術(shù)框架還不成熟,運(yùn)營團(tuán)隊(duì)對數(shù)據(jù)應(yīng)用的意識(shí)還不是很強(qiáng),但今天,數(shù)據(jù)在阿里巴巴的應(yīng)用范圍已經(jīng)越來越廣泛。
本文根據(jù)2018年云棲大會(huì)杭州站移動(dòng)研發(fā)平臺(tái)EMAS專場上,阿里巴巴資深技術(shù)專家元綽的演講整理成文,介紹面向移動(dòng)互聯(lián)網(wǎng)時(shí)代的智能運(yùn)營體系搭建,主要分成三塊內(nèi)容:第一,智能運(yùn)營的使命和典型應(yīng)用場景;第二,個(gè)性化推薦系統(tǒng)的架構(gòu);第三,AB在智能運(yùn)營系統(tǒng)中的應(yīng)用。
一、智能運(yùn)營的使命和典型應(yīng)用場景
衡量一個(gè)智能運(yùn)營系統(tǒng)做得好不好,目標(biāo)非常明確,就是看能不能幫企業(yè)實(shí)現(xiàn)數(shù)據(jù)的增長,因?yàn)樵鲩L是企業(yè)最核心的訴求。
要實(shí)現(xiàn)企業(yè)智能運(yùn)營,首先要進(jìn)行數(shù)據(jù)運(yùn)營閉環(huán)的建設(shè)。傳統(tǒng)的BI,收集數(shù)據(jù),給老板產(chǎn)出報(bào)表,讓老板做決策,但智能運(yùn)營系統(tǒng),最重要的是把數(shù)據(jù)應(yīng)用到實(shí)際業(yè)務(wù)場景中,形成數(shù)據(jù)閉環(huán)。收集數(shù)據(jù),通過模型的訓(xùn)練轉(zhuǎn)換成系統(tǒng)的預(yù)測能力,運(yùn)用到實(shí)際業(yè)務(wù)場景中,最后把用戶的使用數(shù)據(jù)反饋給我們的系統(tǒng)。經(jīng)過幾輪迭代,整個(gè)系統(tǒng)的預(yù)測能力會(huì)越來越強(qiáng)。
企業(yè)希望提升業(yè)務(wù)結(jié)果,業(yè)務(wù)結(jié)果的提升依賴于平臺(tái)上的用戶對我們的認(rèn)可。EMAS的業(yè)務(wù)統(tǒng)計(jì)模塊可以承擔(dān)數(shù)據(jù)采集的工作,了解了用戶的行為,機(jī)器智能的作用就在于將用戶的行為數(shù)據(jù)轉(zhuǎn)換為企業(yè)的運(yùn)營行動(dòng)。
具體的流程可以分成這么幾個(gè)部分:首先基于原始數(shù)據(jù),以新客為例,根據(jù)用戶對冷啟動(dòng)階段的熱門數(shù)據(jù)的點(diǎn)擊情況,對用戶進(jìn)行第一次打標(biāo),我們大體識(shí)別該用戶屬于什么樣的類型;其次,我們做嘗試性推送,比如資訊或者產(chǎn)品,用戶根據(jù)我所推送的資訊或者產(chǎn)品,會(huì)有相應(yīng)的點(diǎn)擊行為,經(jīng)過幾次交互,機(jī)器對該用戶的理解會(huì)加深。最后,經(jīng)過用戶跟平臺(tái)的多次互動(dòng)后,企業(yè)配合相應(yīng)的運(yùn)營策略,比如促銷,轉(zhuǎn)化效果就會(huì)有比較明顯的提升,這是智能運(yùn)營系統(tǒng)的基本流程。
我們對用戶的全生命周期理解,是從新客到老客以及老客幫你做傳播這一整個(gè)階段,時(shí)間周期還是比較長的。針對一個(gè)新用戶,你直接把希望他下單的信息推送給他,效果往往不會(huì)特別好。所以必須要對用戶整個(gè)生命階段做一些細(xì)致的分析。
智能運(yùn)營的三個(gè)典型的應(yīng)用場景:
第一,千人千面。淘系在PC時(shí)代也做過推薦相關(guān)的工作,但效果不好。但到了無線時(shí)代之后,個(gè)性化推薦的效果就提升明顯,源于用戶行為發(fā)生了很大的變化。無目的性,碎片化,隨時(shí)隨地。我們能否將用戶給我們的碎花片時(shí)間充分利用好,讓我們的消費(fèi)者一下子對我們的產(chǎn)品感興趣,需要企業(yè)對用戶要有非常深的理解和洞察。
第二,精準(zhǔn)營銷。營銷活動(dòng)前,分析所面向的人群,具體的定價(jià)策略,以及在這樣的定價(jià)策略下的銷量預(yù)測,這樣企業(yè)就可以預(yù)先知道KPI的完成情況。
第三,智能選品。前面講的更多的是,產(chǎn)品如何更多與用戶進(jìn)行互動(dòng),智能選品適用的場景是我們對目標(biāo)客群有認(rèn)知,希望觸達(dá)我們原來沒有觸達(dá)到的那批用戶。超市希望吸引年輕人,就需要調(diào)整貨品結(jié)構(gòu),把年輕用戶吸引回來。盒馬、淘寶心選,是阿里做的比較好的案例。
二、個(gè)性化推薦系統(tǒng)架構(gòu)
接下來,給大家介紹一下個(gè)性化推薦系統(tǒng)。個(gè)性化推薦在阿里巴巴集團(tuán)這幾年有很多的沉淀。以手機(jī)淘寶首頁為例,很多地方都做了個(gè)性化,比如入口圖,每個(gè)APP都有子頻道,子頻道的入口圖大部分用的是設(shè)計(jì)師做的靜態(tài)圖,如果用子頻道的數(shù)據(jù)跟用戶做個(gè)性化匹配,做千人千面的入口圖,入口點(diǎn)擊的轉(zhuǎn)化會(huì)有很大的提升。
好的個(gè)性化推薦需要有哪些注意點(diǎn):
第一,工程實(shí)現(xiàn)。個(gè)性化推薦,傳統(tǒng)的實(shí)現(xiàn)方法,是截止某一個(gè)時(shí)間點(diǎn)給用戶計(jì)算一個(gè)推薦列表,每天把這個(gè)數(shù)據(jù)刷新一遍。這樣做的問題是什么?用戶的數(shù)據(jù)量一直在增長,相應(yīng)的存儲(chǔ)成本也會(huì)隨之增長,企業(yè)投入成本會(huì)很大。所以系統(tǒng)設(shè)計(jì)的時(shí)候需要考慮借助標(biāo)簽的能力。另外,每個(gè)人對標(biāo)簽對應(yīng)的貨品排序應(yīng)該不一樣,我們要增加二次排序,要保證每一個(gè)人的推薦列表雖然貨品一樣,但是順序有差異。
第二,實(shí)時(shí)推薦。離線推薦主要是基于歷史數(shù)據(jù),實(shí)時(shí)推薦是基于當(dāng)天的數(shù)據(jù),當(dāng)天給用戶做推薦,轉(zhuǎn)化率往往最高。但是對我們的挑戰(zhàn)是什么?第一,必須有實(shí)時(shí)計(jì)算的能力,因?yàn)橛脩艚o我們的時(shí)間非常少,如果你延遲五分鐘,基本上用戶就流失了。第二,從算法角度來講,必須要做一個(gè)平衡,你是基于歷史推薦數(shù)據(jù),還是當(dāng)天的實(shí)時(shí)數(shù)據(jù),到底哪個(gè)轉(zhuǎn)換率最高,要做一個(gè)平衡。
第三,時(shí)間和空間。拿電商來說,羽絨服或者衣服都有季節(jié)屬性,羽絨服適合冬天穿,電子產(chǎn)品有新老款,判斷一個(gè)用戶從來都只買新款,你就應(yīng)該把新款推薦給他。另外,推送有時(shí)間衰減效應(yīng),不能一直推相同的貨品。時(shí)間和空間是必須考慮的兩個(gè)維度。
第四,發(fā)現(xiàn)性。大家在做個(gè)性化推薦的時(shí)候,模型基本上都是以一個(gè)具體的目標(biāo)來做優(yōu)化,但這里會(huì)有一個(gè)什么問題呢?會(huì)產(chǎn)生很嚴(yán)重的馬太效應(yīng):第一,我的推薦依賴于我的歷史數(shù)據(jù)。為什么給你推衣服?是因?yàn)槟憷鲜强匆路P团袛嗤埔路霓D(zhuǎn)化肯定是最高的,我推薦了,然后你又點(diǎn)了,這樣又產(chǎn)生了一條歷史數(shù)據(jù),我發(fā)現(xiàn)效果確實(shí)很好,那模型下次推什么?肯定還是給你推衣服。但實(shí)際上每個(gè)人的興趣愛好很廣泛,我給你推的品類越來越窄,最后發(fā)現(xiàn)你的行為也越來越窄,這跟人的實(shí)際特征是不匹配。我們要在推薦系統(tǒng)里擴(kuò)展品類的寬度。第二,推什么樣的產(chǎn)品轉(zhuǎn)化率最高?肯定是爆款,不管是金融行業(yè)還是其他的行業(yè),爆款轉(zhuǎn)化率最高,模型判斷推爆款的轉(zhuǎn)化比一般產(chǎn)品的轉(zhuǎn)化要更高,導(dǎo)致什么結(jié)果?系統(tǒng)推薦的產(chǎn)品范圍也越來越窄,這是很嚴(yán)重的問題。就是說給用戶推薦的品類越來越窄,產(chǎn)品范圍越來越窄。所以在整個(gè)模型過程中,去嘗試推薦一些他可能原來歷史記錄里面不存在的東西,去做一些嘗試性的發(fā)現(xiàn),這是非常有意義的,否則對短期收益有好處,但是對長期收益有影響。所以轉(zhuǎn)化率很重要,但是發(fā)現(xiàn)性更重要,品類拓寬會(huì)讓你的業(yè)務(wù)體量越來越大,產(chǎn)品也一樣,爆款之后肯定有新品,新品也需要變成爆款。
第五,臟數(shù)據(jù)。臟數(shù)據(jù)一般分兩類,第一類是無效數(shù)據(jù),比如說“雙十一”,因?yàn)楫?dāng)天他們的行為非常特殊。“雙十一”當(dāng)天買了你平時(shí)可能不會(huì)買的東西。這樣的數(shù)據(jù)對日常推薦并沒有太大的幫助,這些數(shù)據(jù)必須要剔掉。第二類數(shù)據(jù)是作弊數(shù)據(jù)。像刷信用、刷積分的數(shù)據(jù)量往往很大,這樣的數(shù)據(jù)如果不剔除掉,最終預(yù)測的結(jié)果和你原來的真實(shí)值之間的偏差會(huì)非常大。
http://weahome.cn/article/djogjd.html