對于未來不確定的事物,大家都習(xí)慣于用以往經(jīng)驗來預(yù)測。而在這個快速發(fā)展的時代,依靠經(jīng)驗來預(yù)測到底準(zhǔn)不準(zhǔn)呢?
預(yù)測就是常說的預(yù)先推測和測定,它的目的不是為預(yù)測而預(yù)測,而是用來指導(dǎo)人類的各項行為決策,以免人在決策時因為對未來的不確定而產(chǎn)生擔(dān)憂。很多人對預(yù)測多采用根據(jù)經(jīng)驗推測,這種方法雖然簡單方便,但缺乏理論依據(jù),而且具有主觀性。最終結(jié)果是導(dǎo)致預(yù)測反映的是個人意愿,而非現(xiàn)實情況。
阿溫那什?考??耍ˋvinash Kaushik)是數(shù)字營銷與分析方面的專家,他曾在博文《奧卡姆剃刀》中寫道:“你我對消費者的需求做預(yù)測,有80%的時候都是錯的?!?/p>
遺憾的是,那些對統(tǒng)計基準(zhǔn)預(yù)測進(jìn)行人為操控的人卻感覺通過使用自己的判斷能夠提升預(yù)測的準(zhǔn)確率。通過研究發(fā)現(xiàn),當(dāng)預(yù)測人員提高預(yù)測值時,他們幾乎都是錯誤的,因為他們過于樂觀,反而導(dǎo)致預(yù)測的準(zhǔn)確率更低。相反,當(dāng)預(yù)測人員降低預(yù)測值時,由于更為保守,所以往往反而能提高預(yù)測準(zhǔn)確率。總的來說,影響預(yù)測結(jié)果上升或下降的細(xì)微變化對預(yù)測準(zhǔn)確度幾乎沒有影響,這種行為純粹是浪費時間。那么怎樣用科學(xué)方法進(jìn)行預(yù)測呢?
我們可以基于數(shù)據(jù)和分析,利用業(yè)務(wù)知識對未來進(jìn)行預(yù)測。隨著計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,大數(shù)據(jù)技術(shù)深入到各行各業(yè)。從海量數(shù)據(jù)中挖掘具有潛在價值的關(guān)系、趨勢和模式,構(gòu)建預(yù)測模型、做出預(yù)測分析是必然趨勢。通過數(shù)據(jù)實現(xiàn)預(yù)測可以幫助企業(yè)發(fā)現(xiàn)市場機會,做出科學(xué)的經(jīng)營決策。
科學(xué)的預(yù)測離不開數(shù)據(jù),數(shù)據(jù)離不開預(yù)測方法,目前的預(yù)測方法大致分為如下類:
定性預(yù)測法
主要依賴于人的主觀判斷。當(dāng)可供參考的歷史數(shù)據(jù)很少時,采用定性預(yù)測方法最合適。
時間序列預(yù)測法
運用歷史數(shù)據(jù)對未來進(jìn)行預(yù)測,它尤其適用于每年基本模式變化不大的場景。
因果關(guān)系預(yù)測法
假定需求預(yù)測與某些因素相關(guān),因果關(guān)系預(yù)測法可以找到這些因素與需求的關(guān)聯(lián)性,通過預(yù)測這些外界因素的變化來預(yù)測未來。
仿真法
模擬模型允許預(yù)測人員對預(yù)測的條件作一定程度的假設(shè)。
科學(xué)的預(yù)測需經(jīng)歷確定需求—獲取數(shù)據(jù)—分析數(shù)據(jù)—建立模型—預(yù)測未來—支持決策。
先要確定預(yù)測的對象、目標(biāo)和范圍,這里的范圍包括地理范圍和時間范圍。收集所需的數(shù)據(jù),對數(shù)據(jù)進(jìn)行預(yù)處理,同時分析數(shù)據(jù)的周期性、季節(jié)性、趨勢性和隨機性。選擇預(yù)測方法建立模型,同時要確認(rèn)模型對預(yù)測是否有效。根據(jù)前面的數(shù)據(jù)信息和預(yù)測模型對預(yù)測對象做出合理的預(yù)測。通過預(yù)測結(jié)果,可為即將到來的事物制定決策,以完成預(yù)測的目標(biāo)。
接下來舉一個簡單的例子,假如要求你對公司某款產(chǎn)品未來幾個月銷售量等進(jìn)行預(yù)測,且這些被預(yù)測變量具有增長趨勢,公司可能會根據(jù)你的預(yù)測結(jié)果,進(jìn)行戰(zhàn)略調(diào)整和布局,那么如何進(jìn)行預(yù)測呢?可以使用時間序列預(yù)測。
示例數(shù)據(jù)如下:
對銷售數(shù)據(jù)進(jìn)行探索分析,商品每月銷售量的分布圖:
商品在各省銷售量的分布圖:
商品型號在各省銷售量的分布圖:
利用Python獲得數(shù)據(jù)的基本信息如下:
從上面可知數(shù)據(jù)量為218618條,沒有缺失值,因此不需要進(jìn)行缺失值處理。接下來,需要統(tǒng)計每月產(chǎn)品的銷售量,然后選擇時間序列的方法進(jìn)行預(yù)測,在進(jìn)行時間序列分析前需分析數(shù)據(jù)的穩(wěn)定性,將不穩(wěn)定的數(shù)據(jù)利用差分的方法進(jìn)行穩(wěn)定處理,同時將數(shù)據(jù)分解,以分析數(shù)據(jù)的周期性、季節(jié)性、趨勢性和隨機性,具體細(xì)節(jié)這里不再贅述。本文選擇的是基于python 的SARIMAX的方法。SARIMAX是以差分整合移動平均自回歸模型(ARIMA)為基礎(chǔ)在添加Seasonal季節(jié)性、周期性和eXogenous外部因素。生成的模型概況如下:
利用模型預(yù)測未來幾個月的結(jié)果圖如下:
結(jié)束語
在當(dāng)前的數(shù)字經(jīng)濟時代,自以為是必定失敗。利用數(shù)據(jù)結(jié)合業(yè)務(wù)知識,使用經(jīng)過驗證的分析,而不是靠純粹的直覺判斷。運用科學(xué)的方法,分析和預(yù)見其發(fā)展趨勢,掌握市場變化的規(guī)律,提高管理的科學(xué)水平,減少決策的盲目性,減少未來的不確定性,降低決策可能遇到的風(fēng)險,由此決策目標(biāo)才能得以順利實現(xiàn)。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。