這篇文章主要講解了用python進(jìn)行時(shí)間序列分析的方法,內(nèi)容清晰明了,對(duì)此有興趣的小伙伴可以學(xué)習(xí)一下,相信大家閱讀完之后會(huì)有幫助。
創(chuàng)新互聯(lián)公司是一家網(wǎng)站設(shè)計(jì)公司,集創(chuàng)意、互聯(lián)網(wǎng)應(yīng)用、軟件技術(shù)為一體的創(chuàng)意網(wǎng)站建設(shè)服務(wù)商,主營(yíng)產(chǎn)品:響應(yīng)式網(wǎng)站設(shè)計(jì)、成都品牌網(wǎng)站建設(shè)、成都全網(wǎng)營(yíng)銷推廣。我們專注企業(yè)品牌在網(wǎng)站中的整體樹立,網(wǎng)絡(luò)互動(dòng)的體驗(yàn),以及在手機(jī)等移動(dòng)端的優(yōu)質(zhì)呈現(xiàn)。成都網(wǎng)站建設(shè)、網(wǎng)站建設(shè)、移動(dòng)互聯(lián)產(chǎn)品、網(wǎng)絡(luò)運(yùn)營(yíng)、VI設(shè)計(jì)、云產(chǎn)品.運(yùn)維為核心業(yè)務(wù)。為用戶提供一站式解決方案,我們深知市場(chǎng)的競(jìng)爭(zhēng)激烈,認(rèn)真對(duì)待每位客戶,為客戶提供賞析悅目的作品,網(wǎng)站的價(jià)值服務(wù)。什么是時(shí)間序列
時(shí)間序列簡(jiǎn)單的說就是各時(shí)間點(diǎn)上形成的數(shù)值序列,時(shí)間序列分析就是通過觀察歷史數(shù)據(jù)預(yù)測(cè)未來的值。在這里需要強(qiáng)調(diào)一點(diǎn)的是,時(shí)間序列分析并不是關(guān)于時(shí)間的回歸,它主要是研究自身的變化規(guī)律的(這里不考慮含外生變量的時(shí)間序列)。
為什么用python
用兩個(gè)字總結(jié)“情懷”,愛屋及烏,個(gè)人比較喜歡python,就用python擼了。能做時(shí)間序列的軟件很多,SAS、R、SPSS、Eviews甚至matlab等等,實(shí)際工作中應(yīng)用得比較多的應(yīng)該還是SAS和R,前者推薦王燕寫的《應(yīng)用時(shí)間序列分析》,后者推薦“基于R語(yǔ)言的時(shí)間序列建模完整教程”這篇博文(翻譯版)。python作為科學(xué)計(jì)算的利器,當(dāng)然也有相關(guān)分析的包:statsmodels中tsa模塊,當(dāng)然這個(gè)包和SAS、R是比不了,但是python有另一個(gè)神器:pandas!pandas在時(shí)間序列上的應(yīng)用,能簡(jiǎn)化我們很多的工作。
環(huán)境配置
python推薦直接裝Anaconda,它集成了許多科學(xué)計(jì)算包,有一些包自己手動(dòng)去裝還是挺費(fèi)勁的。statsmodels需要自己去安裝,這里我推薦使用0.6的穩(wěn)定版,0.7及其以上的版本能在github上找到,該版本在安裝時(shí)會(huì)用C編譯好,所以修改底層的一些代碼將不會(huì)起作用。
時(shí)間序列分析
1.基本模型
自回歸移動(dòng)平均模型(ARMA(p,q))是時(shí)間序列中最為重要的模型之一,它主要由兩部分組成: AR代表p階自回歸過程,MA代表q階移動(dòng)平均過程,其公式如下:
依據(jù)模型的形式、特性及自相關(guān)和偏自相關(guān)函數(shù)的特征,總結(jié)如下:
在時(shí)間序列中,ARIMA模型是在ARMA模型的基礎(chǔ)上多了差分的操作。
2.pandas時(shí)間序列操作
大熊貓真的很可愛,這里簡(jiǎn)單介紹一下它在時(shí)間序列上的可愛之處。和許多時(shí)間序列分析一樣,本文同樣使用航空乘客數(shù)據(jù)(AirPassengers.csv)作為樣例。
數(shù)據(jù)讀?。?/p>
# -*- coding:utf-8 -*- import numpy as np import pandas as pdfrom datetime import datetimeimport matplotlib.pylab as plt # 讀取數(shù)據(jù),pd.read_csv默認(rèn)生成DataFrame對(duì)象,需將其轉(zhuǎn)換成Series對(duì)象df = pd.read_csv('AirPassengers.csv', encoding='utf-8', index_col='date')df.index = pd.to_datetime(df.index) # 將字符串索引轉(zhuǎn)換成時(shí)間索引ts = df['x'] # 生成pd.Series對(duì)象# 查看數(shù)據(jù)格式ts.head()ts.head().index