這篇文章主要介紹“機(jī)器學(xué)習(xí)中測(cè)試時(shí)間序列的問(wèn)題有哪些”,在日常操作中,相信很多人在機(jī)器學(xué)習(xí)中測(cè)試時(shí)間序列的問(wèn)題有哪些問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”機(jī)器學(xué)習(xí)中測(cè)試時(shí)間序列的問(wèn)題有哪些”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來(lái)自于我們對(duì)這個(gè)行業(yè)的熱愛(ài)。我們立志把好的技術(shù)通過(guò)有效、簡(jiǎn)單的方式提供給客戶,將通過(guò)不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長(zhǎng)期合作伙伴,公司提供的服務(wù)項(xiàng)目有:域名申請(qǐng)、雅安服務(wù)器托管、營(yíng)銷軟件、網(wǎng)站建設(shè)、敖漢網(wǎng)站維護(hù)、網(wǎng)站推廣。
下面是分布得分,它們將幫助你評(píng)估你的表現(xiàn)。
300多人參加了技能測(cè)試,獲得的最高分?jǐn)?shù)為38分。以下是一些關(guān)于分布的統(tǒng)計(jì)數(shù)據(jù)。
平均分:17.13
中位數(shù):19
眾數(shù):19
估計(jì)未來(lái)6個(gè)月酒店客房預(yù)訂數(shù)量。
估計(jì)保險(xiǎn)公司未來(lái)三年的總銷售額。
估計(jì)下一周的通話次數(shù)。
A) 只有 3 B) 1 和 2 C) 2 和 3 D) 1 和 3 E) 1,2 和 3
解決方案:(E)
以上所有選項(xiàng)都與時(shí)間序列有關(guān)。
A) 樸素法
B) 指數(shù)平滑
C) 移動(dòng)平均
D) 以上都不是
解決方案:(D)
樸素法:一種估計(jì)技術(shù),在這種技術(shù)中,最后一個(gè)時(shí)期的實(shí)際情況被用作這一時(shí)期的預(yù)測(cè),而不加以調(diào)整或試圖確定因果因素,適用于比較穩(wěn)定的序列。它僅用于與更復(fù)雜的技術(shù)生成的預(yù)測(cè)進(jìn)行比較。
在指數(shù)平滑中,舊數(shù)據(jù)的相對(duì)重要性逐漸降低,而新數(shù)據(jù)的相對(duì)重要性逐漸提高。
在時(shí)間序列分析中,移動(dòng)平均(MA)模型是一種常用的單變量時(shí)間序列建模方法。移動(dòng)平均模型指定輸出變量線性依賴于隨機(jī)項(xiàng)(不完全可預(yù)測(cè))的當(dāng)前值和各種過(guò)去值。
A) 季節(jié)性
B) 趨勢(shì)
C) 周期性
D) 噪聲
E) 以上都不是
解決方案:(E)
當(dāng)一系列因素受到季節(jié)因素(例如,一年中的一個(gè)季度、一個(gè)月或一周中的一天)的影響時(shí),就存在一種季節(jié)模式。季節(jié)性總是一個(gè)固定且已知的時(shí)期。因此,季節(jié)性時(shí)間序列有時(shí)被稱為周期性時(shí)間序列
季節(jié)總是一個(gè)固定且已知的時(shí)期。當(dāng)數(shù)據(jù)呈現(xiàn)非固定周期的漲跌時(shí),它就存在一種循環(huán)模式。
趨勢(shì)被定義為時(shí)間序列中跟日歷無(wú)關(guān)且無(wú)規(guī)律影響的“長(zhǎng)期”運(yùn)動(dòng),是底層的反映。它是人口增長(zhǎng)、物價(jià)上漲和一般經(jīng)濟(jì)變化等影響的結(jié)果。下圖描繪了一個(gè)隨時(shí)間有明顯上升趨勢(shì)的系列。
噪聲:在離散時(shí)間內(nèi),白噪聲是一種離散信號(hào),其樣本被視為一系列均值為零、方差有限的不相關(guān)隨機(jī)變量。
因此,上述所有內(nèi)容都是時(shí)間序列的組成部分。
A) 季節(jié)性
B) 周期性
C) 季節(jié)性和周期性沒(méi)有區(qū)別
解決方案:(A)
正如我們?cè)谇懊娴慕庵兴吹降?,由于季?jié)性呈現(xiàn)平穩(wěn)的結(jié)構(gòu),所以更容易估計(jì)。
A)真 B)假
解決方案: (B)
上面的圖中以固定的時(shí)間間隔重復(fù)出現(xiàn)差不多的趨勢(shì),因此實(shí)際上只是季節(jié)性的。
A)真 B)假
解決方案:(B)
隨著觀測(cè)值之間的時(shí)間間隔變短,它們往往與時(shí)間強(qiáng)相關(guān)。因?yàn)闀r(shí)間序列預(yù)測(cè)是基于以前的觀察數(shù)據(jù)而不是當(dāng)前的觀察數(shù)據(jù),不像分類或回歸那樣數(shù)據(jù)與數(shù)據(jù)之間關(guān)聯(lián)性不高。
A) 真
B) 假
解決方案:(A)
將較大的權(quán)重應(yīng)用于較新的觀測(cè)結(jié)果中,比應(yīng)用到歷史數(shù)據(jù)的觀測(cè)結(jié)果中更為明智。這正是簡(jiǎn)單指數(shù)平滑背后的概念。預(yù)測(cè)是使用加權(quán)平均值計(jì)算的,加權(quán)平均值隨著過(guò)去觀測(cè)值的增加呈指數(shù)遞減——最小的權(quán)重將與最早的觀測(cè)值相關(guān)。
A)<1 B)1 C)> 1 D)以上都不是
解決方案: (B)
表7.1顯示了使用簡(jiǎn)單指數(shù)平滑法進(jìn)行預(yù)測(cè)時(shí),對(duì)四個(gè)不同α值的觀測(cè)值的權(quán)重。請(qǐng)注意,對(duì)于任何合理的樣本量,即使對(duì)于較小的α,權(quán)重的總和也將約為1。
A) 63.8 B) 65 C) 62 D) 66
解決方案:(D) Yt-1 = 70 St-1 = 60 Alpha = 0.4
代入,得:
0.4 * 60 + 0.6 * 70 = 24 + 42 = 66
A) 不同時(shí)間觀測(cè)到的不同序列上多個(gè)點(diǎn)之間的線性相關(guān)性
B) 不同時(shí)間觀測(cè)到的同一序列上兩點(diǎn)之間的二次相關(guān)性
C) 同時(shí)觀測(cè)到的不同序列兩點(diǎn)之間的線性關(guān)系
D) 在不同時(shí)間觀測(cè)到的同一序列上兩點(diǎn)之間的線性關(guān)系
解決方案:(D)
選項(xiàng)D是自協(xié)方差的定義。
A) 平均值是恒定的,不依賴于時(shí)間
B) 自協(xié)方差函數(shù)僅通過(guò)其差|s-t|依賴于s和t(其中t和s為時(shí)刻)
C) 所考慮的時(shí)間序列是一個(gè)有限方差過(guò)程
D) 時(shí)間序列是高斯的
解決方案:(D)
高斯時(shí)間序列意味著平穩(wěn)性是嚴(yán)平穩(wěn)性。
A) 最近鄰回歸
B) 局部加權(quán)散點(diǎn)圖平滑
C) 基于樹的模型,如(CART)
D) 平滑樣條曲線
解決方案:(C)
時(shí)間序列平滑和濾波可以用局部回歸模型來(lái)表示。多項(xiàng)式和回歸樣條也提供了平滑的重要技術(shù)?;贑ART的模型不提供要疊加在時(shí)間序列上的方程,因此不能用于平滑。所有其他技術(shù)都是有據(jù)可查的平滑技術(shù)。
A)300
B) 350
C) 400
D)需要更多的信息
解決方案:(A)
X' = (xt-3 + xt-2 + xt-1) /3
(200+300+400)/ 3 = 900/3 =300
A)AR B)MA C)不能判斷
解決方案:(A)
在以下情況下考慮使用MA模型:如果差分序列的自相關(guān)函數(shù)(ACF)表現(xiàn)出明顯的截尾或偏相關(guān)系數(shù)表現(xiàn)出拖尾,則考慮添加一個(gè)模型的MA項(xiàng)。ACF截止的滯后時(shí)間就是MA項(xiàng)數(shù)。
但是,由于沒(méi)有表現(xiàn)出明顯的截尾,因此必須采用AR模型。
以上陳述是否代表數(shù)據(jù)具有季節(jié)性?
A)真 B)假 C)不能判斷
解決方案:(A)
是的,這是一個(gè)明確的季節(jié)性趨勢(shì),因?yàn)樵谔囟〞r(shí)間視圖會(huì)發(fā)生變化。
請(qǐng)記住,“季節(jié)性”是指在特定的周期性時(shí)間間隔內(nèi)出現(xiàn)的變化。
1.多個(gè)盒圖 2.自相關(guān)
A)僅1 B)僅2 C)1和2 D)這些都不是
解決方案:(C)
季節(jié)性是在特定的周期間隔內(nèi)變化的存在。
分布的變化可以在多個(gè)盒圖中觀察到。因此,可以很容易地發(fā)現(xiàn)季節(jié)性。自相關(guān)圖應(yīng)在等于周期的滯后處顯示峰值。
A)是 B)假
解決方案:(A)
當(dāng)滿足以下條件時(shí),時(shí)間序列是平穩(wěn)的。
平均值是恒定的,不依賴于時(shí)間
自協(xié)方差函數(shù)僅取決于s和t的差| s-t |。(其中t和s是時(shí)間點(diǎn))
考慮的時(shí)間序列是一個(gè)有限方差過(guò)程
這些條件是數(shù)學(xué)上表示要用于分析和預(yù)測(cè)的時(shí)間序列的必要先決條件。因此,平穩(wěn)性是理想的屬性。
如果給定窗口大小2,特征X的滑動(dòng)平均值是多少?
注意:X欄代表滑動(dòng)平均值。
A)
B)
C)
D)以上都不是
解決方案: (B)
X` = Xt-2 + Xt-1 / 2
根據(jù)以上公式:(100 +200)/ 2 = 150; (200 + 300)/ 2 = 250,依此類推。
模型1:決策樹模型
模型2:時(shí)間序列回歸模型
在對(duì)這兩個(gè)模型進(jìn)行評(píng)估的最后,你發(fā)現(xiàn)模型2比模型1更好。
A)模型1不能像模型2那樣映射線性關(guān)系 B)模型1總是比模型2更好 C)你不能將決策樹與時(shí)間序列回歸進(jìn)行比較 D)這些都不是
解決方案: (A)
時(shí)間序列模型類似于回歸模型。因此,它擅于找到簡(jiǎn)單的線性關(guān)系?;跇涞哪P碗m然有效,但在發(fā)現(xiàn)和利用線性關(guān)系方面卻并不那么擅長(zhǎng)。
A)時(shí)間序列分析 B)分類 C)聚類 D)以上都不是
解決方案:(A)
本題獲取了連續(xù)幾天的數(shù)據(jù),因此最有效的分析類型是時(shí)間序列分析。
A)15,12.2,-43.2,-23.2,14.3,-7 B)38.17,-46.11,-4.98,14.29,-22.61 C)35,38.17,-46.11,-4.98,14.29,-22.61 D)36.21, -43.23,-5.43,17.44,-22.61
解決方案:(B)
73.17-35 = 38.17 27.05-73.17 = – 46.11,依此類推。 13.75 – 36.36 = -22.61
{23.32 32.33 32.88 28.98 33.16 26.33 29.88 32.69 18.98 21.23 26.66 29.89} 時(shí)間序列滯后一個(gè)樣本的自相關(guān)是什么?
A) 0.26 B) 0.52 C) 0.13 D) 0.07
解決方案:(C)
ρ?1 = PT t = 2(x t-1- xˉ)(x t- xˉ)PTt = 1(xt-xˉ)^2
=(23.32-x′)(32.33-x′)+(32.33-x′)(32.88-x′)+···PT t = 1(xt -x′)^2
= 0.130394786
其中x是級(jí)數(shù)的平均值,為28.0275
A)真 B)假
解決方案:(A)
弱平穩(wěn)時(shí)間序列 xt 是有限方差過(guò)程,因此
平均值函數(shù) μt 是常數(shù),并且不依賴于時(shí)間t;并且(ii)定義的自協(xié)方差函數(shù)γ(s,t)僅依賴于s和t的差| s-t |。
在各種頻率下振蕩的正弦和余弦的隨機(jī)疊加是白噪聲。白噪聲是微弱的或平穩(wěn)的。如果白噪聲變量也呈正態(tài)分布或高斯分布,則該序列也是嚴(yán)平穩(wěn)的。
A)xs和xt的間隔 B)h = | s – t | C)在特定時(shí)間點(diǎn)的位置
解決方案:(C)
通過(guò)定義上一個(gè)問(wèn)題中描述的弱平穩(wěn)時(shí)間序列。
A)它們都是平穩(wěn)的 B)交叉方差函數(shù)僅是滯后h的函數(shù) C)僅A D)A和B
解決方案:(D)
聯(lián)合平穩(wěn)性是根據(jù)上述兩個(gè)條件定義的。
A)因變量的當(dāng)前值受自變量的當(dāng)前值影響 B)因變量的當(dāng)前值受自變量的當(dāng)前值和過(guò)去值影響 C)因變量的當(dāng)前值受因變量和自變量的過(guò)去值影響 D)以上都不是
解決方案:(C)
自回歸模型基于這樣的思想,即序列的當(dāng)前值xt可以解釋為p個(gè)過(guò)去值xt-1,xt-2,…,xt-p的函數(shù),其中p決定了預(yù)測(cè)當(dāng)前值所需的過(guò)去步進(jìn)數(shù)。例如 xt = xt-1 -.90xt-2 + wt,
其中xt-1和xt-2是因變量和wt的過(guò)去值,白噪聲可以表示獨(dú)立值。
該示例可以擴(kuò)展為包括類似于多元線性回歸的多序列。
A)真 B)假
解決方案:(A)
正確,因?yàn)镸A模型的自協(xié)方差是可逆的
請(qǐng)注意,對(duì)于MA(1)模型,對(duì)于θ和1 /θ,ρ(h)相同。
A)AR(1)MA(0) B)AR(0)MA(1) C)AR(2)MA(1) D)AR(1)MA(2) E)不能判斷
解決方案:(B)
滯后1的強(qiáng)負(fù)相關(guān)表明MA只有1個(gè)顯著滯后。閱讀本文以獲得更好的理解。
https://www.analyticsvidhya.com/blog/2015/12/complete-tutorial-time-series-modeling/
A)均值= 0 B)自協(xié)方差為0 C)自協(xié)方差為0(零滯后除外 D)二次方差
解決方案:(C)
白噪聲過(guò)程必須具有恒定的均值,恒定的方差和無(wú)自協(xié)方差結(jié)構(gòu)(滯后零(方差)除外)。
A)在滯后3時(shí)ACF = 0 B)在滯后5中ACF = 0 C)在滯后1中ACF = 1 D)在滯后2中ACF = 0 E)在滯后3和滯后5中ACF = 0
解決方案:(B)
回想一下,MA(q)過(guò)程僅具有長(zhǎng)度為q的記憶。這意味著,所有自相關(guān)系數(shù)在滯后q以后的值為零。這可以通過(guò)檢查MA方程并看到只有過(guò)去的q個(gè)擾動(dòng)項(xiàng)進(jìn)入方程來(lái)看出。
因此,如果我們向前迭代此方程超過(guò)q個(gè)周期,則擾動(dòng)項(xiàng)的當(dāng)前值將不再影響y。由于滯后零的自相關(guān)函數(shù)是時(shí)間t處的y與時(shí)間t處的y的相關(guān)性(即y_t與自身的相關(guān)性),因此根據(jù)定義,滯后0處的自相關(guān)函數(shù)必須為1。
A)1.5 B)1.04 C)0.5 D)2
解決方案:(B)
擾動(dòng)的方差除以(1減去自回歸系數(shù)的平方)
在這種情況下為:1 /(1-(0.2 ^ 2))= 1 / 0.96 = 1.041
A)AR和MA模型:錯(cuò)誤 B)AR和ARMA模型:正確 C)MA和ARMA模型:錯(cuò)誤 D)ARMA系列中的不同模型
解決方案:(B)
A)二次趨勢(shì) B)線性趨勢(shì) C)A和B都是 D)以上都不是
解決方案:(A)
第一個(gè)差分表示為 xt = xt ?xt?1. (1)
如我們所見(jiàn),第一個(gè)差分消除了線性趨勢(shì)。第二個(gè)差分(即(1)的差分)可以消除二次趨勢(shì),依此類推。
A)k-折交叉驗(yàn)證 B)留一法交叉驗(yàn)證 C)Stratified Shuffle Split交叉驗(yàn)證 D)前向鏈交叉驗(yàn)證
解決方案:(D)
時(shí)間序列是有序數(shù)據(jù)。因此,必須對(duì)驗(yàn)證數(shù)據(jù)進(jìn)行排序。前向鏈可確保這一點(diǎn)。其工作方式如下:
fold 1:訓(xùn)練[1],測(cè)試[2]
fold 2:訓(xùn)練[1 2],測(cè)試[3]
fold 3:訓(xùn)練[1 2 3],測(cè)試[4]
fold 4:訓(xùn)練[1 2 3 4],測(cè)試[5]
fold 5:訓(xùn)練[1 2 3 4 5],測(cè)試[6]
A)真 B)假
解決方案:(A)
AIC = -2 * ln(likelihood)+ 2 * k,
BIC = -2 * ln(likelihood)+ ln(N)* k,
當(dāng):
k = 模型自由度
N = 觀察數(shù)
在N相對(duì)較低時(shí)(7及以下),BIC比AIC更能容忍自由參數(shù),但在N相對(duì)較高時(shí)則容忍度較低(因?yàn)镹的自然對(duì)數(shù)大于2)。
A)通過(guò)獲取日志來(lái)轉(zhuǎn)換數(shù)據(jù) B)對(duì)序列求差分以獲取平穩(wěn)數(shù)據(jù) C)將MA(1)模型擬合到時(shí)間序列
解決方案:(B)
自相關(guān)顯示出確定的趨勢(shì),而部分自相關(guān)顯示出波動(dòng)的趨勢(shì),在這種情況下,采用對(duì)數(shù)是沒(méi)有用的。對(duì)序列求差分以獲得平穩(wěn)序列是唯一的選擇。
這些結(jié)果總結(jié)了簡(jiǎn)單指數(shù)平滑與時(shí)間序列的擬合。
A)0.2,0.32,0.6 B)0.33,0.33,0.33 C)0.27,0.27,0.27 D)0.4,0.3,0.37
解決方案:(B)
指數(shù)平滑的預(yù)測(cè)值在3年中都是相同的,因此我們所需要的只是明年的值。平滑的表達(dá)式是
smootht = α yt + (1 – α) smooth t-1
因此,對(duì)于下一個(gè)點(diǎn),平滑的下一個(gè)值(下一個(gè)觀察的預(yù)測(cè))為
smoothn = α yn + (1 – α) smooth n-1
= 0.39680.43 + (1 – 0.3968) 0.3968
= 0.3297
這些結(jié)果總結(jié)了簡(jiǎn)單指數(shù)平滑對(duì)時(shí)間序列的擬合。
A)0.3297 2 * 0.1125 B)0.3297 2 * 0.121 C)0.3297 2 * 0.129 D)0.3297 2 * 0.22
解決方案:(B)
預(yù)測(cè)誤差的標(biāo)準(zhǔn)偏差為
1個(gè)周期為 0.1125
2個(gè)周期為 0.1125 sqrt(1+α2) = 0.1125 * sqrt(1+ 0.39682) ≈ 0.121
如果ARIMA模型中的自回歸參數(shù)(p)為1,則表示序列中不存在自相關(guān)。
如果ARIMA模型中的移動(dòng)平均成分(q)為1,則表示序列中具有滯后1的自相關(guān)
如果ARIMA模型中的積分成分(d)為0,則意味著系列不是平穩(wěn)的。
A)僅1 B)1和2均 C)僅2 D)所有陳述
解決方案:(C)
自回歸分量:AR代表自回歸。自回歸參數(shù)由p表示。當(dāng)p = 0時(shí),表示序列中不存在自相關(guān)。當(dāng)p = 1時(shí),表示序列自相關(guān)到一個(gè)滯后。
積分:在ARIMA時(shí)間序列分析中,積分用d表示。積分是微分的倒數(shù)。
當(dāng)d = 0時(shí),這意味著級(jí)數(shù)是平穩(wěn)的,我們不需要取其差。
當(dāng)d = 1時(shí),這意味著該序列不是平穩(wěn)的,并且要使其平穩(wěn),我們需要求第一差分。
當(dāng)d = 2時(shí),表示序列需要二次差分。
通常情況下,兩個(gè)以上的差分是不可靠的。
移動(dòng)平均分量:MA表示移動(dòng)平均,用q表示。在ARIMA中,移動(dòng)平均q = 1表示它是一個(gè)誤差項(xiàng),并且存在一個(gè)滯后的自相關(guān)。
A)小于1 B)大于1 C)等于1 D)季節(jié)性不存在 E)數(shù)據(jù)不足
解決方案:(B)
由于有四個(gè)季度,所以季節(jié)指數(shù)必須總計(jì)為4。0.80 + 0.90 + 0.95 = 2.65,因此對(duì)于4的季節(jié)指數(shù)個(gè)季度必須是4-2.65 = 1.35,所以B是正確的答案。
到此,關(guān)于“機(jī)器學(xué)習(xí)中測(cè)試時(shí)間序列的問(wèn)題有哪些”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!