卷積核用于滑動(dòng)圖像以提取特定特征(如特定方向的邊緣),然后使用relu抑制梯度色散。為了得到結(jié)果,使用另一個(gè)卷積核繼續(xù)提取relu,然后pool(保留大區(qū)域或使用平均區(qū)域替換整個(gè)局部區(qū)域的值,確保平移不變性,并在一定程度上抑制過擬合)
成都創(chuàng)新互聯(lián)自2013年起,先為亭湖等服務(wù)建站,亭湖等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為亭湖企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。在“depth”之后,我們需要繼續(xù)使用不同的卷積核來合并合并結(jié)果。最后,本質(zhì)是一幅圖像的深度特征,然后實(shí)際的分類需要添加另一層,一般是softmax。
(也就是說,對(duì)于已經(jīng)訓(xùn)練過的現(xiàn)成的卷積神經(jīng)網(wǎng)絡(luò)模型,只保留最后一層以外的部分,然后輸入訓(xùn)練圖片,并將網(wǎng)絡(luò)的輸出發(fā)送給多類支持向量機(jī)進(jìn)行再訓(xùn)練。最后,根據(jù)支持向量機(jī)的參數(shù),可以得到相同的結(jié)果。)
為什么卷積神經(jīng)網(wǎng)絡(luò)很快就收斂了?數(shù)據(jù)沒有標(biāo)準(zhǔn)化。
我沒有檢查你的結(jié)果。結(jié)果包括預(yù)處理結(jié)果和最終的訓(xùn)練測(cè)試結(jié)果。
忘記做數(shù)據(jù)預(yù)處理。
忘記使用正則化。
批量設(shè)置太大。
學(xué)習(xí)速率設(shè)置不正確。
未正確使用最后一層的激活功能。
網(wǎng)絡(luò)中存在不良梯度。例如,relu到負(fù)值的梯度為0。當(dāng)它向后傳播時(shí),0的漸變不會(huì)傳播。
參數(shù)初始化錯(cuò)誤。
網(wǎng)絡(luò)太深。
隱藏層中的神經(jīng)元數(shù)量錯(cuò)誤。
比較以上11項(xiàng)找出錯(cuò)誤
如果你是一個(gè)面試者,怎么判斷一個(gè)面試官的機(jī)器學(xué)習(xí)水平?卷積核數(shù)濾波器卷積核大小uu卷積核權(quán)參數(shù)初始分布卷積核偏差參數(shù)初始分布池大小池步長(zhǎng)池優(yōu)化算法目標(biāo)函數(shù)批量大小正則化數(shù)據(jù)預(yù)處理會(huì)影響太多的參數(shù)
簡(jiǎn)單的答案是肯定的。復(fù)雜的答案是不確定的(見下文)。
這個(gè)概念。
(圖片作者:chabacano,許可證:CCbysa4.0)
從圖像中可以明顯看出,過度擬合的曲線過于曲折(復(fù)雜),對(duì)現(xiàn)有數(shù)據(jù)擬合得非常好,但它不能很好地描述數(shù)據(jù)的規(guī)律,因此面對(duì)新數(shù)據(jù),我們不得不停下來。
從上面我們得到一個(gè)直覺,過度擬合的模型往往比正確的模型更復(fù)雜。
。您所說的“直接減少隱藏層和隱藏單元的數(shù)量”使網(wǎng)絡(luò)更薄、更窄正是簡(jiǎn)化模型的方法。這個(gè)想法沒有問題。
但是,我們可能必須嘗試找出它是否有效。因?yàn)?,一般來說,更復(fù)雜的網(wǎng)絡(luò)可能更有表現(xiàn)力。
一般來說,神經(jīng)網(wǎng)絡(luò)仍然是一個(gè)黑匣子。有時(shí),正則化的效果更好,有時(shí)則不然。一些問題可能是復(fù)雜的網(wǎng)絡(luò)工作得很好,另一些問題可能是深度和狹窄的網(wǎng)絡(luò)工作得很好,另一些問題可能是薄而寬的網(wǎng)絡(luò)工作得很好,或者一些問題可能是簡(jiǎn)單的網(wǎng)絡(luò)工作得很好。
具體來說,為了解決過擬合問題,除了簡(jiǎn)化模型(即您稱之為“直接減少隱藏層、隱藏層、隱藏層”)外,還存在漏項(xiàng)(在某種意義上,我們可以看到模型的某些部分由于簡(jiǎn)化模型的繞道而無法工作),以及人為增加稀疏性限制(稀疏性和簡(jiǎn)化之間存在模糊關(guān)系)或盡快停止訓(xùn)練。