本篇文章給大家分享的是有關(guān)怎樣深度學(xué)習(xí)中的檢測網(wǎng)絡(luò)SSD/Faster R-CNN/YOLO,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
成都創(chuàng)新互聯(lián)長期為成百上千家客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對不同對象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為東臺企業(yè)提供專業(yè)的成都做網(wǎng)站、網(wǎng)站設(shè)計(jì),東臺網(wǎng)站改版等技術(shù)服務(wù)。擁有十多年豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開發(fā)。
深度學(xué)習(xí)中的檢測任務(wù)(Detection)是指檢測出圖片中的物體位置,一般需要進(jìn)行畫框。比如下圖中把人、羊,還有狗都框出來了,具體來說,網(wǎng)絡(luò)需要輸出框的坐標(biāo)。
檢測網(wǎng)絡(luò)有哪些?
常用的檢測可以大致可以分為兩類:two stage和one stage. Two stage是說在檢測網(wǎng)絡(luò)分兩步,第一步是框出物體,第二步是確定這個(gè)物體的分類。One stage就是根據(jù)提取的特征,直接使用回歸網(wǎng)絡(luò)得出其分類和檢測框。其中,F(xiàn)aster R-CNN屬于two stage,SSD和YOLO屬于one stage.
One stage的好處是快,Two stage的好處是準(zhǔn)確,在得到檢測框后,再去分類這個(gè)任務(wù)要比直接回歸網(wǎng)絡(luò)得到分類好容易很多。
下圖是Faster RCNN的結(jié)構(gòu):
主要分為四個(gè)步驟:
- 卷積層。原始圖片先經(jīng)過conv-relu-pooling的多層卷積神經(jīng)網(wǎng)絡(luò),提取出特征圖(feature map)。
- RPN層,region proposalnetworks。RPN層用于生成候選框,并利用softmax判斷候選框是前景還是背景,從中選取前景候選框(因?yàn)槲矬w一般在前景中),并回歸調(diào)整候選框的位置,獲得框內(nèi)的物體的feature map
- ROI層,它將大小尺寸不同物體的feature map池化成相同的大小,然后送入后續(xù)的全連接層進(jìn)行物體分類
- 分類層。利用ROI層輸出的特征圖進(jìn)行分類,同時(shí)再次對檢測框bounding box進(jìn)行回歸從而得到更精確的形狀和位置。
SSD和YOLO可以放在一起對比,因?yàn)槎际菍儆趏ne stage的網(wǎng)絡(luò),在獲取feature map后,檢測和分類一起在一起進(jìn)行。SSD和YOLO的區(qū)別在于SSD能夠進(jìn)行多尺度特征提取,可以看到上面的SSD結(jié)構(gòu)有6個(gè)箭頭指向Detections,每一個(gè)箭頭代表一個(gè)尺度的feature map,卷積層越往后越能看到全局的特征。YOLO則沒有這方面的設(shè)計(jì),只有一個(gè)特征輸出到Detections網(wǎng)絡(luò)中。
因?yàn)镾SD網(wǎng)絡(luò)的這種設(shè)計(jì),檢測精度比YOLO高,同時(shí)速度比Faster RCNN快,因此也是當(dāng)前應(yīng)用最廣泛的檢測網(wǎng)絡(luò)之一。另外,在SSD原始論文中用到的是VGG骨架來提取特征,現(xiàn)在很多更好的特征提取網(wǎng)絡(luò),例如ResNet,mobilenet也在大量應(yīng)用,進(jìn)一步提高精度或者加快速度。
以上就是怎樣深度學(xué)習(xí)中的檢測網(wǎng)絡(luò)SSD/Faster R-CNN/YOLO,小編相信有部分知識點(diǎn)可能是我們?nèi)粘9ぷ鲿姷交蛴玫降?。希望你能通過這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。