這篇文章給大家介紹PIoU Loss怎么實(shí)現(xiàn)復(fù)雜場(chǎng)景下的精確定向目標(biāo)檢測(cè),內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對(duì)大家能有所幫助。
為石龍等地區(qū)用戶(hù)提供了全套網(wǎng)頁(yè)設(shè)計(jì)制作服務(wù),及石龍網(wǎng)站建設(shè)行業(yè)解決方案。主營(yíng)業(yè)務(wù)為成都網(wǎng)站建設(shè)、做網(wǎng)站、石龍網(wǎng)站設(shè)計(jì),以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專(zhuān)業(yè)、用心的態(tài)度為用戶(hù)提供真誠(chéng)的服務(wù)。我們深信只要達(dá)到每一位用戶(hù)的要求,就會(huì)得到認(rèn)可,從而選擇與我們長(zhǎng)期合作。這樣,我們也可以走得更遠(yuǎn)!
使用定向包圍框(oriented bounding box)進(jìn)行目標(biāo)檢測(cè)可以通過(guò)減少與背景區(qū)域的重疊來(lái)更好地定位有旋轉(zhuǎn)傾斜的目標(biāo)。現(xiàn)有的OBB方法大多是在水平包圍框檢測(cè)器(horizontal bounding box)上通過(guò)引入額外的角度尺度(通過(guò)距離損失進(jìn)行優(yōu)化)構(gòu)建的。 但是,由于距離損失只將OBB的角度誤差優(yōu)化至最小,而且與IoU的相關(guān)性較松散,因此它對(duì)具有高長(zhǎng)寬比的目標(biāo)不敏感。 因此,本文提出了一種新的損失,即Pixels-IoU(PIoU)損失,以利用角度和IoU實(shí)現(xiàn)更精確的OBB回歸。 PIoU損失是從IoU指標(biāo)以像素的形式導(dǎo)出的,形式簡(jiǎn)單但適用于水平和定向包圍框。為了證明其有效性,本文評(píng)估了ancho-based和anchor-free框架下使用PIoU損失的效果。實(shí)驗(yàn)結(jié)果表明,PIoU損失可以顯著提高OBB檢測(cè)器的性能,特別是在具有高長(zhǎng)寬比和復(fù)雜背景的目標(biāo)檢測(cè)上。此外,現(xiàn)有的評(píng)估數(shù)據(jù)集不含有大量高長(zhǎng)寬比目標(biāo),因此引入了新的數(shù)據(jù)集Retail50K,以鼓勵(lì)大家應(yīng)用OBB檢測(cè)器來(lái)處理更加復(fù)雜的環(huán)境。
OBB:oriented bounding box,定向目標(biāo)框,指不限制傾斜角的目標(biāo)框
HBB:Horizontal bounding box,水平目標(biāo)框,默認(rèn)傾斜角度是0
PIOU:Pixels-IoU loss:用像素累加的方法(而不是坐標(biāo))近似計(jì)算兩box的交并集面積
解決的問(wèn)題:非水平狀態(tài)的box識(shí)別(對(duì)比普通的水平目標(biāo)框),具有很大的長(zhǎng)寬比的目標(biāo)(對(duì)比下圖和Retail50k數(shù)據(jù)集的例圖),復(fù)雜背景下的OBB識(shí)別(對(duì)比下圖中空曠簡(jiǎn)單的背景)
提出了一個(gè)數(shù)據(jù)集:Retail50K(超市零售貨架數(shù)據(jù)集),兼具復(fù)雜背景(各色飲料瓶等)和HBB目標(biāo)(非水平box,具備很大的長(zhǎng)寬比)
基于SSD訓(xùn)練一個(gè)具有旋轉(zhuǎn)不變性的檢測(cè)器
基于Faster RCNN訓(xùn)練一個(gè)旋轉(zhuǎn)檢測(cè)器
設(shè)計(jì)RoI 變換器以學(xué)習(xí)從BB到OBB的旋轉(zhuǎn)不變特征
利用生成式模型抽取OBB候選框,依靠局部最大似然確定選值
存在的問(wèn)題:針對(duì)遙感航空?qǐng)D像,背景簡(jiǎn)單,且物體不是具有大長(zhǎng)寬比的目標(biāo)。
和傳統(tǒng)的loss相比,OBB(非水平box)多了一個(gè)傾斜角的維度,所以無(wú)法直接用常見(jiàn)的Loss計(jì)算。
從IoU出發(fā),我們?cè)谟?jì)算IoU時(shí),需要計(jì)算兩個(gè)box的交集和并集,既然一張圖像是由若干像素點(diǎn)構(gòu)成的,那交并集的區(qū)域是不是也可以用其內(nèi)部的像素點(diǎn)數(shù)量近似代替?
如上圖,p(i,j)綠點(diǎn)是圖像上的一個(gè)像素點(diǎn),c是OBB框的中心點(diǎn),t(i,j)是p到box中心線(xiàn)的垂線(xiàn)的交點(diǎn),p到t的距離記為dh(i,j),c到t的距離記為dw(i,j)。
作者提出用一個(gè)二元約束關(guān)系來(lái)判斷像素點(diǎn)p是否在OBB框中:
用距離dh和dw來(lái)判定p是否在box中
其中θ代表box的傾斜角,計(jì)算關(guān)系可見(jiàn)下圖:
用累加像素點(diǎn)的方法計(jì)算兩框的交集和并集
由于前述的二元約束關(guān)系是不連續(xù)不可導(dǎo)的,作者將其轉(zhuǎn)換為兩個(gè)核的乘積(核方法):
k是一個(gè)可調(diào)系數(shù),控制對(duì)目標(biāo)像素p的靈敏度
此時(shí),上述的F函數(shù)是連續(xù),可導(dǎo)的,同時(shí)也保持了正確的取值趨勢(shì)。
如上所示,核函數(shù)在像素點(diǎn)p接近box中心c的時(shí)候趨向于1,在遠(yuǎn)離時(shí)趨向于0,基本近似反映了像素點(diǎn)相對(duì)box內(nèi)部的概率分布。
此時(shí),求兩box的交并集的方法更新為:
為了減少計(jì)算量,可以用框的w,h關(guān)系簡(jiǎn)化上述計(jì)算:
最后,我們得到PIoU的計(jì)算形式:
記(b,b')為一對(duì)正結(jié)果,b為基于一個(gè)正anchor(當(dāng)一個(gè)anchor以0.5+的IoU匹配到一個(gè)GTbox時(shí),記為正)的預(yù)測(cè)框,b‘為匹配到的ground-truth框。M代表所有正樣本對(duì)的數(shù)量。
則PIoU的Loss可以表示為:
基于來(lái)自不同國(guó)家和地區(qū)的志愿拍攝的超市圖像,唯一標(biāo)注類(lèi)型為貨架層。
例圖:
具備如下特點(diǎn):
復(fù)雜的背景:貨架層可能被價(jià)簽或者促銷(xiāo)條等遮擋。同時(shí)周?chē)祀s了各色飲料、零食等。
極大的長(zhǎng)寬比:貨架層大部分都長(zhǎng)度很長(zhǎng),寬度很小。
有實(shí)用價(jià)值:可用于貨架零售標(biāo)簽檢測(cè),自動(dòng)貨架分層,貨架層和圖像偏角估計(jì)等等。
上圖說(shuō)明了數(shù)據(jù)集中,長(zhǎng)寬比、傾斜角、實(shí)例數(shù)量的分布情況。
對(duì)核函數(shù)中可調(diào)參數(shù)k的實(shí)驗(yàn):
對(duì)DOTA數(shù)據(jù)集,對(duì)比PIoU Loss的效果實(shí)驗(yàn):
(DOTA數(shù)據(jù)集是航拍的遙感數(shù)據(jù)集,地面物體,但有傾角)
其中HPIoU是使用w,h計(jì)算并集以簡(jiǎn)化計(jì)算的版本,精度略微下降,但節(jié)約了時(shí)間
PASCAL數(shù)據(jù)集上的測(cè)試結(jié)果:
PIoU在Retail50K數(shù)據(jù)集上的測(cè)試如下:
PIoU和SmoothL1損失的對(duì)比實(shí)驗(yàn)結(jié)果,下圖紅色框?yàn)镻IoU,明顯效果更好。
關(guān)于PIoU Loss怎么實(shí)現(xiàn)復(fù)雜場(chǎng)景下的精確定向目標(biāo)檢測(cè)就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到。