HOG特征
從江ssl適用于網(wǎng)站、小程序/APP、API接口等需要進(jìn)行數(shù)據(jù)傳輸應(yīng)用場(chǎng)景,ssl證書未來(lái)市場(chǎng)廣闊!成為創(chuàng)新互聯(lián)的ssl證書銷售渠道,可以享受市場(chǎng)價(jià)格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:18980820575(備注:SSL證書合作)期待與您的合作!
HOG(Histograms of Oriented Gradients)梯度方向直方圖
通過利用梯度信息能反映圖像目標(biāo)的邊緣信息并通過局部梯度的大小將圖像局部的外觀和形狀特征化.在論文Histograms of Oriented Gradients for Human Detection中被提出.
HOG特征的提取過程為:
Gamma歸一化;
計(jì)算梯度;
劃分cell
組合成block,統(tǒng)計(jì)block直方圖;
梯度直方圖歸一化;
收集HOG特征。
Gamma歸一化:
對(duì)圖像顏色進(jìn)行Gamma歸一化處理,降低局部陰影及背景因素的影響.
計(jì)算梯度:
通過差分計(jì)算出圖像在水平方向上及垂直方向上的梯度:
然后得到各個(gè)像素點(diǎn)的梯度的幅值及方向:
劃分cell
將整個(gè)窗口劃分成大小相同互不重疊的細(xì)胞單元cell(如8×8像素),計(jì)算出每個(gè)cell的梯度大小及方向.然后將每像素的梯度方向在0?180o0?180o 區(qū)間內(nèi)(無(wú)向:0-180,有向:0-360)平均分為9個(gè)bins,每個(gè)cell內(nèi)的像素用幅值來(lái)表示權(quán)值,為其所在的梯度直方圖進(jìn)行加權(quán)投票.
9bins:
如圖,不同數(shù)量的bins下的錯(cuò)誤率:
組合成block,統(tǒng)計(jì)block直方圖
將2×2個(gè)相鄰的cell組成大小為16×16的像素塊即block.依次將block大小的滑動(dòng)窗口從左到右從上到下滑動(dòng),求其梯度方向直方圖向量.
如圖,不同大小的cell與不同大小的block作用下的效果對(duì)比:
梯度直方圖歸一化
作者對(duì)比了L2-norm、L1-norm、L1-sqrt等歸一化方法,發(fā)現(xiàn)都比非標(biāo)準(zhǔn)數(shù)據(jù)有顯著的改善.其中L2-norm和L1-sqrt效果最好,而L1-norm檢測(cè)效果要比L2-norm和L1-sqrt低5%.
如圖,不同的歸一化方法效果對(duì)比:
這樣通過歸一化能夠進(jìn)一步地對(duì)光照、陰影和邊緣進(jìn)行壓縮.
收集HOG特征
由于每個(gè)cell內(nèi)的梯度方向分成了9個(gè)bins,這樣每個(gè)細(xì)胞單元的HOG特征向量長(zhǎng)度是9.
這樣,對(duì)于大小為128×64大小的圖像,采用8*8像素的sell,2×2個(gè)cell組成的16×16像素的block,采用8像素的block移動(dòng)步長(zhǎng),這樣檢測(cè)窗口block的數(shù)量有((128-16)/8+1)×((64-16)/8+1)=15×7.則HOG特征描述符的維數(shù)為15×7×4×9.
HOG的缺點(diǎn):
速度慢,實(shí)時(shí)性差;難以處理遮擋問題。
OpenCV應(yīng)用
利用HOG進(jìn)行行人檢測(cè)時(shí)有兩種用法:
1、采用HOG特征+SVM分類器進(jìn)行行人檢測(cè);
2、利用HOG+SVM訓(xùn)練自己的XML文件。
采用第一種方法,使用HOG特征結(jié)合SVM分類器進(jìn)行行人檢測(cè),簡(jiǎn)單示例:
#include#include using namespace std; using namespace cv; int main() { Mat src, dst; src = imread("E:/image/image/passerby.jpg",1); if (src.empty()) { printf("can not load the image...\n"); return -1; } dst = src.clone(); vector findrects, findrect; HOGDescriptor HOG; //SVM分類器 HOG.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector()); //多尺度檢測(cè) HOG.detectMultiScale(src, findrects, 0, Size(4,4), Size(0,0), 1.05, 2); //若rects有嵌套,則取最外面的矩形存入rect for(int i=0; i < findrects.size(); i++) { Rect rect = findrects[i]; int j=0; for(; j < findrects.size(); j++) if(j != i && (rect & findrects[j]) == rect) break; if( j == findrects.size()) findrect.push_back(rect); } //框選出檢測(cè)結(jié)果 for(int i=0; i