目標
創(chuàng)新互聯(lián)于2013年創(chuàng)立,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項目成都網(wǎng)站設(shè)計、網(wǎng)站建設(shè)網(wǎng)站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元敘永做網(wǎng)站,已為上家服務(wù),為敘永各地企業(yè)和個人服務(wù),聯(lián)系電話:18980820575
本文檔嘗試解答如下問題:
如何使用OpenCV函數(shù) pyrUp 和 pyrDown 對圖像進行向上和向下采樣。
原理
Note 以下內(nèi)容來自于Bradski和Kaehler的大作: Learning OpenCV 。
當我們需要將圖像轉(zhuǎn)換到另一個尺寸的時候, 有兩種可能:
放大 圖像 或者
縮小 圖像。
盡管OpenCV 幾何變換 部分提供了一個真正意義上的圖像縮放函數(shù)(resize, 在以后的教程中會學(xué)到),不過在本篇我們首先學(xué)習(xí)一下使用 圖像金字塔 來做圖像縮放, 圖像金字塔是視覺運用中廣泛采用的一項技術(shù)。
圖像金字塔
一個圖像金字塔是一系列圖像的集合 - 所有圖像來源于同一張原始圖像 - 通過梯次向下采樣獲得,直到達到某個終止條件才停止采樣。
有兩種類型的圖像金字塔常常出現(xiàn)在文獻和應(yīng)用中:
高斯金字塔(Gaussian pyramid): 用來向下采樣
拉普拉斯金字塔(Laplacian pyramid): 用來從金字塔低層圖像重建上層未采樣圖像
在這篇文檔中我們將使用 高斯金字塔 。
高斯金字塔
想想金字塔為一層一層的圖像,層級越高,圖像越小。
每一層都按從下到上的次序編號, 層級 (i+1) (表示為 G_{i+1} 尺寸小于層級 i (G_{i}))。
為了獲取層級為 (i+1) 的金字塔圖像,我們采用如下方法:
將 G_{i} 與高斯內(nèi)核卷積:
將所有偶數(shù)行和列去除。
顯而易見,結(jié)果圖像只有原圖的四分之一。通過對輸入圖像 G_{0} (原始圖像) 不停迭代以上步驟就會得到整個金字塔。
以上過程描述了對圖像的向下采樣,如果將圖像變大呢?:
首先,將圖像在每個方向擴大為原來的兩倍,新增的行和列以0填充(0)
使用先前同樣的內(nèi)核(乘以4)與放大后的圖像卷積,獲得 “新增像素” 的近似值。
這兩個步驟(向下和向上采樣) 分別通過OpenCV函數(shù) pyrUp 和 pyrDown 實現(xiàn), 我們將會在下面的示例中演示如何使用這兩個函數(shù)。
Note 我們向下采樣縮小圖像的時候, 我們實際上 丟失 了一些信息。
源碼
本教程的源碼如下,你也可以從 這里 下載
#include "opencv2/imgproc/imgproc.hpp" #include "opencv2/highgui/highgui.hpp" #include#include #include using namespace cv; /// 全局變量 Mat src, dst, tmp; char* window_name = "Pyramids Demo"; /** * @函數(shù) main */ int main( int argc, char** argv ) { /// 指示說明 printf( "\n Zoom In-Out demo \n " ); printf( "------------------ \n" ); printf( " * [u] -> Zoom in \n" ); printf( " * [d] -> Zoom out \n" ); printf( " * [ESC] -> Close program \n \n" ); /// 測試圖像 - 尺寸必須能被 2^{n} 整除 src = imread( "../images/chicky_512.jpg" ); if( !src.data ) { printf(" No data! -- Exiting the program \n"); return -1; } tmp = src; dst = tmp; /// 創(chuàng)建顯示窗口 namedWindow( window_name, CV_WINDOW_AUTOSIZE ); imshow( window_name, dst ); /// 循環(huán) while( true ) { int c; c = waitKey(10); if( (char)c == 27 ) { break; } if( (char)c == 'u' ) { pyrUp( tmp, dst, Size( tmp.cols*2, tmp.rows*2 ) ); printf( "** Zoom In: Image x 2 \n" ); } else if( (char)c == 'd' ) { pyrDown( tmp, dst, Size( tmp.cols/2, tmp.rows/2 ) ); printf( "** Zoom Out: Image / 2 \n" ); } imshow( window_name, dst ); tmp = dst; } return 0; }
解釋
讓我們來回顧一下本程序的總體流程:
裝載圖像(此處路徑由程序設(shè)定,用戶無需將圖像路徑當作參數(shù)輸入)
/// 測試圖像 - 尺寸必須能被 2^{n} 整除 src = imread( "../images/chicky_512.jpg" ); if( !src.data ) { printf(" No data! -- Exiting the program \n"); return -1; }
創(chuàng)建兩個Mat實例, 一個用來儲存操作結(jié)果(dst), 另一個用來存儲零時結(jié)果(tmp)。
Mat src, dst, tmp; /* ... */ tmp = src; dst = tmp;
創(chuàng)建窗口顯示結(jié)果
namedWindow( window_name, CV_WINDOW_AUTOSIZE ); imshow( window_name, dst );
執(zhí)行無限循環(huán),等待用戶輸入。
while( true ) { int c; c = waitKey(10); if( (char)c == 27 ) { break; } if( (char)c == 'u' ) { pyrUp( tmp, dst, Size( tmp.cols*2, tmp.rows*2 ) ); printf( "** Zoom In: Image x 2 \n" ); } else if( (char)c == 'd' ) { pyrDown( tmp, dst, Size( tmp.cols/2, tmp.rows/2 ) ); printf( "** Zoom Out: Image / 2 \n" ); } imshow( window_name, dst ); tmp = dst; }
如果用戶按 ESC 鍵程序退出。 此外,它還提供兩個選項:
向上采樣 (按 ‘u')
pyrUp( tmp, dst, Size( tmp.cols*2, tmp.rows*2 )
函數(shù) pyrUp 接受了3個參數(shù):
tmp: 當前圖像, 初始化為原圖像 src 。
dst: 目的圖像( 顯示圖像,為輸入圖像的兩倍)
Size( tmp.cols*2, tmp.rows*2 ) : 目的圖像大小, 既然我們是向上采樣, pyrUp 期待一個兩倍于輸入圖像( tmp )的大小。
向下采樣(按 ‘d')
pyrDown( tmp, dst, Size( tmp.cols/2, tmp.rows/2 )
類似于 pyrUp, 函數(shù) pyrDown 也接受了3個參數(shù):
tmp: 當前圖像, 初始化為原圖像 src 。
dst: 目的圖像( 顯示圖像,為輸入圖像的一半)
Size( tmp.cols/2, tmp.rows/2 ) :目的圖像大小, 既然我們是向下采樣, pyrDown 期待一個一半于輸入圖像( tmp)的大小。
注意輸入圖像的大小(在兩個方向)必須是2的冥,否則,將會顯示錯誤。
最后,將輸入圖像 tmp 更新為當前顯示圖像, 這樣后續(xù)操作將作用于更新后的圖像。
tmp = dst;
結(jié)果
在編譯上面的代碼之后, 我們可以運行結(jié)果。 程序調(diào)用了圖像 chicky_512.jpg ,你可以在 tutorial_code/image 文件夾找到它。 注意圖像大小是 512 \times 512, 因此向下采樣不會產(chǎn)生錯誤(512 = 2^{9})。 原圖像如下所示:
首先按兩次 ‘d' 連續(xù)兩次向下采樣 pyrDown ,結(jié)果如圖:
由于我們縮小了圖像,我們也因此丟失了一些信息。通過連續(xù)按兩次 ‘u' 向上采樣兩次 pyrUp ,很明顯圖像有些失真:
以上所述是小編給大家介紹的C++函數(shù)pyrUp和pyrDown來實現(xiàn)圖像金字塔功能,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對創(chuàng)新互聯(lián)網(wǎng)站的支持!