記得應(yīng)該是16年的時候,從一個公開課看到了關(guān)于OCR方面的內(nèi)容,里面講到了通過OpenCV對身份證號碼區(qū)域的剪裁以及使用Tess-Two進行文字識別,實現(xiàn)了對身份證號碼的識別功能。
目前成都創(chuàng)新互聯(lián)公司已為1000+的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)頁空間、網(wǎng)站托管、服務(wù)器租用、企業(yè)網(wǎng)站設(shè)計、于都網(wǎng)站維護等服務(wù),公司將堅持客戶導向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。
斷斷續(xù)續(xù)看了點關(guān)于OpenCV的資料,感覺不是這個專業(yè)的真難看懂,各種公式各種名詞。今天主要用于做個記錄,那個一直碎碎念的東西終于完成了!
原理
我理解的原理(除去文字識別):
代碼實現(xiàn)
本文采用VS2017實現(xiàn),代碼如下:
#include "stdafx.h" #include "idocr.h" #include#include "opencv2/highgui/highgui.hpp" #include "opencv2/imgproc/imgproc.hpp" using namespace cv; using namespace std; void dealImg(char * path) { Mat src = imread(path); // 結(jié)果圖 Mat dst; // 顯示原圖 imshow("原圖", src); cvtColor(src, dst, COLOR_RGB2GRAY); // 高斯模糊,主要用于降噪 GaussianBlur(dst, dst, Size(3, 3), 0); imshow("GaussianBlur圖", dst); // 二值化圖,主要將灰色部分轉(zhuǎn)成白色,使內(nèi)容為黑色 threshold(dst, dst, 165, 255, THRESH_BINARY); imshow("threshold圖", dst); // 中值濾波,同樣用于降噪 medianBlur(dst, dst, 3); imshow("medianBlur圖", dst); // 腐蝕操作,主要將內(nèi)容部分向高亮部分腐蝕,使得內(nèi)容連接,方便最終區(qū)域選取 erode(dst, dst, Mat(9, 9, CV_8U)); imshow("erode圖", dst); //定義變量 vector > contours; vector hierarchy; findContours(dst, contours, hierarchy, RETR_CCOMP, CHAIN_APPROX_SIMPLE); Mat result; for (int i = 0; i < hierarchy.size(); i++) { Rect rect = boundingRect(contours.at(i)); rectangle(src, rect, Scalar(255, 0, 255)); // 定義身份證號位置大于圖片的一半,并且寬度是高度的6倍以上 if (rect.y > src.rows / 2 && rect.width / rect.height > 6) { result = src(rect); imshow("身份證號", result); } } imshow("輪廓圖", src); }
詳細步驟:
結(jié)果
對于身份證比較正的圖片位置識別的還算是挺正確的,但是如果圖片不正,那么第一步就應(yīng)該對圖片進行較正,無奈我是菜雞。下面是網(wǎng)上搜的一個假身份證圖片:
原圖
輪廓檢測圖
剪裁結(jié)果圖
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持創(chuàng)新互聯(lián)。