在我們的日常生活中,所碰到的圖像往往都有一定的傾斜。那么,如何用OpenCV來獲取圖像的旋轉(zhuǎn)角度呢? 我們以下面的圖片為例,簡單介紹如何用OpenCV來獲取圖像的旋轉(zhuǎn)角度。 4.png 可以看到,該圖像存在著許多噪聲,且是彩色圖片,因此,需要對圖像做預(yù)處理。 預(yù)處理 圖像的預(yù)處理包括去除邊緣,去除噪聲(兩條灰色線),濾波,二值化等,具體處理的Python代碼如下: #-*- coding: utf-8 -*- importcv2 imagepath= 'F://CHN_Char/4.png'img= cv2.imread(imagepath, 1)#將圖片的邊緣變?yōu)榘咨?/p> height, width = img.shape[0:2]for i inrange(width): img[0, i]= [255]*3img[height-1, i] = [255]*3 for j inrange(height): img[j, 0]= [255]*3img[j, width-1] = [255]*3 #去掉灰色線(即噪聲) for i inrange(height):for j inrange(width):if list(img[i,j]) == [204,213,204]: img[i,j]=[255]*3 #把圖片轉(zhuǎn)換為灰度模式 gray =cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)#中值濾波 blur = cv2.medianBlur(gray, 3) #模板大小3*3#二值化 ret,thresh = cv2.threshold(blur, 200, 255, cv2.THRESH_BINARY)#保存圖片 cv2.imwrite('F://CHN_Char/char_after_bin.png', thresh) 預(yù)處理后的圖片如下: 預(yù)處理后的圖片 可以看到,預(yù)處理后的圖像基本不含噪聲,且是黑色圖片,這樣,我們就可以進行后續(xù)操作了。 獲取旋轉(zhuǎn)角度 對于上述預(yù)處理后的圖片,可以用OpenCV的最小外接矩形方法(minAreaRect())來操作,該方法會返回最小外界矩形的中心點左邊,矩形寬度、高度,以及旋轉(zhuǎn)角度。因為圖像中只有一個文字,因此包含該文字的最小外接矩形返回的角度就是圖像的旋轉(zhuǎn)角度(當(dāng)然也有可能是負(fù)值)。 完整的Python代碼如下: #-*- coding: utf-8 -*- importcv2importnumpy as np imagepath= 'F://CHN_Char/char_after_bin.png'img= cv2.imread(imagepath, -1) image, contours, _= cv2.findContours(img, 2, 2)for cnt incontours:#最小外界矩形的寬度和高度 width, height = cv2.minAreaRect(cnt)[1]if width* height > 100:#最小的外接矩形 rect =cv2.minAreaRect(cnt) box= cv2.boxPoints(rect) #獲取最小外接矩形的4個頂點 box =np.int0(box)if 0 not inbox.ravel():'''繪制最小外界矩形 for i in range(4): cv2.line(image, tuple(box[i]), tuple(box[(i+1)%4]), 0) # 5''' #旋轉(zhuǎn)角度 theta = cv2.minAreaRect(cnt)[2]if abs(theta) <= 45:print('圖片的旋轉(zhuǎn)角度為%s.'%theta) angle=theta#仿射變換,對圖片旋轉(zhuǎn)angle角度 h, w =img.shape center= (w//2, h//2) M= cv2.getRotationMatrix2D(center, angle, 1.0) rotated= cv2.warpAffine(img, M, (w, h), flags=cv2.INTER_CUBIC, borderMode=cv2.BORDER_REPLICATE)#保存旋轉(zhuǎn)后的圖片 cv2.imwrite('F://CHN_Char/after_rotated.png', rotated) 輸出結(jié)果如下: 圖片的旋轉(zhuǎn)角度為-23.629377365112305. 得到的圖像如下: 旋轉(zhuǎn)后的圖像 在上述Python代碼中,先是利用minAreaRect()獲取圖像中的最小外接矩形,加上一定的篩選條件(如矩形的面積大于100,旋轉(zhuǎn)角度小于45度等)就能得到包含文字的最小外界矩形,其旋轉(zhuǎn)角度就是整個圖像的旋轉(zhuǎn)角度。 識別圖像中的文字 有了旋轉(zhuǎn)后的圖像,我們不妨利用Tesseract-OCR軟件來識別圖像中的文字,完整的Python代碼如下: importpytesseractimportcv2#tesseract.exe所在的文件路徑 pytesseract.pytesseract.tesseract_cmd = 'C://Program Files (x86)/Tesseract-OCR/tesseract.exe'imagepath= 'F://CHN_Char/after_rotated.png'image= cv2.imread(imagepath, -1) text= pytesseract.image_to_string(image, lang='chi_sim', config='-psm 10')print('Tesseract-OCR的識別結(jié)果為: '%s'.'%text) 輸出結(jié)果為: Tesseract-OCR的識別結(jié)果為: '知'. 因此,我們得到的圖像的旋轉(zhuǎn)角度是正確的。當(dāng)然,借用以上方法,還可以識別以下圖片中的文字: 識別文字 總結(jié) 本次獲取圖像的旋轉(zhuǎn)角度是利用了圖像中只有一個文字,而包含該文字的最小外接矩形的旋轉(zhuǎn)角度就是圖像的旋轉(zhuǎn)角度。這只是獲取圖像旋轉(zhuǎn)角度的一種方式,當(dāng)然,還會有其他獲取圖像旋轉(zhuǎn)角度的方法. |
|