ABBYY FineReader PDF 15是一款智能程度相當(dāng)高的OCR文字識(shí)別軟件,不僅能識(shí)別PDF文檔,而且還能識(shí)別難度更高的圖像文件。 說(shuō)到圖像文件,雖然使用掃描儀可以讓我們獲取到精確度更高的圖像,但并不是每個(gè)家庭都配備有掃描儀,因此,通過(guò)拍照的方式獲取文件圖像是我們更常用的方法。 讓人驚喜的是,ABBYY FineReader PDF 15提供了實(shí)用的手動(dòng)編輯圖像功能,可供使用者更好地調(diào)整圖像的狀態(tài),以提高軟件的識(shí)別準(zhǔn)確度。 一、使用OCR編輯器功能 首先,如需使用ABBYY FineReader PDF 15 手動(dòng)編輯圖像功能,需單擊“在OCR編輯器中打開(kāi)”選項(xiàng),并打開(kāi)指定的圖像。 二、編輯頁(yè)面圖像 待軟件完成圖像的載入后,如圖2所示,單擊ABBYY FineReader PDF 15的編輯菜單,并選擇其中的“編輯頁(yè)面圖像”功能。 接著,軟件就會(huì)自動(dòng)打開(kāi)圖像編輯器。如圖3所示,在編輯器的右側(cè)可找到多項(xiàng)調(diào)整圖像的功能,如歪斜校正、修剪等。 針對(duì)本例需處理的圖像,我們將會(huì)使用到預(yù)處理以及校正梯形失真兩項(xiàng)功能。 1、建議的預(yù)處理 首先看到的是“建議的預(yù)處理”功能,如圖4所示,選擇該功能后,ABBYY FineReader PDF 15就會(huì)根據(jù)圖像的特點(diǎn)進(jìn)行自動(dòng)的修正。該功能可以修正明顯的圖像拍攝缺陷,建議在調(diào)整圖片前先使用該功能進(jìn)行“預(yù)處理”。
2、校正梯形失真 接著,如圖5所示,可以看到示例中的圖像存在著明顯的梯形失真。這種拍攝缺陷比較常見(jiàn),當(dāng)相機(jī)與拍攝的文本未能保持垂直狀態(tài)時(shí),就會(huì)出現(xiàn)這種梯形失真。 我們可以通過(guò)自動(dòng)或手動(dòng)的方式修正梯形失真。如需使用手動(dòng)方式調(diào)整,需在網(wǎng)格類(lèi)型中選取“用戶自定義網(wǎng)格” 然后,再拖動(dòng)框的每個(gè)角與目標(biāo)識(shí)別的文本行對(duì)齊。如圖6所示,由于我們目標(biāo)識(shí)別的是表格中的文本,因此,需要將方框的四個(gè)角與表格的四個(gè)角對(duì)齊。完成方框的調(diào)整后,就可以單擊“修正”按鈕。 如圖7所示,可以看到,圖像的梯形失真已調(diào)整完畢,效果相當(dāng)不錯(cuò)。 完成了圖像的編輯調(diào)整后,就可以單擊“退出圖像編輯器”,返回軟件的OCR編輯器中。 三、重新識(shí)別圖像 返回到OCR編輯器后,在頁(yè)面面板中右擊目標(biāo)圖像,選擇快捷菜單中的“識(shí)別頁(yè)面”選項(xiàng),即可以調(diào)整后的圖像為基礎(chǔ),開(kāi)啟文本的識(shí)別。 如圖9所示,可以看到,圖像被識(shí)別為表格文件,準(zhǔn)確度還是相當(dāng)高的。 四、小結(jié) 綜上所述,通過(guò)使用ABBYY FineReader PDF 15的手動(dòng)編輯圖像功能,即使無(wú)法使用掃描儀,我們也能通過(guò)使用手動(dòng)編輯圖像功能,修正一些拍攝缺陷,如梯形失真、歪斜校正等,提高軟件文本識(shí)別的準(zhǔn)確度。 |
|