適用于 |
Microsoft Office 2003 |
Microsoft Office Document Imaging 程序包含兩個(gè)組件,掃描組件和圖像處理組件。掃描組件通過使用安裝的任何掃描儀來控制將文檔掃描到計(jì)算機(jī)中的過程。掃描完成后,將立即自動(dòng)對(duì)掃描文檔執(zhí)行 光學(xué)字符識(shí)別 (OCR) (OCR:將文本圖像(如掃描的文檔)轉(zhuǎn)換為實(shí)際的文本字符。也稱為文本識(shí)別。) 。您可以輕松地將多個(gè)頁面掃描到單個(gè)文件中。圖像處理組件使在屏幕上查看和處理掃描文檔變得更容易。
掃描儀驅(qū)動(dòng)程序:TWAIN 驅(qū)動(dòng)程序和 WIA 驅(qū)動(dòng)程序
大多數(shù)掃描儀使用 TWAIN 驅(qū)動(dòng)程序在掃描儀與計(jì)算機(jī)之間傳輸狀態(tài)和設(shè)置信息。在 Microsoft Windows? XP 以及更高版本中,掃描儀還可以包括 Windows 圖像采集 (WIA) 驅(qū)動(dòng)程序。Microsoft Office Document Imaging 使用這些驅(qū)動(dòng)程序來確定掃描儀的性能以及從掃描儀獲取圖像。
Document Imaging 包含一個(gè)已識(shí)別掃描儀和驅(qū)動(dòng)程序的數(shù)據(jù)庫。如果 Document Imaging 識(shí)別到掃描儀,您可以選擇在每次掃描時(shí)顯示掃描儀驅(qū)動(dòng)程序?qū)υ捒虿⒆约赫{(diào)整掃描設(shè)置,也可以讓 Document Imaging 為您管理掃描過程。
在帶有自動(dòng)文檔送紙器的掃描儀上,WIA 驅(qū)動(dòng)程序可能無法正常工作。如果掃描儀帶有自動(dòng)文檔送紙器,則應(yīng)該安裝并使用 TWAIN 驅(qū)動(dòng)程序以獲得最佳效果。
一些掃描儀使用 TWAIN 仿真驅(qū)動(dòng)程序。Document Imaging 不支持仿真驅(qū)動(dòng)程序。如果您的掃描儀使用 TWAIN 仿真驅(qū)動(dòng)程序,請(qǐng)與制造商聯(lián)系以獲取最新版本的可兼容 TWAIN 或 WIA 驅(qū)動(dòng)程序。
掃描文件的格式和壓縮
Document Imaging 使用“Microsoft Document Imaging 格式 (MDI)”或“Tag 圖像文件格式 (TIFF)”存儲(chǔ)掃描的圖像。結(jié)果文件比以“聯(lián)合圖像專家組 (JPEG)”格式存儲(chǔ)的同一圖像的文件要大。兩種格式都可用于存儲(chǔ)由 OCR 識(shí)別的文本和圖像。
Microsoft Document Imaging 格式 (MDI)
MDI 文件格式基于專為按頁面版式保存圖像而設(shè)計(jì)的 TIFF 格式。在 Document Imaging 中,您可按 MDI 格式和 IFF 格式打開和保存掃描的文件。
通常,圖像保存為 MDI 文件格式比保存為 TIFF 文件格式占用更少的磁盤空間。以 MDI 文件格式保存的圖像質(zhì)量與以 TIFF 格式保存的同一圖像的質(zhì)量相當(dāng)。
Tag 圖像文件格式 (TIFF)
TIFF 是一種適用于多種圖像處理程序(包括掃描和傳真程序)的常用格式。您可以使用多種其他圖形處理程序來打開和編輯使用 Document Imaging 創(chuàng)建的 TIFF 文件。請(qǐng)注意:只能在 Microsoft Office Document Imaging 2003 中打開或編輯 MDI 文件。如果希望與正在使用 Microsoft Office Document Imaging 2002 或其他文檔圖像處理程序的用戶共享文件,請(qǐng)將文件保存為 TIFF 格式以與其他人員使用的程序相兼容。
聯(lián)合圖像專家組 (JPEG)
JPEG 是 Web 圖形最常用的文件格式。因?yàn)?JPEG 文件具有很高的文件壓縮比,所以它們的下載速度很快。JPEG 文件使用的壓縮方法會(huì)導(dǎo)致圖像細(xì)節(jié)和清晰度方面的損失。細(xì)節(jié)的損失會(huì)影響 OCR 質(zhì)量,因此不容易得到滿意的 OCR 效果。這就是 Document Imaging 文件存儲(chǔ)為 MDI 或 TIFF 格式而非 JPEG 格式的原因。
JPEG 格式用于保存從 Document Imaging 復(fù)制到其他程序的圖像,包括使用“復(fù)制”或“復(fù)制圖像”命令(“編輯”菜單)或者“將文本發(fā)送到 Word”命令(“工具”菜單)的場(chǎng)合。Document Imaging 支持復(fù)制最大為 2 兆字節(jié) (MB) 的圖像。這意味著如果在 Document Imaging 中復(fù)制一個(gè)較大的高分辨率 (600 dpi) 圖像,粘貼圖像的圖像保真度可能會(huì)比較低,這樣可以在保留原始圖像尺寸的同時(shí)使文件大小保持在 2 MB 的限制內(nèi)。
關(guān)于壓縮和 OCR 效果的提示
Document Imaging 可用于查看使用其他程序創(chuàng)建的標(biāo)準(zhǔn) TIFF 文件。通過電子郵件或計(jì)算機(jī)上的傳真程序收到的傳真經(jīng)常存儲(chǔ)為 TIFF 文件。為了使用傳真中的文本(如將文本復(fù)制到其他程序中),您可以在 Document Imaging 中打開該 TIFF 文件,然后在“工具”菜單上,單擊“使用 OCR 識(shí)別文本”以運(yùn)行 OCR。在 Document Imaging 中保存 MDI 或 TIFF 文件時(shí),會(huì)將 OCR 信息添加到文件中并壓縮原始圖像。運(yùn)行 OCR 并保存文件后,就可以對(duì)傳真中的文本進(jìn)行搜索了。
以 300 dpi 左右的分辨率掃描圖像可獲得最佳的 OCR 效果。大多數(shù)掃描圖像的分辨率是 300 dpi,而 Document Imaging 中的默認(rèn)掃描預(yù)設(shè)被設(shè)置為 200 dpi 或 300 dpi。在 Document Imaging 中,最高可以使用 1200 dpi 的分辨率來掃描文檔。但是,將分辨率設(shè)置高于 300 dpi 會(huì)顯著增大掃描時(shí)間和文件大小,并且較高的分辨率設(shè)置不一定會(huì)獲得更好的 OCR 效果。
向多頁掃描文件中添加頁面
在 Document Imaging 中,您可以將多個(gè)文件拖動(dòng)到單獨(dú)的文件中以創(chuàng)建一個(gè)較大的文件。例如,您可以掃描上次出差或住宅建設(shè)項(xiàng)目的所有收據(jù),然后將它們放到一個(gè)文件中以便參考。如果忘記了某個(gè)收據(jù),您可以很容易地將其添加到文件中:
- 在 Document Imaging 中,打開包含先前掃描的所有收據(jù)的文件。
- 在“文件”菜單上,單擊“掃描新文檔”,然后掃描要添加的收據(jù)。
- 在“窗口”菜單上,單擊“全部重排”以顯示帶有新掃描收據(jù)的文檔和帶有先前掃描收據(jù)的文檔。
- 在新掃描收據(jù)的 縮略圖窗格 (縮略圖窗格:將當(dāng)前掃描的文檔作為一個(gè)或多個(gè)小圖像來提供。) 中,選擇該縮略圖,然后將其拖動(dòng)到帶有先前掃描收據(jù)的文檔的縮略圖窗格中。
- 請(qǐng)確保保存包含所有收據(jù)的文件。
您還可以使用縮略圖窗格來重排多頁文件中的頁面。 |