適用于 |
Microsoft Office 2003 |
Microsoft Office Document Imaging 程序包含兩個組件,掃描組件和圖像處理組件。掃描組件通過使用安裝的任何掃描儀來控制將文檔掃描到計算機中的過程。掃描完成后,將立即自動對掃描文檔執行 光學字符識別 (OCR) (OCR:將文本圖像(如掃描的文檔)轉換為實際的文本字符。也稱為文本識別。) 。您可以輕松地將多個頁面掃描到單個文件中。圖像處理組件使在屏幕上查看和處理掃描文檔變得更容易。
掃描儀驅動程序:TWAIN 驅動程序和 WIA 驅動程序
大多數掃描儀使用 TWAIN 驅動程序在掃描儀與計算機之間傳輸狀態和設置信息。在 Microsoft Windows? XP 以及更高版本中,掃描儀還可以包括 Windows 圖像采集 (WIA) 驅動程序。Microsoft Office Document Imaging 使用這些驅動程序來確定掃描儀的性能以及從掃描儀獲取圖像。
Document Imaging 包含一個已識別掃描儀和驅動程序的數據庫。如果 Document Imaging 識別到掃描儀,您可以選擇在每次掃描時顯示掃描儀驅動程序對話框并自己調整掃描設置,也可以讓 Document Imaging 為您管理掃描過程。
在帶有自動文檔送紙器的掃描儀上,WIA 驅動程序可能無法正常工作。如果掃描儀帶有自動文檔送紙器,則應該安裝并使用 TWAIN 驅動程序以獲得最佳效果。
一些掃描儀使用 TWAIN 仿真驅動程序。Document Imaging 不支持仿真驅動程序。如果您的掃描儀使用 TWAIN 仿真驅動程序,請與制造商聯系以獲取最新版本的可兼容 TWAIN 或 WIA 驅動程序。
掃描文件的格式和壓縮
Document Imaging 使用“Microsoft Document Imaging 格式 (MDI)”或“Tag 圖像文件格式 (TIFF)”存儲掃描的圖像。結果文件比以“聯合圖像專家組 (JPEG)”格式存儲的同一圖像的文件要大。兩種格式都可用于存儲由 OCR 識別的文本和圖像。
Microsoft Document Imaging 格式 (MDI)
MDI 文件格式基于專為按頁面版式保存圖像而設計的 TIFF 格式。在 Document Imaging 中,您可按 MDI 格式和 IFF 格式打開和保存掃描的文件。
通常,圖像保存為 MDI 文件格式比保存為 TIFF 文件格式占用更少的磁盤空間。以 MDI 文件格式保存的圖像質量與以 TIFF 格式保存的同一圖像的質量相當。
Tag 圖像文件格式 (TIFF)
TIFF 是一種適用于多種圖像處理程序(包括掃描和傳真程序)的常用格式。您可以使用多種其他圖形處理程序來打開和編輯使用 Document Imaging 創建的 TIFF 文件。請注意:只能在 Microsoft Office Document Imaging 2003 中打開或編輯 MDI 文件。如果希望與正在使用 Microsoft Office Document Imaging 2002 或其他文檔圖像處理程序的用戶共享文件,請將文件保存為 TIFF 格式以與其他人員使用的程序相兼容。
聯合圖像專家組 (JPEG)
JPEG 是 Web 圖形最常用的文件格式。因為 JPEG 文件具有很高的文件壓縮比,所以它們的下載速度很快。JPEG 文件使用的壓縮方法會導致圖像細節和清晰度方面的損失。細節的損失會影響 OCR 質量,因此不容易得到滿意的 OCR 效果。這就是 Document Imaging 文件存儲為 MDI 或 TIFF 格式而非 JPEG 格式的原因。
JPEG 格式用于保存從 Document Imaging 復制到其他程序的圖像,包括使用“復制”或“復制圖像”命令(“編輯”菜單)或者“將文本發送到 Word”命令(“工具”菜單)的場合。Document Imaging 支持復制最大為 2 兆字節 (MB) 的圖像。這意味著如果在 Document Imaging 中復制一個較大的高分辨率 (600 dpi) 圖像,粘貼圖像的圖像保真度可能會比較低,這樣可以在保留原始圖像尺寸的同時使文件大小保持在 2 MB 的限制內。
關于壓縮和 OCR 效果的提示
Document Imaging 可用于查看使用其他程序創建的標準 TIFF 文件。通過電子郵件或計算機上的傳真程序收到的傳真經常存儲為 TIFF 文件。為了使用傳真中的文本(如將文本復制到其他程序中),您可以在 Document Imaging 中打開該 TIFF 文件,然后在“工具”菜單上,單擊“使用 OCR 識別文本”以運行 OCR。在 Document Imaging 中保存 MDI 或 TIFF 文件時,會將 OCR 信息添加到文件中并壓縮原始圖像。運行 OCR 并保存文件后,就可以對傳真中的文本進行搜索了。
以 300 dpi 左右的分辨率掃描圖像可獲得最佳的 OCR 效果。大多數掃描圖像的分辨率是 300 dpi,而 Document Imaging 中的默認掃描預設被設置為 200 dpi 或 300 dpi。在 Document Imaging 中,最高可以使用 1200 dpi 的分辨率來掃描文檔。但是,將分辨率設置高于 300 dpi 會顯著增大掃描時間和文件大小,并且較高的分辨率設置不一定會獲得更好的 OCR 效果。
向多頁掃描文件中添加頁面
在 Document Imaging 中,您可以將多個文件拖動到單獨的文件中以創建一個較大的文件。例如,您可以掃描上次出差或住宅建設項目的所有收據,然后將它們放到一個文件中以便參考。如果忘記了某個收據,您可以很容易地將其添加到文件中:
- 在 Document Imaging 中,打開包含先前掃描的所有收據的文件。
- 在“文件”菜單上,單擊“掃描新文檔”,然后掃描要添加的收據。
- 在“窗口”菜單上,單擊“全部重排”以顯示帶有新掃描收據的文檔和帶有先前掃描收據的文檔。
- 在新掃描收據的 縮略圖窗格 (縮略圖窗格:將當前掃描的文檔作為一個或多個小圖像來提供。) 中,選擇該縮略圖,然后將其拖動到帶有先前掃描收據的文檔的縮略圖窗格中。
- 請確保保存包含所有收據的文件。
您還可以使用縮略圖窗格來重排多頁文件中的頁面。 |