久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    如何將PDF文件轉換為文本文件(txt/word)匯總

     dj8888 2012-07-04

    如何將PDF文件轉換為文本文件(txt/word)匯總  

    2009-12-27 09:40:11|  分類: 默認分類 |字號 訂閱

     

     

    如何將PDF文件轉換為文本文件(txt/word)匯總

         1.在pc中打開PDF -—>打印,選擇 Microsoft office document image writer —>保存文件.mdi格式,打開文件-> 工具->使用ORC識別文本即可

         2.(適合大量文本,少量的不如自己打字了)將圖片中的文字轉換為TXT文本。

    首先保證你的機器上裝有PHOTOSHOP,再從網上下一個清華紫光的OCR識別軟件安裝好。

    打開PS,從文件-導入-PDF圖像找到你需要的處理的文件全部導入后,將需要處理的頁面

    保存為BMP或者TIF文件后。打開OCR識別軟件,將圖片調入后進行識別,識別出來后保存就

    可以了,程序自動將其保存為TXT文件。有一點需要說明:兩個軟件處理的時候會將每一個

    頁面保存為每一個文件。如果文檔為英文且字體比較小的話識別時會有些錯誤。比如會將

    i識別為l之類,在識別后你可以對照修改再保存。

       3.現在有很多“PDF”轉換為“TXT”的軟件,不是對中文支持不好,就是共享軟件,需要注冊才可以使用全部功能。其實并不需要第三方軟件,用百度的硬盤搜索,也可以免費將PDF轉換為文本文件。

    第一步:首先進入百度硬盤搜索的主界面,在文檔下選擇PDF(免費下載硬盤搜索程序:http://disk.baidu.com/) 

    第二步:接下來輸入文件所在的目錄,點擊“在結果中查找”按鈕,會在下面顯示出所要尋找的PDF文件

    第三步:在要進行轉換的PDF文件右邊點擊“快照”按鈕,就會以純文本的形式將文件內容顯示出來。需要做的就是將文件內容復制,并且粘貼到記事本中保存,這樣就可以將PDF的內容轉換成TXT純文本了

    4. Office2003實現PDF文件轉Word文檔

             經過嘗試,發現可以利用 Office 2003 中的 Microsoft Office Document Imaging 組件來實現PDF轉WORD文檔,也就是說利用WORD來完成該任務。方法如下:

               用Adobe Reader 打開想轉換的PDF文件 ,接下來 選擇 “文件→打印”菜單,在打開的“打印”窗口中將 “打印機”欄中的名稱設置為 “Microsoft Office Document Image Writer”,確認后將該PDF文 件輸出為 MDI格式的虛擬打印文件 。

              注: 如果沒有找到“Microsoft Office Document Image Writer”項,使用Office 2003安裝光盤中的“添加/刪除組件”更新安裝該組件,選中“Office 工具 Microsoft DRAW轉換器”。

              然后, 運行 “Microsoft Office Document Imaging”,并利用它來 打開 剛才保存的MDI文件,選擇“工具→ 將文本發送到Word ”菜單,在彈出的窗口中選中“ 在輸出時保持圖片版式不變 ”,確認后系統會提示“必須在執行此操作前重新運行 OCR 。這可能需要一些時間”,不管它, 確認 即可。

               注: 對PDF轉DOC的識別率不是特別完美,轉換后會丟失原來的排版格式,所以轉換后還需要手工對其進行排版和校對工作。

                       以上僅在 word2003 中可用,其他版本沒有Microsoft Office Document Image Writer。

           5.下載PDF2TXT軟件轉換器程序PDF2TXT v3.1 漢化版,下載地址:http://www./soft/dl008198.html(內附漢化補丁+英文原版軟件)破解注冊碼:71C5I$$@GQTKXO29

    補:

      1、Doc格式文件轉換為Pdf文件

      Doc文件向Pdf格式轉換還是比較容易的,主要通過Adobe 公司提供的Adobe Distiller虛擬服務器實現的,在安裝了Adobe Acrobat完全版后,在Windows系統的打印機任務中就會添加一個Acrobat Distiller打印機,如圖1所示:

    如何將PDF文件轉換為文本文件(txt/word)匯總 - fzls - fzls

    圖1

      現在比較流行的DoctoPdf類軟件如Pdfprint等的機理都是調用Adobe Distiller打印機實現的,如果想把一個Doc文件轉換為Pdf文件,只要用Office Word打開該Doc文件,然后在“文件”—>“打印”中選擇Acrobat Distiller打印機即可,如圖2所示:

    如何將PDF文件轉換為文本文件(txt/word)匯總 - fzls - fzls

    圖2

    這樣,就可以很輕松的將Doc格式的文件轉換為Pdf文件。

      2、Pdf格式文件轉換為Doc文件

      Pdf格式文件向Doc文件轉換相對比較難,因為Pdf格式與Doc格式解碼格式不同,在Pdf下的回車符、換行符以及相關的圖片格式無法直接轉換為Doc文件,筆者之前一直使用復制文本,然后粘貼到Word中實現Pdf向Doc格式的轉換。

      今天突然發現了一款非常好的Pdf向Doc格式轉換的工具,ScanSoft PDF Converter for Microsoft Word v1.0。它是由ScanSoft公司同微軟共同組隊開發了一個全新的Office 2003 插件。該插件可以幫助你通過Word直接將Pdf文檔轉換為Word文檔,并且完全保留原來的格式和版面設計。

      這個名為 ScanSoft PDF Converter for Microsoft Word 的插件是首先捕獲Pdf文檔中的信息,分離文字同圖片,表格和卷,再將其統一到Word格式。現在你可以重新利用早先你從網絡上下載或Email中收到的Pdf文件中的信息,而無需添加任何其他軟件。

      ScanSoft PDF Converter for Microsoft 已經非常緊密的同Office 2003整合在一起了,有兩種方式可以將Pdf格式轉換成Doc文件。

      第一種方式,在Microsoft Word 2003中你可以直接通過“文件”—>“打開”來打開Pdf文件。ScanSoft PDF Converter for Microsoft Word插件會自動彈出了,如圖3所示,經過轉換后我們就可以得到想要的Doc文件。

    如何將PDF文件轉換為文本文件(txt/word)匯總 - fzls - fzls

    圖3

      第二種方式,ScanSoft公司也已經開發了基于此的Smart Tag(Office 2003中重要的功能元件)能夠輕松的通過右鍵來將PDF文件轉換成為 Microsoft Word 文件(如圖4所示)。

    如何將PDF文件轉換為文本文件(txt/word)匯總 - fzls - fzls

    圖4

      注意,在安裝ScanSoft PDF Converter for Microsoft Word的時候建議關閉正在運行的Office Word,Internet Explorer和Outlook等軟件。

    在 Microsoft Office Document Imaging 2003 中使用掃描儀

    2009-04-22 12:01

    適用于
    Microsoft Office 2003

    Microsoft Office Document Imaging 程序包含兩個組件,掃描組件和圖像處理組件。掃描組件通過使用安裝的任何掃描儀來控制將文檔掃描到計算機中的過程。掃描完成后,將立即自動對掃描文檔執行 光學字符識別 (OCR) (OCR:將文本圖像(如掃描的文檔)轉換為實際的文本字符。也稱為文本識別。) 。您可以輕松地將多個頁面掃描到單個文件中。圖像處理組件使在屏幕上查看和處理掃描文檔變得更容易。

    掃描儀驅動程序:TWAIN 驅動程序和 WIA 驅動程序

    大多數掃描儀使用 TWAIN 驅動程序在掃描儀與計算機之間傳輸狀態和設置信息。在 Microsoft Windows? XP 以及更高版本中,掃描儀還可以包括 Windows 圖像采集 (WIA) 驅動程序。Microsoft Office Document Imaging 使用這些驅動程序來確定掃描儀的性能以及從掃描儀獲取圖像。

    Document Imaging 包含一個已識別掃描儀和驅動程序的數據庫。如果 Document Imaging 識別到掃描儀,您可以選擇在每次掃描時顯示掃描儀驅動程序對話框并自己調整掃描設置,也可以讓 Document Imaging 為您管理掃描過程。

    在帶有自動文檔送紙器的掃描儀上,WIA 驅動程序可能無法正常工作。如果掃描儀帶有自動文檔送紙器,則應該安裝并使用 TWAIN 驅動程序以獲得最佳效果。

    一些掃描儀使用 TWAIN 仿真驅動程序。Document Imaging 不支持仿真驅動程序。如果您的掃描儀使用 TWAIN 仿真驅動程序,請與制造商聯系以獲取最新版本的可兼容 TWAIN 或 WIA 驅動程序。

    掃描文件的格式和壓縮

    Document Imaging 使用“Microsoft Document Imaging 格式 (MDI)”或“Tag 圖像文件格式 (TIFF)”存儲掃描的圖像。結果文件比以“聯合圖像專家組 (JPEG)”格式存儲的同一圖像的文件要大。兩種格式都可用于存儲由 OCR 識別的文本和圖像。

    Microsoft Document Imaging 格式 (MDI)

    MDI 文件格式基于專為按頁面版式保存圖像而設計的 TIFF 格式。在 Document Imaging 中,您可按 MDI 格式和 IFF 格式打開和保存掃描的文件。

    通常,圖像保存為 MDI 文件格式比保存為 TIFF 文件格式占用更少的磁盤空間。以 MDI 文件格式保存的圖像質量與以 TIFF 格式保存的同一圖像的質量相當。

    Tag 圖像文件格式 (TIFF)

    TIFF 是一種適用于多種圖像處理程序(包括掃描和傳真程序)的常用格式。您可以使用多種其他圖形處理程序來打開和編輯使用 Document Imaging 創建的 TIFF 文件。請注意:只能在 Microsoft Office Document Imaging 2003 中打開或編輯 MDI 文件。如果希望與正在使用 Microsoft Office Document Imaging 2002 或其他文檔圖像處理程序的用戶共享文件,請將文件保存為 TIFF 格式以與其他人員使用的程序相兼容。

    聯合圖像專家組 (JPEG)

    JPEG 是 Web 圖形最常用的文件格式。因為 JPEG 文件具有很高的文件壓縮比,所以它們的下載速度很快。JPEG 文件使用的壓縮方法會導致圖像細節和清晰度方面的損失。細節的損失會影響 OCR 質量,因此不容易得到滿意的 OCR 效果。這就是 Document Imaging 文件存儲為 MDI 或 TIFF 格式而非 JPEG 格式的原因。

    JPEG 格式用于保存從 Document Imaging 復制到其他程序的圖像,包括使用“復制”或“復制圖像”命令(“編輯”菜單)或者“將文本發送到 Word”命令(“工具”菜單)的場合。Document Imaging 支持復制最大為 2 兆字節 (MB) 的圖像。這意味著如果在 Document Imaging 中復制一個較大的高分辨率 (600 dpi) 圖像,粘貼圖像的圖像保真度可能會比較低,這樣可以在保留原始圖像尺寸的同時使文件大小保持在 2 MB 的限制內。

    關于壓縮和 OCR 效果的提示

    Document Imaging 可用于查看使用其他程序創建的標準 TIFF 文件。通過電子郵件或計算機上的傳真程序收到的傳真經常存儲為 TIFF 文件。為了使用傳真中的文本(如將文本復制到其他程序中),您可以在 Document Imaging 中打開該 TIFF 文件,然后在“工具”菜單上,單擊“使用 OCR 識別文本”以運行 OCR。在 Document Imaging 中保存 MDI 或 TIFF 文件時,會將 OCR 信息添加到文件中并壓縮原始圖像。運行 OCR 并保存文件后,就可以對傳真中的文本進行搜索了。

    以 300 dpi 左右的分辨率掃描圖像可獲得最佳的 OCR 效果。大多數掃描圖像的分辨率是 300 dpi,而 Document Imaging 中的默認掃描預設被設置為 200 dpi 或 300 dpi。在 Document Imaging 中,最高可以使用 1200 dpi 的分辨率來掃描文檔。但是,將分辨率設置高于 300 dpi 會顯著增大掃描時間和文件大小,并且較高的分辨率設置不一定會獲得更好的 OCR 效果。

    向多頁掃描文件中添加頁面

    在 Document Imaging 中,您可以將多個文件拖動到單獨的文件中以創建一個較大的文件。例如,您可以掃描上次出差或住宅建設項目的所有收據,然后將它們放到一個文件中以便參考。如果忘記了某個收據,您可以很容易地將其添加到文件中:

    1. 在 Document Imaging 中,打開包含先前掃描的所有收據的文件。
    2. 在“文件”菜單上,單擊“掃描新文檔”,然后掃描要添加的收據。
    3. 在“窗口”菜單上,單擊“全部重排”以顯示帶有新掃描收據的文檔和帶有先前掃描收據的文檔。
    4. 在新掃描收據的 縮略圖窗格 (縮略圖窗格:將當前掃描的文檔作為一個或多個小圖像來提供。) 中,選擇該縮略圖,然后將其拖動到帶有先前掃描收據的文檔的縮略圖窗格中。
    5. 請確保保存包含所有收據的文件。

    您還可以使用縮略圖窗格來重排多頁文件中的頁面。

      本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發現有害或侵權內容,請點擊一鍵舉報。
      轉藏 分享 獻花(0

      0條評論

      發表

      請遵守用戶 評論公約

      類似文章 更多

      主站蜘蛛池模板: 国产精品国产三级国产试看| 人人人妻人人澡人人爽欧美一区 | 色欲国产精品一区成人精品| 日韩在线成年视频人网站观看| 成人免费一区二区三区| 日本福利一区二区精品| 日韩AV高清在线看片| 好男人官网资源在线观看| 无码人妻丝袜在线视频红杏| 欧美人与动人物牲交免费观看久久| 国产小受被做到哭咬床单GV| 日韩欧美群交P内射捆绑| 中文字幕精品人妻丝袜| 久久久国产精品VA麻豆| 中国熟妇毛多多裸交视频| 久久夜色撩人精品国产小说| 羞羞影院午夜男女爽爽免费视频| 久久精品国产免费观看三人同眠 | 成人免费无遮挡在线播放| 东京热TOKYO综合久久精品| 亚洲国产中文字幕精品| 人妻丰满熟妇AV无码区动漫| 亚洲欧美日韩在线码| 人妻 日韩 欧美 综合 制服| 国产乱了伦视频大全亚琴影院| 久久精品国产99国产精品澳门 | 又爽又黄又无遮掩的免费视频| 男人扒开女人内裤强吻桶进去 | 亚洲欧美偷拍另类A∨| 福利一区二区在线播放| 久久99精品久久久久久动态图| 欧洲免费一区二区三区视频| 日韩精品一区二区三区视频| 国产成人欧美日本在线观看| 又湿又紧又大又爽A视频男| 精品人妻少妇嫩草AV无码专区| 夜色福利站WWW国产在线视频| 办公室强奷漂亮少妇视频| 亚洲乱码无码永久不卡在线| 激情 自拍 另类 亚洲| 亚洲一区久久蜜臀av|