日常の仕事にデジタル文書形式のPDF、Webサイトや取引先から入手したPDFはいつも困るでしょう?また、新聞・雑誌の多くは、単に文字が同じ並び方で並んでいるのではなく、段組みやコラムがあり、表や図があり、標題があります。閲覧・印刷用だけに困るのはそのデータの再利用でしょう?この場合再利用したい時はどうしたらよいでしょうか? 「PDFelement 6 Pro」をお勧めします。「PDFelement 6 Pro」は PDFファイル変換・編集ソフトです。その中のOCR機能で従来画像として出力されていた文字を、編集可能な文字として出力可能です。
OCR機能を利用することで、フォントが埋め込まれていて文字コードがないPDFからも文字を認識して変換することが可能です。今回は、「PDFelement 6 Pro」のOCR機能で画像化のPDFデーダ抽出・変換する方法をご紹介いたします。
Step1. 「PDFelement 6 Pro」とOCRプラグインのインストール
『PDFelement 6 Pro』をダウンロードして、インストールしてください。
起動後、「編集」→→「OCR」から、OCRプラグインをダウンロードしてインストールしてください。
Step2. 画像形式、あるいはスキャンされたPDFファイルの読み込む
PDFをドラッグ&ドロップでこのソフトのウィンドウに落とすか、『開く』ボタンからファイルを選んで、変換したい画像化のPDFファイルを選択・登録できます。
複数のPDFファイルを一括で読み込みできます。
Step3. 画像化のPDFデーダを出力する前に、出力形式とOCR機能を設定
「ホーム」タグから、「Word形式に」または「他の形式に」で出力ファイル形式を選びます。Word、Excel、PowerPoint、画像、EPUB、HTML、TEXT、RTFなどで出力することができます。変換したいファイル形式をクリックすれば相応形式に変換してくれます。変換する前に、OCR設定を行うのが必要です: 出力形式を選択した後、出てきたウィンドウに「設定」をクリックして、「OCR機能」→「スキャンされたPDFファイルのみ」を選択し、「OK」をクリックします。
Step4. 画像化のPDFを他の形式に変換開始
OCR設定が終わったら、保存先を設定し「保存」をクリックして、変換が始まります。
数秒後にファイルが変換完了ということを知らせる画面が表示されます。画像化のPDFから変換されたファイルは編集可能です。
以上はOCR機能付きのPDF編集・変換ソフトで、画像化のPDFを編集う可能のファイル形式に変換する操作手順でした。簡単でしょう。
「PDFelement 6 Pro」は文字認識可能なOCR機能を付き、文字が画像化されてしまったPDFに対しても、画像からテキスト情報を抽出して、PDFを各形式ファイル(Word、Excel、PowerPoint、Epub、HTML、Text、画像jpegなど)への高精度変換も可能です。
今すぐ無料でダウンロードして試してみましょう。