スキャンされたPDFもTXTに変換可能!→

PDFテキスト抽出に役立つ~スキャンされたPDFをTXTに変換する方法

Home > PDF変換 > スキャンされたPDFもTXTに変換可能!→

「スキャンされたPDFのテキストだけを抽出したい!TXT形式みたいに画像や様式が入らないのが望ましい。何か良い方法ありますか。」

以前の記事で、スキャンされたPDFファイルを編集可能にする方法を紹介いたしましたが、「編集にとどまらず、TXTのように様式が入らないように抽出したい」という声をいただきました。他のところへコピー・ペーストする時の面倒をできるだけ避けたいでしょう。なかなか効率重視の方ですね。

そして本日はこういう方のために、スキャンされたPDFのテキストを画像や様式が入らないように抽出する方法、つまりTXTに変換する方法を紹介いたします。
使うソフトは前回と同じく、ワンダーシェアー社の「PDFelement 6 Pro」です。まずは無料ダウンロードして、下記の手順に従って変換してみましょう。

Step 1. 「PDFelement 6 Pro」を起動し、TXTまで変換したいスキャンされたPDFファイルを開きます;

PDFelementでPDF履歴書を編集する




PDFelement 6 Pro で、スキャンした PDF ファイルを開きます。

Step 2. OCRプラグインのダウンロード、インストールを行います;

PDFelementでPDF履歴書を編集する

スキャンされたPDFをTXTに変換するにはOCR処理が必要となりため、スキャンされたPDFファイルの追加が検出された場合、「OCRプラグインがインストールされていません」とのメッセージができます。 「ダウンロード」ボタンをクリックし、OCRプラグインをダウンロードし、インストールしましょう。

Step 3. OCRを実行します;

PDFelementでPDF履歴書を編集する

OCRのインストールが完了後、内容によって言語やページのカスタマイズを設定します。設定完了後、「次」をクリックし、OCRを実行します。変更プロセスには時間がかかります。

Step 4. OCRの実行が完了後、PDFをTXTへ変換します。

PDFelementでPDF履歴書を編集する

OCRの実行が完了後、ファイルを保存します。「ホーム」タグをクリックすると、ツールバーに入ります。「他の形式」のボタンをクリックします。ここでは、「テキストに変換」をクリックします。変換が完了後、保存先で変換後のTXTファイルを確認しましょう!元のスキャンされたPDFファイルになる画像やテキストの様式がTXTファイルでクリアされ、テキストのみが変換されましたため、他のところへのコピー・ペーストが便利になりますね。

    いかがでしょうか。もともと編集不能のPDFファイルも編集可能になっただけではなく、ちゃんとテキストも抽出されました。

    そしてスタイリッシュなユーザーフェース、操作画面のわかりやすさもさぞご共感でしょう。下記よりダウンロードし、早速PDFをTXTに変換してみては?

PDFelement 6 Pro

Wondershare PDFelement6

All-in-oneのPDF万能ソフト

Officeライクの操作感覚 初心者もすぐ使える

PDF変換、作成、編集、OCR、注釈、フォーム、保護…

・ 第19回、第24回VectorプロレジPDF部門受賞

・ 標準版からプロ版まで、幅広いのニーズに対応

・ 学生向け優待価格あり

・ 7x12h体制アフターサービス

この記事はお役に立ちましたか?

Wondershare Editor

編集者 カテゴリ:
作成日: Mar 29,2017 17:36 pm / 更新日: Jun 09,2017 15:27 pm

お問い合わせ

この文書または製品に関するご不明/ご意見がありましたら、 サポートセンター よりご連絡ください。ご指摘をお待ちしております!

All-In-OneのPDFソフト
ワンランク上のPDF作業体験を。

9,980 円から 永久ライセンス

無料体験 購入する
Top