Home > PDF変換 > スキャンされたPDFもTXTに変換可能!→

PDFテキスト抽出に役立つ~スキャンされたPDFをTXTに変換するには?

「スキャンされたPDFのテキストだけを抽出したい!TXT形式みたいに画像や様式が入らないのが望ましい。何か良い方法ありますか。」

以前の記事で、スキャンされたPDFファイルを編集可能にする方法を紹介いたしましたが、「編集にとどまらず、TXTのように様式が入らないように抽出したい」という声をいただきました。他のところへコピー・ペーストする時の面倒をできるだけ避けたいでしょう。なかなか効率重視の方ですね。

そして本日はこういう方のために、スキャンされたPDFのテキストを画像や様式が入らないように抽出する方法、つまりTXTに変換する方法を紹介いたします。
使うソフトは前回と同じく、ワンダーシェアー社の「PDFelement」です。まずは無料ダウンロードして、下記の手順に従って変換してみましょう。

Step 1. 「PDFelement」を起動し、TXTまで変換したいスキャンされたPDFファイルを開きます;

スキャンしたPDFのテキストを抽出




PDFelementで、スキャンした PDF ファイルを開きます。

Step 2. OCRプラグインのダウンロード、インストールを行います;

スキャンしたPDFからテキスト抽出

スキャンされたPDFをTXTに変換するにはOCR処理が必要となりため、スキャンされたPDFファイルの追加が検出された場合、「OCRプラグインがインストールされていません」とのメッセージができます。 「ダウンロード」ボタンをクリックし、OCRプラグインをダウンロードし、インストールしましょう。

Step 3. OCRを実行します;

スキャンしたPDFからテキストを抽出

OCRのインストールが完了後、内容によって言語やページのカスタマイズを設定します。設定完了後、「次」をクリックし、OCRを実行します。変更プロセスには時間がかかります。

Step 4. OCRの実行が完了後、PDFをTXTへ変換します。

スキャンされたPDFからテキストを抽出

OCRの実行が完了後、ファイルを保存します。「ホーム」タグをクリックすると、ツールバーに入ります。「他の形式」のボタンをクリックします。ここでは、「テキストに変換」をクリックします。変換が完了後、保存先で変換後のTXTファイルを確認しましょう!元のスキャンされたPDFファイルになる画像やテキストの様式がTXTファイルでクリアされ、テキストのみが変換されましたため、他のところへのコピー・ペーストが便利になりますね。

いかがでしょうか。もともと編集不能のPDFファイルも編集可能になっただけではなく、ちゃんとテキストも抽出されました。

そしてスタイリッシュなユーザーフェース、操作画面のわかりやすさもさぞご共感でしょう。下記よりダウンロードし、早速PDFをTXTに変換してみては?


合わせて読む

画像から文字を抽出する便利なツール8選をご紹介>>
PDFのテキストをコピー&ペーストしたときに文字化けしてしまう原因と対処法>>
簡単にPDFから文字を抽出する三つの方法、無料方法もある!>>


PDF編集はこれ1本でOK | PDFelement

Wondershare PDFelement

スマートに、シンプルに、AI 搭載 PDF ソリューション

・ 第19回、24回、29回Vectorプロレジ部門賞受賞

・ 標準版からプロ版まで、幅広いのニーズに対応

・ Windows、Mac、iOS、Android、クラウドに対応

・ 7x12h体制アフターサービス

役に立ちましたか?コメントしましょう!

登録 / ログイン してからコメントを書いてください
user
{{item.name || userName}}
{{item.time}}
{{item.message}}
{{item.likes}} 返信をキャンセルする 返信
登録 / ログイン してからコメントを書いてください
user
{{item1.type == 2 ? authName : item1.name ? item1.name : userName}}
{{item1.time}}
@{{item1.reply_to_type == 2 ? authName : item1.reply_to_name ? item1.reply_to_name : userName}} {{item1.message}}
{{item.likes}} 返信をキャンセルする 返信
登録 / ログイン してからコメントを書いてください

作成日: 2017-03-29 17:36:07 / 更新日: 2023-12-13 11:26:19

星野

編集者

お問い合わせ

この文書または製品に関するご不明/ご意見がありましたら、 サポートセンター よりご連絡ください。ご指摘をお待ちしております!

スマートに、シンプルに、
AI搭載PDFソリューション