PDF OCR:スキャンされたPDFをWordに変換する方法

友人が工務店を経営しているのですが、Windows95以前のワープロソフトで作成された、契約書類など約款をWordに変換する、という作業を頼まれました。元のデータファイルは5インチFDが残っているか、全く残っていないかのため、紙の書類をスキャナーを使ってフリーソフトで片っ端からPDFファイルにしたそうなのですが、いつでも編集できるデータにしたいので、すべてWordに変換して欲しいとのことです。

そこでスキャンPDFをWordに変換できるフリーソフトを探して使ってみたのですが、段組が崩れてしまったりして、上手く変換できませんでした。本来PDFファイルが編集を前提にしていないためでしょうか。

フリーソフトの限界を感じたので、有料ソフトに切り替えて探しました。いくつか見つけたのですが一番操作が簡単そうで、値段が相応のもの、ということで、PDF OCR機能付きのWondersharePDFelement 6 Proを購入しました。数千円という手軽さです。

OCRというのは文字認識処理のことで、今回のようにスキャナで読み取った画像データから作ったPDFファイルでも文字を認識することができる便利な機能です。

ちなみにOCRのプラグインなしでも文字から作られたPDFファイルならWordに変換できるのですが、スキャンPDFをWordに変換すると1枚の画像、イメージが貼りこまれたWordになるそうです。

今回はプラグインも購入して、さっそく試してみます。まず「PDFelement 6 Pro」のダウンロード版をインストールし、下記の手順に従って操作しましょう。

 

ステップ1 スキャンされたPDFを読み込む

「PDFelement 6 Pro」を起動して、ウインドウ内に読み込みたいPDFファイルをドラッグ&ドロップしてください(もしくはファイルの開くからファイルを指示)。PDFファイルが開いたら、すでに画像ではなく文字として認識されているのでPDFファイルのまま、文字を編集したりコメントをつけたりすることもできます。

PDFファイル読み込み

 

ステップ2 スキャンPDFをWordに変換開始

今回はWordで欲しいということだったので、編集はせずにそのまま、変換メニューから「Wordに」を選択し保存先を指定して実行します。
「OCRプラグインがダウンロードされていません」のメッセージが出てくるが、ダウンロードしてインストールすれば問題ありません。

PDFファイル読み込み

docxという形式のファイルです。操作としてはほんの数クリックでOCR作業が完了します。マニュアルもヘルプも一切必要ない簡単操作でした。レイアウトや文字の大きさといった情報もきちんと渡っていて、元のスキャンPDFと変わらないWordファイルを作ることができました。

「PDFelement 6 Pro」はPDFに対するさまざまな編集機能があるようなので、これからいろいろ試してみようと思います。
 

PDFelement 6 Pro

Wondershare PDFelement6

All-in-oneのPDF万能ソフト

Officeライクの操作感覚 初心者もすぐ使える

PDF変換、作成、編集、OCR、注釈、フォーム、保護…

・ 第19回、第24回VectorプロレジPDF部門受賞

・ 標準版からプロ版まで、幅広いのニーズに対応

・ 学生向け優待価格あり

・ 7x12h体制アフターサービス

Wondershare Editor

編集者 カテゴリ:
作成日: Apr 02,2017 19:06 pm / 更新日: Apr 17,2017 10:25 am

お問い合わせ

この文書または製品に関するご不明/ご意見がありましたら、 サポートセンター よりご連絡ください。ご指摘をお待ちしております!

Home > PDF-OCR > PDF OCR:スキャンされたPDFをワードに変換する方法
All-In-OneのPDFソフト
ワンランク上のPDF作業体験を。

5,980 円から 永久ライセンス

無料体験 購入する
Top