PDFelement - PDF編集、変換、署名...

PDF文書はパソコンやモバイル機器で文書を表示・印刷させるためのファイル形式で、テキストと画像の情報が埋め込まれています。PDFファイルにテキストとして組み込まれている文字情報の全部または部分的に取り出して、テキストエディターなどに書き出すことができます。最も簡単な方法はコピーペーストで、大抵の場合は問題なく文字だけを取り出すことができます。
もしも元のファイルに組み込まれたテキストに特殊なフォントが使われていたり、フォントのデータが正しく埋め込まれていないか編集された際に破壊された場合には、正しく表示されていても文字化けを起こすことがあります。
PDF文書に表示されている文字がテキストとしてではなく、画像の一部としてファイルに組み込まれている場合にも、コピー&ペーストで書き出すことができません。このような場合には、コピー&ペースト以外の方法でテキストを書き出すことができます。
その問題を解決できるPDFツールをダウンロードしましょう。
ディスプレイで正しく表示されているまたは印刷ができるのに、PDF中の文字をコピー&ペーストをすると文字化けが発生する場合があります。文字がテキスト情報としてPDFファイルに組み込まれている場合には、フォントの種類またはフォントが破壊されている可能性があります。
このような場合には、PDF readerを利用してテキストとして保存してみることができます。最新のAdobe Readerかその他の閲覧ソフトを利用すれば、PDFの文書に埋め込まれたフォントの文字がテキストファイルとしてパソコンに保存することができます。Googleアカウントを持っている方であれば、Googleドキュメント機能を利用してテキストを取り出すこともできます。ブラウザ上でGoogleドライブにアクセスしてファイルをアップロードして、右クリックして「アプリで開く」「Googleドキュメント」を選択します。Googleドキュメントを利用すれば、10ポイント以上の文字であればテキストに変換することができますが、小さな文字や一部のフォントは正しく認識できません。
PDFファイルをテキストとして保存しても文字化けが発生する場合には、文字がフォントとして組み込まれていない可能性があります。文字が画像の一部としてファイルに組み込まれている場合には、コピー&ペーストはできませんが文書ファイルは正常に印刷することができます。画像として保存されている文字をテキストデータとして取り出すためには、専用のソフトウェアのOCR機能を使用する必要があります。
PDFelement 6 Pro(Win)を利用すれば、Windowsパソコン上でOCR機能を使用して画像として埋め込まれている文字を、テキストデータとして組み込まれたPDFファイルを作成することができます。
PDFelement 6 Proは、スキャナーから読み込んだ文書中に含まれる画像データから文字を認識して、テキストデータとしてPDFファイルに組み込むことができるOCR機能が利用できます。OCR機能を利用してテキストを書き出す手順ですが、文書をプリントアウトしてからスキャナーにセットします。PDFelement 6 Pro(Win)を起動してツールバーの「ホーム」を選択します。「スキャナから」ボタンをクリックすると設定画面が表示されるのでスキャナーを選択し、下側にある「テキストを認識」にチェックを入れて「スキャン」をクリックします。スキャンが終了したらファイル名を指定してPDFファイルを保存します。作成されたファイルには文字がテキストとして組み込まれているため、コピー&ペーストで書き出すことができます。
PDFelement 6 Pro(Win)を利用すれば、PDFファイルの文字をテキストとして正しく書き出すことができない場合でもOCR機能を利用してテキストに変換することができます。PDF中に文字をコピーするときに文字化けを防ぐために、そのPDFソフトをおすすめします。 PDFelement 6 Pro(Win)は文字認識の成功率が高く、Googleドキュメントで正しく変換することができない場合にも利用できます。
この文書または製品に関するご不明/ご意見がありましたら、 サポートセンター よりご連絡ください。ご指摘をお待ちしております!