PDFファイル内の文字を検索したいと思ったときに、「やり方がわからない」とあきらめたことはありませんか。
また、やり方はわかっているけれど、「検索ができる場合と、できない場合がある」という経験をお持ちの方もいらっしゃるのではないでしょうか。
この記事ではPDF内の文字を検索する方法をいろいろご紹介します。またできない場合もその原因と解決方法を解説します。PDF内を自由に検索できるようになってオフィスの生産性を上げましょう。
プライバシー保護 | マルウェアなし | 広告なし
目次
Part1:専門ソフトを利用しPDF内の文字を検索する方法
PDFを扱うための専門ソフトもいくつかあります。これらの専門ソフトを使用してPDF内の文字を検索する方法をご紹介しましょう。
方法① : PDFelement
既存のワードファイルやエクセルファイル、写真データなどをPDFに変換する際には、PDF編集ソフトを利用するのが一番簡単です。今回は、「PDFelement」(PDFエレメント)は、普通の検索機能のほかに、もっと高度な検索機能も備えています。まずは、前段と同じ検索を行う方法を解説します。
Step1. PDFelementで、該当のPDFを開いた状態です。
検索するには、左のメニューの虫めがねアイコンをクリックします。
Step2. 検索フィールドに「二酸化炭素」と入力して、右の虫めがねアイコンをクリックします。
Step3. 検索結果が左の列に表示されました。
左の検索結果をクリックすると該当箇所に飛ぶこともできます。ハイライトはオレンジ色です。このように非常に簡単に検索ができます。
プライバシー保護 | マルウェアなし | 広告なし
今、検査をする虫めがねのアイコンを使いましたが、この左側のメニューにある他のアイコンもいろいろなものの検索ができて便利です。
➤ブックマーク
このメニューアイコンは「ブックマーク」といいます。使い方をご説明しましょう。
文書を読んでいて、「後でもう一度ここを見ることがあるだろう」と思うことがあります。紙の本であれば、しおりを挟んだり付箋を貼ったりするところですが、PDFelementではこの「ブックマーク」を使います。
➬あわせて読みたい:pdfにしおりを作成して目次から参照できるようにするブックマーク機能
➤添付ファイル
このメニューアイコンは「添付ファイル」です。PDFelementでは、添付ファイルもつけることができます。関連性の高い他のPDFや写真などを添付する使い方もあるでしょう。添付されたファイルはこの「添付ファイル」アイコンで追加したり、確認したりすることができます。
➬あわせて読みたい:PDF文書にWordやExcelなどの添付ファイルを追加する方法
プライバシー保護 | マルウェアなし | 広告なし
方法② :Foxit
Foxit社は、独⾃のPDFエンジンにより世界シェア2位を誇るPDFテクノロジーのリーディングカンパニーです。ここで利用するのはFoxitReaderです。
Step1. FoxitReaderで、目的のPDFを開きます。
Step2. メインメニューから「注釈」→「検索してハイライト」とクリックして、右側に検索の列で検索したい言葉を入力します。
ここでは、「二酸化炭素」と入れてみました。
Step3. すぐに検索結果が表示されました。
25件見つかっています。見つかった箇所は青くハイライトして表示されています。右側に検索した単語が存在する箇所のチェックリストがあり、チェックボックスにチェックするとその箇所に飛ぶことができます。
方法③: PDF-XChange Editor
PDF-XChange Editorはカナダ製のPDF編集ソフトです。試用版として無料でダウンロードできます。編集後、印刷しようとすると透かしが入るなど制限事項はありますが、一通りすべての機能が使用できます。それでは検索してみましょう。
Step1. 目的のファイルを開いてみましょう。
Step2. 「ファイル」→「その他のツール」→「検索」→「検索」とクリックしていきます。
Step3. 右上の窓に検索フィールドができ来ます。ここでは先ほど同様「二酸化炭素」を検索してみましょう。
Step4. 二酸化炭素で検索ができました。該当の箇所は青のハイライト表示がされています。
検索個数や、該当箇所に飛ぶ機能はなく、下矢印マークをクリックして順番にみていくことができます。左のサムネール画面を広げて出しますと該当箇所がどのあたりなのかがわかるようになっています。
Part2: 無料でPDF内の文字を検索する方法
特別な、ソフトウェアを必要としなくても無料でPDF内のテキストを検索する方法をご紹介しましょう。
A : WordでPDFファイルを開きテキストを検索する方法
いつも使っているWordでPDFを開いて文字検索や編集ができます。その方法を解説しましょう。今回の説明で使用するPDFは気象庁からWEBに公開されている文書です。
https://www.data.jma.go.jp/cpdinfo/chishiki_ondanka/pdf/all.pdf (地球温暖化に関する知識 2021年10月 気象庁)
WordでPDFファイルを読み込むと、自動的に編集できる形式に変換して読み込んでくれます。実際にやってみましょう。
Step1. まずWordでPDFファイルを開きます。
開こうとすると、このようなメッセージが出ます。PDFの表示は多少崩れて完全に同じにはならないことがあります。今回はこのまま読み込みます。
Step2. PDFがWord文書に変換されました。中身を見てみましょう。
Step3. 検索できる状態で、検索してみます。
このPDFは最初からテキスト情報が入っていましたので、文字はきれいに変換されています。改行の位置などが崩れた箇所があるものの、読むことには支障ありません。
Step4. 「北極」で検索してみます。
このようにPDFを読み込んでもWord文書として内部を検索できる状態になります。
B : Macの「プレビュー」でPDFのテキストを検索する方法
Macでは、標準でインストールされている「プレビュー」でPDFを開いて検索ができます。
▶メリット:
|
Part3:PDFで文字が検索できない原因と解決方法
PDFで文字が検索できないものを見かけることがあります。それは多くの場合文字が画像になっていることによります。
例えば、「気候変動」という言葉で試しに検索してみます。結果は「0」です。
(地球温暖化による人類の生存環境と環境リスクに関する研究-地球環境研究総合推進費シンポジウム報告書-環境庁国立環境研究所)
https://www.nies.go.jp/kanko/gyomu/pdf/f056-1993.pdf
コンピュータで扱う文字は、文字コードというものによって表示されています。PDFの中に文字コードが無い場合は、文字が入っていないものとして取り扱われるため、検索もできないのです。
こうした、「読めても検索できない」PDFに出会ってしまった場合でも、解決方法はあります。
今回サンプルとして使わせていただくのは完全に紙の文書をスキャンしたPDFで、文字が入っていません。PDFelementでPDF内を検索できるようにすることを目的として、対策してみましょう。
こういうPDFにはOCR処理をかけると、文字が認識されるようになります。OCR処理をかけてみましょう。
プライバシー保護 | マルウェアなし | 広告なし
Step1. メインメニュー「ツール」→「OCR処理」とクリックします。
「OCR PDF」のダイアログボックスが表示されます。画像になっている文字をテキストデータにするのですが、これには次の2通りの方法があります。
① スキャンして編集可能なテキストに変換
② 画像をスキャンして検索可能なテキストに変換
ここでは検索することが目的ですので、スキャンのみで文字のフォント置き換えはしないことにします。
Step2. 準備できたら「適用」ボタンをクリックします。OCR処理が開始されます。
PCの性能によりますがこの文書は 67ページありますので、結構時間がかかります。
Step3. OCRが終了しました。名前を付けて保存してください。
OCRでテキストデータができたPDFは元のファイルとは違うものになりますので、新しいファイルとして「(元のファイル名)OCR.PDF」ができます。
では、検索してみましょう。
Step4. 虫めがねアイコンをクリックして、再び「気候変動」と入力、検索してみます。
「4 結果」とでて4か所に「気候変動」という単語が見つかりました。結果が表示されているところをクリックしてみましょう。
このように、検索不能と思われるPDFでも、OCR処理をすると検索で目的の単語を含む文章を探してコピーができます。
プライバシー保護 | マルウェアなし | 広告なし
まとめ
デジタル化が進展すればPDFを扱う機会は必ず増えています。専門な編集ソフトを応用すれば、目的の情報にたどり着く時間が短くなるのではないでしょうか。少し前まではPDFは読むものであって、活用するものではありませんでした。これからは違います。加工して、検索して、引用し、新しいコンテンツを作れる時代に入ったと言えるでしょう。
「PDFelement」(PDFエレメント)のような編集ソフトはもはや必須のアイテムなのです。
役に立ちましたか?コメントしましょう!