PDFに含まれるテキストの抽出やコピーをしたいけど、うまく文字が選択できなかったり、手入力をしたりするのが大変といった経験はないでしょうか。実はツールを活用すれば、簡単にPDFの文字起こし(テキスト化)ができます。
この記事では、無料で使えるPDFのテキスト化ツールを10個厳選してご紹介します。PDFの文字起こし方法でお悩みの方は、ぜひ参考にしてみてください。
PDFのテキスト化とは、PDFの中に含まれている文章(テキスト)を抽出して、コピーしたり編集したりできる文字データにすることです。PDFは、普通の文章に見えても実際には画像になっているケースも多く、そのままだと文字を選択できないことがよくあります。そこで役立つのが、OCR(文字認識)機能を搭載したツールです。
OCR機能を搭載したツールを使えば、PDF内の文字を自動で認識してテキストデータとして抽出(文字起こし)してくれるので、手入力の手間を大幅に省くことができるでしょう。
なおPDFのテキスト化ができるツールは、大きく分けて「オンラインツール」と「インストールして使うソフトウェア」の2種類があります。それぞれの特徴を表にまとめました。
|
種類 |
長所 |
短所 |
おすすめの人 |
|
オンラインツール |
・インストール不要ですぐ使える |
・ファイルサイズや回数に制限がある |
・たまにPDFをテキスト化したい人 |
|
ソフトウェア |
・OCR精度が高い |
・インストールが必要 |
・ビジネスや学習で頻繁に使う人 |
PDFの文字起こしを手軽に行いたいならオンラインツール、PDF編集も含めて本格的に使いたいならソフトウェアを選ぶのがおすすめです。
ここからは、PDFのテキスト化ができる無料のオンラインツール5選について、特徴を交えながらご紹介します。

HiPDFは、インストール不要でブラウザ上で使えるPDF変換・編集ツールです。PDFをアップロードするだけで、OCR処理で文字を正確に読み取り、編集しやすいWordなど形式へ変換できます。
日本語をはじめ、英語・中国語など多言語にも対応しており、認識精度も高いため、文章構造が崩れにくく修正の手間を抑えられるのが特長です。操作もシンプルで、初心者でも迷わず使えるでしょう。
無料版は1日1回までという制限がありますが、たまにPDFを文字起こししたい、まずは文字起こしを試してみたいという人であれば十分です。頻繁に長文PDFの文字起こしを行う場合は、有料である製品版の利用をおすすめします。

Googleドライブは、ファイルの保存・共有だけでなく、PDFの文字起こしにも使える無料のクラウドサービスです。ソフトのインストールは不要であり、ブラウザからPDFをアップロードしてGoogleドキュメントで開くだけで、自動的にOCR処理を行い、画像内の文字もテキストとして抽出できます。
Googleドライブを使う最大のメリットは、文字起こし機能を含めて完全無料で使える点です。日本語はもちろん多言語に対応しており、操作もシンプルなため初心者でも扱いやすいでしょう。
メリットの一方で、フォントや表の構造によっては文字化けやレイアウト崩れが起こることがあります。ページ数が少ないPDFや簡単な文書を無料でテキスト化したい方に向いており、精度やレイアウトを重視する場合は、専用ツールと使い分けるのがおすすめです。
関連人気記事:【無料OCR】GoogleドライブでPDFのテキスト化!使い方と注意点を解説

iLovePDFは、ブラウザ上でPDFの変換・編集・文字起こしができる人気のオンラインツールです。PDFをアップロードしてOCR機能を使うだけで、PDF内の文字を自動でテキスト化できます。
iLovePDFの大きな特長は、テキスト化してもレイアウトを崩しにくい点です。段落構成や改行、文章の流れが比較的きれいに保たれるため、資料やレポートなどの見た目も重視したいPDFの文字起こしに向いています。
テキスト化するための操作も、OCR機能を選ぶ→PDFをアップロード→テキスト化されたPDFをダウンロードするだけとシンプルなので、初心者でも扱いやすいでしょう。
ただし、無料版だとOCRの回数やアップロードできるファイルサイズに制限があります。長文PDFや、頻繁にOCR処理を行いたい場合は、有料プランを検討してみてください。

OCR2Editは、ブラウザ上でPDFや画像ファイルをアップロードするだけで、文字を認識してテキスト化できる無料のオンラインOCRツールです。ソフトのインストールや会員登録が不要なので、すぐに使い始められるお手軽さが特徴です。
OCR処理に特化しているツールなので、操作画面も非常にシンプル。ファイルを選択して変換するだけの直感的な流れなので、誰でも迷うことなくPDFのテキスト化ができるでしょう。
OCRの精度が元のPDFや画像の品質に左右されやすく、文字が小さい場合や傾きのあるスキャンデータでは認識ミスが発生することも多い点がデメリットといえます。レイアウトや段組み構造なども再現されないため、テキストのみをシンプルに出力したい人におすすめです。

PDF24は、PDF関連のさまざまな機能を無料で使えるオンラインサービスです。無料で利用可能なOCR機能を使えば、スキャンPDFや画像PDFを検索やコピーもできるテキストデータへ変換できます。ブラウザだけですべての作業が完結するので、ソフトを導入する必要もありません。
ただし、表が使われていたり多言語が含まれていたりするPDFだと、文字の順番が入れ替わったり、意図しない改行が含まれてしまうことがあります。後から編集しやすい形でPDFからテキストを抽出したいのであれば、シンプルなPDFのみ変換するか、変換後に多少手直しが必要です。
続いて、PDFから文字起こしができて無料で使えるソフトウェア5選をご紹介します。

Microsoft Wordは、実はPDFから文字を取り出すことができます。WordからPDFファイルを開くだけでPDF内の文字が自動的に抽出され、すぐにコピーや編集ができる状態になります。
既にMicrosoft Officeを利用している人であれば、追加費用や新しいソフトのインストールは必要ありません。操作もとてもシンプルなので、PDFの文字起こしが初めての方でも安心して試せるでしょう。
ただし、Wordを使って行うPDFの文字起こしは、表や段組みなどレイアウトが複雑なPDFでだと、配置が崩れたり文字化けが起こることがあります。
短めでシンプルなPDFをテキスト化したい場合に向いており、仕上がりを重視したいときは専用ツールを使うのがおすすめです。

プライバシー保護 | マルウェアなし | 広告なし
PDFelementは、PDFの閲覧・編集から文字起こしまで、PDFに関するあらゆることに対応している多機能PDFソフトです。スキャンしたPDFや画像PDFに含まれる文字でも、OCR機能を使って高精度に読み取ることができるので、初心者の人でも扱いやすいのがメリットといえます。
PDFelementを使って文字起こしする手順もとても簡単で、PDFファイルを開き、OCR機能を選んで言語指定をするだけで自動的に処理が開始されます。処理が終われば、抽出されたテキストをPDF上でそのままコピーしたり直接編集したりもできるため、作業の手間を減らせます。
無料トライアル期間中であれば、制限なしでさまざまな機能を使うことができます。もちろんOCR機能も試すことができるので、PDFelementの文字認識精度の高さを体感することができるでしょう。
ただし、無料トライアル期間が終了すると製品版へのアップグレードが必要です。まずは無料でしっかり試してみたい、操作が簡単なOCRソフトを使いたいという人には、PDFelementをおすすめします。

関連人気記事:手軽にPDF文書からテキストを抽出する方法のまとめ、長いPDFも対応可能
プライバシー保護 | マルウェアなし | 広告なし

Adobe Acrobat Readerは、PDF閲覧・変換ができる定番のソフトで、ワードなどへ変換することでPDF内に埋め込まれているテキストをコピーして抽出できます。ソフトの信頼性が高く、安心して使えるのが特徴です。
注意点としては無料版だとOCR機能が使えないので、紙をスキャンしたPDFや画像だけのPDFは文字起こしできません。また、長文をまとめて抽出するときには手間がかかる点もデメリットといえるでしょう。短いPDFから手軽にテキストを取り出したい人や、無料で安全な抽出方法を探している方におすすめです。

FreeOCRは、Windows専用の無料で使えるOCRソフトで、スキャンPDFや画像ファイルから文字を読み取ってテキスト化できます。OCR機能に特化しており、PDFを読み込んでOCRを実行するだけと操作は非常にシンプルです。
画像だけのPDFでもOCR処理が行えますが、他の有料OCRソフトと比べるとレイアウトの再現性や認識精度が若干落ちてしまうので、複雑なレイアウトの表が含まれていたり、長文PDFを文字起こしするのにはやや不向きといえるでしょう。Windowsを利用している環境で、まずは無料でOCRを試してみたい人におすすめです。

PDF OCR X Community Editionは、PDFファイルをドラッグ&ドロップするだけでOCR処理ができるシンプルな無料ソフトウェアです。WindowsとmacOSの両方に対応しており、PDF内の文字をテキストとして抽出したり、検索可能なPDFへ変換したりできます。
操作が直感的で初心者でも使いやすい一方、無料版だと処理できるページ数や機能に制限がある点に注意が必要です。ページ数の少ないPDFを、お手軽に文字起こししたい場合などに適しているソフトといえるでしょう。
PDFをテキスト化しておくと便利ですが、いくつか気をつけたいポイントもあります。ここでは、事前に知っておくと安心できる注意点を4つご紹介します。
PDFには文字データとして保存されているものと、画像として保存されているものがあります。画像として保存されているPDFを文字起こしする場合は、OCRによる認識が必要です。
しかし、PDFにする前の画像の画質が低いと、OCRの読み取り精度が下がることがあります。この場合、PDF内の文字を正確に文字起こしできないときがあるので注意してください。
PDFをテキスト化すると、段組み・表・改行位置などが元の見た目どおりに再現されない場合があります。特にレポートや資料といったレイアウトを重視するPDFだと、テキスト化した後に微調整が必要になる場合も多いので注意が必要です。
PDFに埋め込まれているフォント種類や言語設定によっては、テキスト化したときに文字化けやOCRの読み取りミスが発生することがあります。
数字の「0」とアルファベットの「O」などの似た文字は特に読み取りミスが起きやすいので、PDFをテキストに変換した後は、必ず内容を確認しましょう。
PDFをテキスト化する場合のQ&Aをまとめました。変換やツール選びの参考にしてみてください。
PDFelementなどのPDF編集ソフトを利用すれば、PDFファイルを一括でテキスト化することができます。なお、PDFelementを使って複数のPDFファイルを一括でテキスト化する手順を紹介していきます。
プライバシー保護 | マルウェアなし | 広告なし


有料ツールは一般的に無料ツールでは使用できない機能やサービスを含んでいます。さらにはテキスト化の精度も有料ツールのほうが高いといえるでしょう。
したがって、高精度のテキスト化や文字起こしを希望する場合は、有料ツールの使用をおすすめします。
ただし、無料ツールでも多機能かつ精度が高いものはあるので、あなたのニーズに合わせてさまざまなツールを試用してみましょう。
OCR機能を搭載しているツールを利用しましょう。
定番のPDF編集ソフトにはほとんど搭載されているので、画像のテキスト化がメインになる場合はそういったツールを比較してみてください。
PDFを文字起こしできるツールを上手に活用することで、これまで手間がかかっていた作業を効率化できます。少しのPDFや時々だけ文字起こしをしたい場合は手軽なオンラインツール、精度や編集のしやすさを重視したい場合はソフトウェアなど、目的や利用頻度に合わせてツールを選ぶことが大切です。
今回ご紹介したように無料ツールでも実用的なものは多いので、まずは気になるツールを試してみて、自分に合ったPDFのテキスト化方法を見つけてみてください。
プライバシー保護 | マルウェアなし | 広告なし
この文書または製品に関するご不明/ご意見がありましたら、 サポートセンター よりご連絡ください。ご指摘をお待ちしております!
役に立ちましたか?コメントしましょう!