紙の書類や画像に含まれるテキストをデジタル化したいと思ったことはありませんか? 実は、Googleが提供する無料ツールを使えば、簡単に画像からテキストを抽出できるんです。
この記事では、GoogleドライブやGoogle Keepを活用した文字起こし方法と、その精度を高めるコツについて詳しく解説します。
OCR(Optical Character Recognition:光学式文字認識)とは、画像内のテキストをデジタルテキストに変換する技術です。Googleは複数のサービスを通じて無料のOCR機能を提供しています。
Googleが提供する主なOCR機能は以下の二つです。
これらのツールは普段使っているGoogleアカウントを用いて無料で利用でき、画像からテキストを抽出することが可能です。特別なソフトウェアをインストールする必要もありません。
Googleの無料ツールを使って画像から文字を抽出する方法をそれぞれ詳しく見ていきましょう。
Googleドライブは、便利なクラウドストレージサービスですが、実はOCR機能も内蔵されています。以下の手順で簡単にテキスト抽出が可能です。
①Googleドライブ(drive.google.com)にアクセスしてログインします。
②「新規」ボタンをクリックするか、ファイルをドラッグ&ドロップでアップロードします。JPEG、PNG、GIF、PDFなど、さまざまな形式のファイルに対応しています。
①アップロードした画像やPDFファイルを右クリックします。
②「アプリで開く」→「Googleドキュメント」を選択すると、自動的にOCR処理が行われ、画像内のテキストが抽出されます。
Google Keepはメモアプリですが、画像からのテキスト抽出に特化した機能を持っています。特にスマートフォンからの利用に適しています。
① Google Keep(keep.google.com)にアクセスするか、スマホアプリを開きます。
②新規メモを作成し、「画像を追加」アイコンをクリックします。
③既存の画像を選択するか、その場で写真を撮影します。
① 画像を含むメモを開きます
②画像を選択し、メニューから「画像のテキストを抽出」を選択します。
③抽出されたテキストが自動的にメモに追加されます。
④必要に応じて編集を行い、そのまま保存できます。
・Google KeepのスマホアプリはiOS、Android両方で利用できます。
・外出先でも素早く名刺や書類の文字起こしが可能です。
・カメラで直接撮影してすぐにテキスト抽出できるため、非常に便利です。
・同期機能により、抽出したテキストはPC版でも確認・編集できます。
GoogleのOCR機能は優れていますが、より良い結果を得るためのコツがあります。以下のポイントに注意すると、精度が大幅に向上します。
・高解像度の画像ほど文字認識の精度が上がります。
・スマホで撮影する場合は、できるだけ高画質設定にしましょう。
・光量が十分な環境で撮影することも重要です。
・影やぶれがない状態が理想的です。
・ゴシック体など、シンプルでクリアなフォントほど認識されやすいです。
・装飾的なフォントや筆記体は認識精度が下がることがあります。
・コントラストがはっきりした画像(黒字に白背景など)が最適です。
・カラーよりもモノクロの方が認識率が高いケースもあります。
・手書き文字はフォントよりも認識精度が下がる傾向があります。
・できるだけはっきりと書かれた文字のものを選びましょう。
・上下左右の余白をしっかり取った文字が認識されやすいです。
・文字同士が重なっていると認識率が大幅に下がります。
GoogleツールでもPDFの文字起こしは可能ですが、より高度な編集や大量のPDF処理が必要な場合は、PDFelementのようなオールインワンPDF編集ソフトが便利です。
PDFelementはスキャンしたPDFや画像PDFに特化したOCR機能を提供しています。
・マルチ言語対応で、日本語も高精度で認識できます。
・バッチ処理機能があり、複数のドキュメントを一括変換できます。
・表や図形など、レイアウトごと認識できる点が強みです。
プライバシー保護 | マルウェアなし | 広告なし
スキャンしたPDFは通常テキスト編集ができませんが、OCRを使えば可能になります。
・PDFelementでは、「OCRを実行」機能で簡単に変換できます。
・検索可能な形式や編集可能な形式など、目的に応じた選択が可能です。
・書式を維持したままテキスト化できるため、元のレイアウトが崩れません。
【画像】 【OCR処理後】
【スキャンしたPDF】 【OCR処理後】
プライバシー保護 | マルウェアなし | 広告なし
OCR処理後は直接PDFを編集できるようになります。
・テキスト修正、画像の追加・削除、ページの並べ替えなどが可能です。
・Word、Excel、PowerPointなど様々な形式にエクスポートできます。
・クラウドサービスと連携して共有することも簡単です。
A: はい、GoogleドライブとGoogle KeepのOCR機能は、Googleアカウントがあれば無料で利用できます。ただし、Googleドライブの容量には制限があります。
A: GoogleドキュメントやGoogle Keepでは自動保存されますが、念のため手動でも保存することをおすすめします。
A: はい、Googleドライブを使えば複数ページのPDFも一度にOCR処理できます。ただし、大量のページや複雑なレイアウトの場合は、PDFelementのような専用ツールの方が便利です。
GoogleドライブやGoogle Keepの無料OCR機能を使えば、画像やPDF内のテキストを簡単にデジタル化できます。日常的な文書のデジタル化には十分な性能で、特別なソフトウェアを購入する必要もありません。より高度な編集や大量処理が必要な場合はPDFelementなどの専用ツールも検討してみるとよいでしょう。これらのツールを上手く活用して、紙の書類やスキャンデータを効率的に管理していきましょう。
この文書または製品に関するご不明/ご意見がありましたら、 サポートセンター よりご連絡ください。ご指摘をお待ちしております!
役に立ちましたか?コメントしましょう!