OCRとは?
OCR(Optical Character Recognition/光学式文字認識) とは、画像や印刷された文字を機械が読み取れるテキストデータに変換する技術のことです。
紙の書類をスキャンして電子データ化する際に必要となる処理ですが、既存の電子ドキュメント(例:PDF)にも適用できます。
スキャンしたPDFファイルや画像ベースのPDFを直接編集したり、Word・Excel・PowerPoint などの編集可能な形式に変換したりする場合は、まず OCR処理 を実行する必要があります。