Google ドキュメントの光学式文字認識について
OCR(光学式文字認識)について
OCR(光学式文字認識)を使用すると、自動化されたコンピュータ アルゴリズムを使用して、テキスト入りの画像をテキスト ドキュメントに変換することができます。画像は個別に処理したり(.jpg、.png、.gif ファイル)、複数ページの PDF ドキュメント(.pdf)として処理したりできます。OCR に適したファイル形式は次のとおりです。
- フラットベッド スキャナを使用して取り込んだ画像や PDF ファイル
- デジタル カメラや携帯端末で撮影した写真
Google ドライブで OCR を使用する
Google ドライブではアップロードされた画像や PDF ファイルを使用してファイルをスキャンし、コンピュータ アルゴリズムを使用してファイルを Google ドキュメントに変換します。
精度の高い結果を得るには、画像や PDF ファイルが次の要件を満たしている必要があります。
- 解像度: 高解像度が高いほど精度の高い結果が得られます。ドキュメントのテキストの 1 行の高さを少なくとも 10 ピクセルにすることをおすすめします。
- 向き: テキストが左から右に表記されているドキュメントのみが認識されます。ドキュメントを間違った向きでスキャン、キャプチャしてしまった場合は、画像をレタッチ/編集するプログラムを使用して画像を回転させてから、Google ドライブにアップロードしてください。
- 言語、フォント、文字: Google の OCR エンジンは多種類の文字に対応していますが、ラテン文字以外の文字については現在も試験を行っています。ドキュメントの言語をプルダウン メニューから選択できます。Arial や Times New Roman などの一般的なフォントがファイルに含まれていると、より精度の高い結果が得られます。
- 画質: 光度が均一でコントラストのはっきりした画像を使うと、精度の高い結果が得られます。画像がブレている場合や、焦点が合っていない場合は、検出されるテキストの品質が低くなります。
ファイル サイズの制限
画像(.jpg, .gif, .png)や PDF ファイル(.pdf)の最大サイズは 2 MB です。PDF ファイルの場合は、抽出するテキストを検索するとき、最初の 10 ページだけを調べます。
文字書式の保持
ドキュメントを処理する場合は、太字や斜体のテキスト、フォントのサイズや種類、改行などの基本的な文字書式を保持するよう努めますが、このような要素の検出は難しいため、失敗することもあります。箇条書きや番号付きリスト、表、テキスト列、脚注や巻末の注などのその他の文字書式や構成要素は失われることが多々あります。
OCR では、Google ドライブへのその他のアップロードよりも時間がかかることがあります。画像ファイル(.jpg、.gif、.png)は最大 30 秒、PDF ファイル(.pdf)は最大 1 分かかります。