BLOGTIMES
::
cles::blog > PDFのテキストにOCRをかけて検索できるようにする
2011/07/22

PDFのテキストにOCRをかけて検索できるようにする

 

先日、紙の原稿をスキャンしたかなりのボリュームのPDFをもらったのですが、文字が全て画像なので検索できなくて困っていました。要はOCRをかけて、文字データを埋め込んでしまえば良いのですが何かいい方法がないかと思っていろいろと調べてみたら、 Acrobat *1には OCR を行う機能が標準で備わっているので、それを素直に使えば一撃で解決できることが分かりました。

具体的には「文書」メニュー→「OCRテキスト認識」→「OCRを使用してテキストを認識」を選択すると「テキスト認識」画面が出てくるので、「OK」をクリックするだけ。
同時に画像の傾きも調整してくれるので、文章も読みやすくなって一石二鳥でした。

  • *1: Adobe Readerではない。
このエントリは役に立ちましたか?
     
トラックバックについて
Trackback URL:
お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
このエントリへのTrackbackにはこのURLが必要です→http://blog.cles.jp/item/4344
Trackbacks
このエントリにトラックバックはありません
Comments
愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
コメントはありません
Comments Form

コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。

OpenID を使ってログインすることができます。

Identity URL: Yahoo! JAPAN IDでログイン

★下記に2つの英単語をスペースで区切って入力してください
::
cles::blog > PDFのテキストにOCRをかけて検索できるようにする