- blogs:
- cles::blog
2011/07/22
PDFのテキストにOCRをかけて検索できるようにする
先日、紙の原稿をスキャンしたかなりのボリュームのPDFをもらったのですが、文字が全て画像なので検索できなくて困っていました。要はOCRをかけて、文字データを埋め込んでしまえば良いのですが何かいい方法がないかと思っていろいろと調べてみたら、 Acrobat *1には OCR を行う機能が標準で備わっているので、それを素直に使えば一撃で解決できることが分かりました。
具体的には「文書」メニュー→「OCRテキスト認識」→「OCRを使用してテキストを認識」を選択すると「テキスト認識」画面が出てくるので、「OK」をクリックするだけ。
同時に画像の傾きも調整してくれるので、文章も読みやすくなって一石二鳥でした。
- *1: Adobe Readerではない。
このエントリは役に立ちましたか?
トラックバックについて
Trackback URL:
お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
このエントリへのTrackbackにはこのURLが必要です→http://blog.cles.jp/item/4344
Trackbacks
このエントリにトラックバックはありません
Comments
愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
コメントはありません
Comments Form
コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。
OpenID を使ってログインすることができます。
サイト内検索
Loading
- 楽天のウザい行動ターゲティ... (2)
- ドメイン移管のときに使って... (1)
- Tポイントツールバーの危険性 (1)
- JavaScriptの無名関数で再帰... (1)
- いつでも新しいパンツがもら... (1)
1 . VMware vCenter Converter で 物理サーバの仮想化をやってみた (27189)
2 . ネットワーク接続時のパスワード保存先 (25622)
3 . やっぱりあった!パクれる読書感想文! (25039)
4 . SSHをSOCKS Proxyにする (23250)
5 . JavaScriptでCSVを読み込む (22355)
2 . ネットワーク接続時のパスワード保存先 (25622)
3 . やっぱりあった!パクれる読書感想文! (25039)
4 . SSHをSOCKS Proxyにする (23250)
5 . JavaScriptでCSVを読み込む (22355)
cles::blogについて
Calendar
Referrers