blogs:
cles::blog
NP_cles()

« Google Labs... :: 放射性物質... »
cles::blog > PDFのテキストにOCRをかけて検索できるようにする

2011/07/22

PDFのテキストにOCRをかけて検索できるようにする

先日、紙の原稿をスキャンしたかなりのボリュームのPDFをもらったのですが、文字が全て画像なので検索できなくて困っていました。要はOCRをかけて、文字データを埋め込んでしまえば良いのですが何かいい方法がないかと思っていろいろと調べてみたら、 Acrobat ^*1には OCR を行う機能が標準で備わっているので、それを素直に使えば一撃で解決できることが分かりました。

具体的には「文書」メニュー→「OCRテキスト認識」→「OCRを使用してテキストを認識」を選択すると「テキスト認識」画面が出てくるので、「OK」をクリックするだけ。
同時に画像の傾きも調整してくれるので、文章も読みやすくなって一石二鳥でした。

^*1: Adobe Readerではない。

[5年前][4年前][3年前][2年前][1年前][1年後] | by hsur at 21:52, Tips | pdf | Views: 1219

このエントリは役に立ちましたか？

こんな記事もあります「傾き認識テキスト」

・Twitter API 1.1 に注意
・VM上で USB ブートする
・ERB と binding
・Thunderbird で文字が勝手に上付きになる
・ファーストサーバの第三者調査委員会の報告書が公表に
・Twitter クライアントを Tween に
・高可用性とリカバリ性が求められる場面の違いを認識することが重要
・自衛隊に「サイバー空間防衛隊」ができるらしい
・「識別されていないネットワーク」を「プライベートネットワーク」にする
・２次創作の合法化の動き？

トラックバックについて

Trackback URL:

お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]

このエントリへのTrackbackにはこのURLが必要です→http://blog.cles.jp/item/4344

Trackbacks

このエントリにトラックバックはありません

Comments

愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。

コメントはありません

Comments Form

コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。

OpenID を使ってログインすることができます。

« Google Labs... :: 放射性物質... »
cles::blog > PDFのテキストにOCRをかけて検索できるようにする

Copyright © 2004-2012 by CLES All Rights Reserved.

サイト内検索

検索ワードランキング

PDF 検索できるように
pdf OCR テキスト検索
pdf検索できるようにするには
pdf ocrをかける
pdf 検索できるようにする
pdf 検索 ocr
win7 PDF OCR 検索
PDF OCR 検索
pdf 検索できる
pdf ocr 検索
PDF 検索できるようにしたい
pdf ocr検索
pdf ocr 検索
PDF OCR 検索
pdf 検索できる

へぇが多いエントリ

閲覧数が多いエントリ

1 . VMware vCenter Converter で物理サーバの仮想化をやってみた (27189)
2 . ネットワーク接続時のパスワード保存先 (25622)
3 . やっぱりあった！パクれる読書感想文！ (25039)
4 . SSHをSOCKS Proxyにする (23250)
5 . JavaScriptでCSVを読み込む (22355)

最新のコメント

14人に1人は23区民
- MySQLエラー.. 07/22
Nucleus v3.31SP1向けCACHEM..
- hsur 07/13
- hiddy 07/13
- and more...
パンコントマテ
- hsur 07/01
- hiro@白獅子 06/30
JavaScriptの型変換にはまる
- コードつれづれ 03/24
- hsur 07/31
- and more...
こだわり回転すし鮨右衛門
- 呑・関根 03/15

cles::blogについて

誰が書いてる？
最近行った場所
サイトポリシー
タグ一覧
検索ワードランキング
ケータイサイトはこちら

Calendar

Referrers

PDFを検索できるようにする...

Powered by NP_Paint

Nucleus CMS v3.31SP3/w memcached

11615171 (W:7137 Y:2930 T:2060)

RSS feed meter for http://blog.cles.jp/