効率アップ、クオリティアップのためのデジタル仕事術

誠 Biz.ID誠 Biz.ID

ブログに書く by kwout
ニュース

3分LifeHacking:

画像内の文字をコピー&ペーストする

資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。
2007年10月30日 13時30分 更新

 資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。

 クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ&ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。

ks_xeloocr1.gif

 この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを追加する機能が追加されている。

 リリース直前のバージョンを使い、編集部で試したところ、JPEG、PNG、BMPファイルはドラッグ&ドロップするだけで読み込み可能だった。GIFファイルは未対応だった。

 OCRの対応範囲はどうか。Internet Explorer 6の文字サイズ「中」の設定でキャプチャしたBiz.IDトップページを、PNGファイルとして読み込ませてみた。キャプチャした画像をそのままOCRにかけた結果が下記だ。

対応必至メタポリックシンドローム
社員が健康になることで、企業が負担すべき費用が減る” という時
代になってきた。企業も個人もメタポリックシンドロームヘの対策を真
剣に考えなくてはならない今、どんな対応が可能なのか。個人ででき
る対策、そして企業がサポートできることをさぐる。


 オリジナルサイズであれば、まず問題なくテキストに変換してくれる。次にXGAサイズからSVGAサイズ(800×600ピクセル)まで縮小してみた。

対応必至メタボリックシンドローム
社員が・健康にな5 ことで企菓が・負担すべき費用が一滴ざ・というl j§
μ;になl 、てきた。企栗t Jfl A もメタポリックジl . ・ドC】- & への71 1 rき再
糾こ考えりくてり1なぞ・ない今、どんな対応力’・町能なのか。l .人ででき
ド5 舛茉. そして企貰がりポートできることきさぐ≒5 .


 SVGAサイズになると、タイトル部分以外はかなり厳しい。さらにVGAサイズにまで縮小すると、ほぼ読み取ることはできなかった。

 アドビの「Acrobat Professional」にもOCR機能が搭載されているが、やはりSVGAやVGAは厳しい。クセロReader ZEROのOCR機能は優秀だ。

 ではデジカメで撮影した、発表会のスライド写真はどうか。こちらはSVGAレベルまで縮小したものを読み込ませてPDF化。OCRをかけてみた。あまりに大きなサイズの写真だとOCRがうまく動かないが、SVGAレベルであれば動作。完全ではないがテキストデータとして読み込むこともできた。

ks_xeloocr2.gif
今回のレシピ
ツール 入手法
クセロReader ZERO http://xelo.jp/xelopdf/index.html

関連キーワード

PDF | OCR | キャプチャ


[斎藤健二,ITmedia]

Copyright© 2009 ITmedia, Inc. All Rights Reserved.






誠Focus

@IT自分戦略研究所

免罪符としての保守性
 ※今回はいつもよりさらに限定されたところにのみ通じる話で、IT業界一般に通じる...

歌って踊れるエンジニア〜エンジニアの誤解 6〜
 わたしは4月で社会人10年目になりました。  エンジニアを10年もやっていると...

命に触れた新人時代
 この時期、毎年おなじみである新人のネーミング。  今年の新入社員は「エコバッグ...

キャリアアップ