ニュース3分LifeHacking:画像内の文字をコピー&ペーストする資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。2007年10月30日 13時30分 更新
資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。 クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ&ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。 この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを追加する機能が追加されている。 リリース直前のバージョンを使い、編集部で試したところ、JPEG、PNG、BMPファイルはドラッグ&ドロップするだけで読み込み可能だった。GIFファイルは未対応だった。 OCRの対応範囲はどうか。Internet Explorer 6の文字サイズ「中」の設定でキャプチャしたBiz.IDトップページを、PNGファイルとして読み込ませてみた。キャプチャした画像をそのままOCRにかけた結果が下記だ。 対応必至メタポリックシンドローム オリジナルサイズであれば、まず問題なくテキストに変換してくれる。次にXGAサイズからSVGAサイズ(800×600ピクセル)まで縮小してみた。 対応必至メタボリックシンドローム SVGAサイズになると、タイトル部分以外はかなり厳しい。さらにVGAサイズにまで縮小すると、ほぼ読み取ることはできなかった。 アドビの「Acrobat Professional」にもOCR機能が搭載されているが、やはりSVGAやVGAは厳しい。クセロReader ZEROのOCR機能は優秀だ。 ではデジカメで撮影した、発表会のスライド写真はどうか。こちらはSVGAレベルまで縮小したものを読み込ませてPDF化。OCRをかけてみた。あまりに大きなサイズの写真だとOCRがうまく動かないが、SVGAレベルであれば動作。完全ではないがテキストデータとして読み込むこともできた。
関連記事
関連リンク[斎藤健二,ITmedia] Copyright© 2008 ITmedia, Inc. All Rights Reserved. 新着記事
@IT自分戦略研究所
転職活動のために退職。なのに次が見つからない!
エンジニアの新たな舞台、ITリスク管理・システム監査
ブログを書いている人向けお勧めイベント
|