今週のお役立ち情報

画像内の文字をコピー＆ペーストする

2007年10月30日13時30分

コメント(0)

トラックバック(0)

ブックマーク

"　写真：ITmedia"

3分LifeHacking：資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。

　資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。

　クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ＆ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。

　この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを追加する機能が追加されている。

　リリース直前のバージョンを使い、編集部で試したところ、JPEG、PNG、BMPファイルはドラッグ＆ドロップするだけで読み込み可能だった。GIFファイルは未対応だった。

　OCRの対応範囲はどうか。Internet Explorer 6の文字サイズ「中」の設定でキャプチャしたBiz.IDトップページを、PNGファイルとして読み込ませてみた。キャプチャした画像をそのままOCRにかけた結果が下記だ。

　オリジナルサイズであれば、まず問題なくテキストに変換してくれる。次にXGAサイズからSVGAサイズ（800×600ピクセル）まで縮小してみた。

　SVGAサイズになると、タイトル部分以外はかなり厳しい。さらにVGAサイズにまで縮小すると、ほぼ読み取ることはできなかった。

　アドビの「Acrobat Professional」にもOCR機能が搭載されているが、やはりSVGAやVGAは厳しい。クセロReader ZEROのOCR機能は優秀だ。

　ではデジカメで撮影した、発表会のスライド写真はどうか。こちらはSVGAレベルまで縮小したものを読み込ませてPDF化。OCRをかけてみた。あまりに大きなサイズの写真だとOCRがうまく動かないが、SVGAレベルであれば動作。完全ではないがテキストデータとして読み込むこともできた。

今回のレシピ
ツール入手法
クセロReader ZERO 　 http://xelo.jp/xelopdf/index.html
　
　
他の画像が掲載された記事
Adobe市場の3割獲得目指す──高速PDFビュワー「クセロReader ZERO」
ちょっと便利なPDF Tipsトップ10
Office文書やWebページを即座にPDF化――だけでなく画像ファイルにも変換する
オフィスファイルをFlash、PDFに変換してくれるドキュメント共有サービス「Memotune」
タブ型リーダーでPDFファイルを次々と閲覧する
【PDF】に関連する最新記事はこちら
【OCR】に関連する最新記事はこちら
【キャプチャ】に関連する最新記事はこちら