今週のお役立ち情報
画像内の文字をコピー&ペーストする
2007年10月30日13時30分
3分LifeHacking:資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。
資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。
クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ&ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。
この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを追加する機能が追加されている。
リリース直前のバージョンを使い、編集部で試したところ、JPEG、PNG、BMPファイルはドラッグ&ドロップするだけで読み込み可能だった。GIFファイルは未対応だった。
OCRの対応範囲はどうか。Internet Explorer 6の文字サイズ「中」の設定でキャプチャしたBiz.IDトップページを、PNGファイルとして読み込ませてみた。キャプチャした画像をそのままOCRにかけた結果が下記だ。
オリジナルサイズであれば、まず問題なくテキストに変換してくれる。次にXGAサイズからSVGAサイズ(800×600ピクセル)まで縮小してみた。
SVGAサイズになると、タイトル部分以外はかなり厳しい。さらにVGAサイズにまで縮小すると、ほぼ読み取ることはできなかった。
アドビの「Acrobat Professional」にもOCR機能が搭載されているが、やはりSVGAやVGAは厳しい。クセロReader ZEROのOCR機能は優秀だ。
ではデジカメで撮影した、発表会のスライド写真はどうか。こちらはSVGAレベルまで縮小したものを読み込ませてPDF化。OCRをかけてみた。あまりに大きなサイズの写真だとOCRがうまく動かないが、SVGAレベルであれば動作。完全ではないがテキストデータとして読み込むこともできた。
今回のレシピ
ツール 入手法
クセロReader ZERO http://xelo.jp/xelopdf/index.html
他の画像が掲載された記事
Adobe市場の3割獲得目指す──高速PDFビュワー「クセロReader ZERO」
ちょっと便利なPDF Tipsトップ10
Office文書やWebページを即座にPDF化――だけでなく画像ファイルにも変換する
オフィスファイルをFlash、PDFに変換してくれるドキュメント共有サービス「Memotune」
タブ型リーダーでPDFファイルを次々と閲覧する
【PDF】に関連する最新記事はこちら
【OCR】に関連する最新記事はこちら
【キャプチャ】に関連する最新記事はこちら
資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。
クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ&ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。
この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを追加する機能が追加されている。
リリース直前のバージョンを使い、編集部で試したところ、JPEG、PNG、BMPファイルはドラッグ&ドロップするだけで読み込み可能だった。GIFファイルは未対応だった。
OCRの対応範囲はどうか。Internet Explorer 6の文字サイズ「中」の設定でキャプチャしたBiz.IDトップページを、PNGファイルとして読み込ませてみた。キャプチャした画像をそのままOCRにかけた結果が下記だ。
オリジナルサイズであれば、まず問題なくテキストに変換してくれる。次にXGAサイズからSVGAサイズ(800×600ピクセル)まで縮小してみた。
SVGAサイズになると、タイトル部分以外はかなり厳しい。さらにVGAサイズにまで縮小すると、ほぼ読み取ることはできなかった。
アドビの「Acrobat Professional」にもOCR機能が搭載されているが、やはりSVGAやVGAは厳しい。クセロReader ZEROのOCR機能は優秀だ。
ではデジカメで撮影した、発表会のスライド写真はどうか。こちらはSVGAレベルまで縮小したものを読み込ませてPDF化。OCRをかけてみた。あまりに大きなサイズの写真だとOCRがうまく動かないが、SVGAレベルであれば動作。完全ではないがテキストデータとして読み込むこともできた。
今回のレシピ
ツール 入手法
クセロReader ZERO http://xelo.jp/xelopdf/index.html
他の画像が掲載された記事
Adobe市場の3割獲得目指す──高速PDFビュワー「クセロReader ZERO」
ちょっと便利なPDF Tipsトップ10
Office文書やWebページを即座にPDF化――だけでなく画像ファイルにも変換する
オフィスファイルをFlash、PDFに変換してくれるドキュメント共有サービス「Memotune」
タブ型リーダーでPDFファイルを次々と閲覧する
【PDF】に関連する最新記事はこちら
【OCR】に関連する最新記事はこちら
【キャプチャ】に関連する最新記事はこちら
Ads by Google
コメントを読む(0件) コメントする(ログイン)
前後の記事
- OS X Leopardを買う前に知っておきたい10のポイント GIZMODO 30日13時31分
- 画像内の文字をコピー&ペーストする
ITmedia 30日13時30分
- [CNET Japan] 「Windowsはオープン性の維持で不可欠」:OLPC会長ネグロポンテ氏 CNET Japan 30日12時29分
- ロジクール、「diNovo Edge」の誤認識問題を解決するパッチを公開 ITmedia 30日12時35分
- 玄人志向、GeForce 8800 GT搭載グラフィックスカード「GF8800GT-E512HW」
ITmedia 30日13時08分
コンピュータアクセスランキング
- 1
- Yahoo!JAPANトップページの新しいデザインを必ず体験できる方法 GIGAZINE 30日10時20分
- 2
- 画像内の文字をコピー&ペーストする
ITmedia 30日13時30分
- 3
- 【トレビアンGAME】伝説のクソゲー『チーターマン2』が15年ぶりに復活! ニコニコ動画でブーム
トレビアンニュース 25日12時00分
- 4
- Googleが攻撃する時 -EnjoyPerth.net物語- TechCrunch Japanese 30日09時30分
- 5
- 【気になるトレンド用語】赤福事件の消費期限って、賞味期限と何が違うの? livedoor 30日10時00分
- 6
- 【知っ得!虎の巻】テキパキ仕事ができる!スタートメニュー設定で効率アップ
livedoor 30日10時00分
- 7
- 防衛省、ガンダムを開発中 GIZMODO 30日11時34分
- 8
- 【コラム】 PC初心者のためのデスクトップ衣替えテク R25.jp 30日18時00分
- 9
- 『iPod』ファンの自作CM、ゴールデン・タイムでテレビ放映へ
WIRED VISION NEWS 29日21時00分
- 10
- ネット上で「泊めてください」 家出少女が陥る「売春」
J-CASTニュース 28日12時26分
注目の情報