« PDF-Viewer Ver2.5(Build200) | メイン | Adobe Reader 印刷ダイアログ »

2011/12/17

PDF-Viewer OCR機能

PDF-XChange ViewerはフリーのPDFビューワーである。

Ver2.5(Build200)で、フリーでOCR機能が使えるようになった。

Ocr001 ドキュメント/OCR Pages...以下

試にマニュアルから画像だけのテキストの無いPDFを作成し、
そのPDFにOCR機能を利用してテキスト抽出し、できたPDF
のテキストを選択コピーし、テキストエディタに貼り付け、調べた。

一部の文字が誤変換等(*注)が確認されたが
おおむね変換ができていた。フリー版で使えるのはGood!!

(*注)試行結果(誤変換例)
(オリジナル)This was the very first build incorporating **NEW** features
(OCR)This was the very
?rst build incorporating **NEW** features

(オリジナル)o  PDF-XChange PRO Version 4
(OCR)0 PDF
)(Change PRO Version 4

日本語のOCRはサポートがまだ無いと思っていたら、日本語の言語パックを
追加することで選択肢に追加された
。まだ実験はしていないが興味のある方は
試行してはいかがでしょうか?(図は日本語の選択肢を選んだところ)

Ocr_j1 

なお「OK」でテキスト抽出したら、そのPDFを別名で保存するだけです。

----皆様の「拍手ボタン」クリックが、Blogオーナーの励みとなります!
拍手する --クリックだけでは個人情報は送信されません。

トラックバック

この記事のトラックバックURL:
http://app.blog.ocn.ne.jp/t/trackback/215957/22992725

この記事へのトラックバック一覧です PDF-Viewer OCR機能

コメント

こんにちは
ヤフー質問広場から来ました。
先程は私の質問への回答ありがとうございました♪

何回も追記できるとばかり思っていたので焦ってしまい、ここにたどり着くことができました。

フローティングツールバーのことですが、言われたとおりに環境設定→インターネットの閲覧モードを解除をしてみました。

そうしたら、フローティングツールバーが消え、上の方にメニューが出てきました(以前は消えるフローティングしか出ませんでした)

なんか、1歩前進した気がします!!!!ありがとうございます!!

でも上の方にメニューバーでは保存マークをクリックしても反応がありませんでした。
消えるフローティングツールバーも同じような感じで反応がなかったので、少し心配。

上に出てきたメニューバーで反応があったのは唯一、拡大%だけでした^^;

なんででしょうかね~~;

ほとほと困ってしまいます。

一度アンインストールした方がいいでしょうか??

わかる範囲でまた何かありましたら是非!!!助けて下さい。

長文すみませんでした。

初めまして。pdf xchange viewerが気に入りPRO版のライセンス入手した者です。OCR機能で基本的な使い方を教えてください。日本語のデータインストールしLanguageにjapaneseも表示されています。スキャナーした文字画像をOCRでテキスト変換したいのですが、OKボタンで何やらミドリのバーグラフ表示の後、そこでストップします。ファイルは出来ているのでしょうか。どこに作成されるのですか?PC内探しても見つかりません。宜しくお願いします。

toshiさんへ
訪問&書き込みありがとうございます。
OCRのダイアログで設定後「OK」とすると緑のバーが進み
完了すると思うのですが、その状態でOCRが済んでいますので
そのPDFを名前を付けて保存するだけです。
日本語の試行は時間が取れればテストしてみたいと思います。
P.S.
Pro版を購入されたのですか。それはすごいですね。

ご回答ありがとうございます。たぶん私の場合エラーになって途中でストップしているのだと思います。ファイルは出来ず「元の画面に戻ってしまいます。エラーと表示してくれれば良いのですが、何事もなかったかのように元の画面に戻ります。理由がわかりません。もっと調べてもます。ところでPREO版は3000円でおつりがきますよ。クレジットカード不要で購入出来ます。http://www.altech-ads.com/Others/payment.htm#atm

適当なサンプルの画像(1枚)をPDFに変換して、OCR機能を日本語でテストして見ましたが、
緑のバーが67%で止まった状態で、放置していたら、いきなり100%となり終わりました。
フォントをコピーして適当なエディタに貼り付けると化け化けで日本語になりませんでした。
プロパティからフォントを確認するとArialMTでした。
時間を見てまたテストしたいと思いますが、試行ではダメでした。

1月23日付でバージョンアップされています。多少の変換違いはありますが、日本語も埋め込まれるようになりましたよ。

takeさんOCRの情報ありがとうございます。
確かに新しいバージョンだと日本語のフォントが抽出されますね。
それでも先のテストサンプルでは、化け化けでしたが、
もう少し文字サイズが揃っているものでテストしたら、かなりマシに
なりましたので、ものによっては使えるかもしれません。happy01

コメントを投稿

コメントは記事の投稿者が承認するまで表示されません。

2012年8月

      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  

最近の記事

最近のトラックバック

OCN 検索

Powered by Blogzine[ブログ人]