2010年08月29日

PDFの透明テキスト(非表示テキスト)の一括削除方法

自炊したPDFを、ScanSnap Organizerの方の機能でOCR認識をさせたときに、ずいぶんOCRの精度が悪かったことがあった。それで、Adobe Acrobatの方でOCR認識をやり直そうと思ったのだけれど、すでに作ってしまった透明テキストを削除する方法がわからなかった。

ずっとわからなかったけれど、本日やっと透明テキストの削除方法を見つけたので、その方法を記録しておきます。Windows版、Adobe Acrobat 9 Standardの場合です。

(1)「文章の検査」をする
メニューから「文章」>「文章の検査」を選んで、「文章の検査」をする。
01.png


(2)「文章の検査」の結果が出るのを待つ
「ページを検査中」と出るのでしばらく待つ。
「結果:」として、「メタデータ」や「非表示テキスト」などといった項目が出てくる。
文章の検査を終えるまで、やや時間がかかる。
02.png


(3)「非表示テキスト」を選んで削除する
「結果:」に表示されている「非表示テキスト」を選んで、一番下に出ている「削除」ボタンを押す。
03a.png


注意書きが出るので、問題なければ「OK」ボタンを押す。
03b.png


(4)削除が完了するのを待つ
「ページから選択した項目を削除中」という表示が出て、「メタデータ」や「非表示テキスト」という項目の削除が開始される。
削除も検査と同じくらい時間がかかる。
04a.png


しばらくすると、透明テキスト(非表示テキスト)の削除が完了する。
04b.png


もっと簡単な方法があれば教えてください。
posted by いくるみ at 20:29| Comment(0) | TrackBack(0) | Adobe Acrobat | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

この記事へのトラックバックURL
http://blog.seesaa.jp/tb/160955775

この記事へのトラックバック