とりあえず5000冊ほど自炊してみた話　その５　縦線対策: Thor's Novels 更新履歴

2016年04月16日

とりあえず5000冊ほど自炊してみた話　その５　縦線対策

　ドキュメントスキャナで本を電子化する際に避けられない問題は縦線です。本章ではそれに関する対策をまとめてみます。

縦線の原因

　ScanSnapのようなドキュメントスキャナというのは、上下に固定された二つのスキャナの間に原稿を通すことでスキャンを行う仕組みですが、そのときスキャナ面にゴミや汚れがあると、スキャン結果に縦筋が入ってしまいます。
　これが通常のフラットヘッドスキャナであれば原稿や原稿台にゴミがあってもその一点だけの染みなのでほとんど気になりませんが、コミックや写真集などをスキャンする場合はとても気になる現象だと思います。

　縦筋の原因になる物は大きく分けて二つ、製本時の糊の粘りつきと、スキャナ上に乗ったゴミです。

糊の粘りつき

　まず最初の糊ですが、これが粘りつくとスキャン結果に結構太い線が現れます。
　スキャナの読み取り面は結構温度が高くなります。また一般の無線綴じに使われるのはホットメルト型の接着剤です。すなわち断裁時に糊が残っているとあっという間にスキャナ面に糊が粘りついてしまいます。
　これを防ぐには一にも二にも、断裁時に糊を残さないことです。
　また注意すべきは本の扉やカラーページなど、少し堅めの紙が使われているところです。ここは製本時に特別な処理がされているようで非常に糊が残りやすく、そのためにページのくっつきも発生しやすい場所ですので、特に注意しておきます。

　もし糊の残りがあればカットしておくのが一番安全です。しかしノドの奥まで印刷があって切り取りづらいこともあるでしょう。その場合は付箋紙とかを貼っておいてその場所をスキャンしたら即座にスキャナ面に糊がついていないかチェックして、汚れていれば掃除します。

なお、クリーナーのクリーニング後は、マイクロファイバーのメガネふきなどできれいに磨いておかないと、よけいにむらが出るので注意してください。
読み取り面に糊がこびりついていない限りは、ウェットクリーナーで拭く必要はありません。

　また原稿を縦方向にスキャンした場合、切り口付近には糊が粘りついている可能性大です。同じサイズの本をスキャンしていれば、切り口付近に少々筋が入っていても目立たないこともありますが、その後サイズの大きな本をスキャンしたら、ど派手な線がはいってしまうことになります。
　従って原稿サイズが変わるときには少なくとも内部が汚れていないかチェックする必要があります。これは原稿サイズがころころ変わるとその度にチェックして掃除が発生するかもしれないということなので、原稿のサイズはできるだけ一定にしていた方がいいわけです。

　原稿を横方向にスキャンした場合は、縦の時よりは糊の粘りつきは少なくなりますが、粘りつく場合は任意の場所についてしまいます。特に硬い紙質のページをスキャンした後は要注意です。

スキャナ上のゴミ

　続いてスキャナ上のゴミですが、スキャン結果に縦線が出る場合はたいていはこのゴミです。ところがこのゴミの発生源というのが原稿その物です。従ってこれを完全になくすことは原理的に不可能です。
　また縦線が出た場合スキャン面を調べてみても何も見えない方が普通です。というのは目で見えるような大きなゴミはむしろ原稿と一緒に流れていってしまって、非常に小さな物しか残っていないためです。ところがスキャナは例えば300DPIとかいった解像度があるわけで、要するに0.1mm以下の小さなゴミが縦線の原因になってしまうわけです。
　縦線には白い物だけでなく、赤や青の色をした線が出ることがあります。これはカラースキャナは色の三原色RGBを認識する素子を持っているわけですが、そのうちのRの上だけに被さるような小さなゴミが乗ってしまったら青や緑の線が出てくるわけです。

　そういうわけなのでゴミが原因の縦線の場合は、目で見てもどうせ分からないので前述したようにマイクロファイバー製の埃取りが有効です。その際には特に力を入れてごしごしする必要はありません。無理に力を入れると繊維がちぎれてローラーに巻き付いたりします。
　掃除機で吸ったりブロワーで飛ばすのはあまり効果がないばかりか、スキャナの内部にゴミが入ってしまったら修理に出すしかなくなります。

　以下ゴミを可能な限り減らすための基本的な心得です。

スキャン開始前に本体の掃除をしておく。また紙送りローラーのボックス内もゴミが溜まりやすいので定期的に清掃する。その際には静電防止効果のあるクリーナーでスキャン面を拭いておくとある程度効くように思います。
分解・断裁時に本の埃は可能な限り払っておく。
スキャンする前に原稿の4方向をぱらぱらめくってみる。これはくっつきのチェックと共にある程度埃を飛ばす効果もある。
1冊の開始時には必ず、コミックや写真集など画質重視の原稿は1束の開始時にもスキャナ内部を埃取りでさっと拭く。これは面倒なようでも慣れれば自動的に体が動くものです。
多くのページをスキャンしない。ScanSnapは仕様上50枚(100ページ)は余裕で原稿台に乗せられますが、画質重視のものは30枚(60ページ)前後に抑えておく。

原稿のチェック

　以上のように対策を講じても、原稿自体がゴミの発生源である以上、縦線を完全になくすわけにはいきません。従ってスキャンしたあと必ず目視のチェックが必要になります。
　これはもう基本は全ページを見るしかありません。Acrobatで見開き表示にしてぱらぱらとめくっていきます。

　この際に一つ重要なポイントですが、縦線は圧倒的に多くの場合偶数ページに出て、一度出始めるとその後ずっと出ているということです。
　その理由ですが、ScanSnapは二つのスキャナで原稿の両面を同時に読み取りますが、偶数ページとは上側のスキャナで読んだ面になります。ここで機構上スキャナの直前で原稿が30度くらい曲げられますが、そのせいで下側のスキャナは紙の弾力でスキャン面がこすられて、乗った埃があってもすぐに流されていってしまうのに対し、上側のスキャナ面の接触はほとんどないためゴミが一度ついたらそのままになってしまうためだと思われます。
　従ってチェックする場合は主に偶数ページを注意します。もちろん奇数ページに線が出ないわけではありませんが、出てもすぐに消えてしまうことが大半で、見落としても被害は比較的少ないでしょう。

　また線が目立つのは黒ベタなどの黒い印刷面の上です。従ってそういう所では注意して、白っぽいページは高速に飛ばしていっても大丈夫でしょう。

取り直し

　さて、努力にも関わらず縦線が入ってしまった場合ですが、もし諦められない場合は取り直しをするしかありません。
　前節でも書いたとおり、たいていの場合縦線は偶数ページの一定範囲に出ています。もし束が変わるたびに内部の掃除を行っていれば、ある束の途中から縦線が現れて、その他場の終了と共に消えているパターンが大部分でしょう。
　この場合大抵は奇数ページは問題がない物ですが、手間を考えれば奇数ページも含めて取りなおして差し替える方が手間がかかりません。

　取りなおすページが僅かなら、取りなおしたファイルを挿入していらないところを手で消してもいいでしょうが、ページが多いと間違える可能性大です。従って取り直しが数ページを越えるようならページ置換機能で差し替えてしまうのが一番確実です。
　私の場合は以下のような手順で行います。

縦筋の出だしたページの1ページ前（奇数ページ）にブックマーク1をつけます。
縦筋の終わったページ（偶数ページ）にブックマーク2をつけます。
原稿の該当ページを抜き出して取り直します（その結果別ファイルができます）
取り直した物に線が入っていないかチェックします（ゴミがこびりついていた場合は再度同じ線が出ていることもあります）
元データのブックマーク1のページを選択します。
ブックマーク2を表示して、Shiftを押しながら選択するとブックマーク1～2の間が選択されます。
右クリックメニューからページ置換を選択します。
3で取り直したファイルを指定します。
選択範囲とスキャンされたページ数が合っているかどうかをチェックします。
置換の実行を行います。

片面取りテクニック

　前節の取り直しの手段で多くの場合は何とかなるでしょう。
　しかしコート紙に印刷されたカラー写真集のような本の場合だと、取りなおしたのにさらにゴミが出ていて仕方なくもう一度……といったようなパターンがぐんと増えてしまいます。取り直しは1回程度ならまあ仕方ないと諦められますが、何度も何度もとなるとやはり忍耐は限界に来るでしょう。
　そこでこのような線が出やすいにもかかわらずきれいに取りたい本の場合は、片面取りテクニック（もしかしたら筆者オリジナルかも）があります。

　以前にも述べたようにScanSnapはその構造上偶数ページには縦線が出やすく、奇数ページには出にくいという特性があります。従って下面のスキャナのみを使ってスキャンした後、データをマージすればほとんど縦線は出ない理屈になります。
　またスキャナの上面と下面ではカラーの色合いが微妙に違っていて、見開きの写真ページなどで右と左で違って見えることもあるのですが、その問題も解決できます。

　そういうわけで写真集のような本の場合以下の手順を行えば、普通より少々手間はかかりますがほとんど取り直しのストレスなしに作業が行えます。そのためには次のような前準備が必要です。

ファイルのリネームツールをどこからか入手してインストールしておきます（私の場合は「お～瑠璃ネ～ム」というのを使っています）
デスクトップとかにあらかじめ「奇数ページ」と「偶数ページ」といった名前のフォルダを作っておきます。
またこのフォルダの表示オプションは「詳細」にしておくのがいいでしょう。

　以上の準備ができれば以下の手順で作業を行います。

カバーなど、両面取りしていてもいいところを取って、表紙などの処理をしてデータを作っておきます。
続いて本文をScanしますが、その際に本体のScanボタンを使わず、タスクバーにあるSacnSnapマネージャアイコンを右クリックして、そのメニューの中の「片面取り」を実行します。そうすると奇数ページだけScanされたファイルができます。
データの内容をチェックして筋が入っていないことを確認したら、全ページを選択して各ページを別ファイルで「奇数ページ」フォルダにページ抽出します。
続いて原稿全体をひっくり返してこんどは偶数ページだけを片面取りします。
奇数ページ同様に内容チェックして「偶数ページ」フォルダにページ抽出保存します。
この偶数ページは最終ページから順に取られているのに注意してください。そこで「偶数ページ」フォルダはファイル名をを逆順にソートしておきます。
ファイルのリネームツールで、奇数ページフォルダ内のファイルを例えば xxx奇数ページ.pdf 偶数ページフォルダ内のファイルを yyy偶数ページ.pdf （xxx,yyyは昇順の連番）というような形式にリネームします。
続いて奇数ページのPDFファイルをすべて偶数ページに移動します。その結果、偶数ページフォルダには例えば、048偶数ページ、048奇数ページ、047偶数ページ、047奇数ページ……といった形で後ろから前にファイルが並ぶでしょう。
その状態でファイルをエクスプローラー上で全選択して、Acrobatの1で作ったデータの該当場所にドラッグドロップすれば、奇数ページ偶数ページが正しくマージされたデータが出来上がります。

　これは前回うっかり前後逆にスキャンしてしまった場合の直し方の応用です。手順は少々長いですが、全てが機械的作業なのでチェック、取り直し、チェック……の無限ループにハマることがありません。

フォルダ名を「奇数ページ」「偶数ページ」としているのは、エクスプローラー上のソートで“奇”が“偶”の前に来ることを利用しているので、ODD, EVEN としてはいけません。

　前回、次回最終回とか書いた気がしますが、あと一回あると思います。
　ただ残りは後始末に関してと後書きなので、まあこれで今回の「とりあえず5000冊ほど自炊してみた話」はだいたい終わりです。
　

Thor's Novels 更新履歴