2010年03月06日

本の電子化を始めたのでまとめる。 このエントリーを含むはてなブックマーク

電子化00

 大阪から東京への引越しを機に、前からやってみたいと思っていた本の電子化をすることにしました。

理由

 2DKから3DKへの引越し。もともとは増えた一部屋ぶんの壁を本棚で埋め尽くそうと計画していたのですが。

 電子化の実行に踏み切った理由は、荷造りで部屋を埋め尽くした本入り段ボール箱の山を見て「うへぇ」と思ったからです。これは減らしていかないといつか地震で押し潰されて死んじまうなと。

 もう一つの理由は、通勤で電車に乗る時間が片道40分に増えたから。職場が近いと家賃が高いし電車が混む場所なので、40分かかっても座れる方を選んだのです。往復80分あれば随分と本が読めますよね。

 普通に本持ってけって話ですが、時間を考えると2〜3冊は持ち歩きたいところ。なので嵩張らないように持ち歩けるのはありがたいのです。

 前置きが長くなりましたが、以下に俺自身が試行錯誤して落ち着いたスキャニングの方法について書いていきます。「漫画の電子化の方法」(以下、「電子化」)を参考にさせていただきました。


電子化する本

  • 完結している漫画
  • 文庫と新書の小説
  • 実用書・参考書の一部
  • カタログ系の雑誌

 漫画は容量圧縮と軽快に読むためにJPEGにしてZIP圧縮、それ以外の本はOCRをかけてテキスト検索ができるようにPDFにします。

 サンプルとして取り込むのは「神聖モテモテ王国」の6巻です。理由。最初の画像を「電光石火供えガイ」の戦闘シーンにしたかったから。


使用機材

scansnap S1500

FUJITSU ScanSnap S1500 FI-S1500FUJITSU ScanSnap S1500 FI-S1500
販売元:富士通
発売日:2009-02-07
おすすめ度:4.5

 「電子化」で紹介されているスキャナの新型ですが、実売37000円ぐらいと、より安くなっています。そして嬉しい誤算がそのサイズ。A4プリンタぐらいの大きさを想定していたのですが、思いのほか小さい! これなら常に机の上に置いていてもほとんど邪魔になりません。

電子化01
サイズ比較

 S1500Mという型もあって、どちらを買えばいいのか迷ったのですが、S1500MはMAC用でした。


裁断機 PK-513L

プラス 断裁機 裁断幅A4 PK-513L 26-106プラス 断裁機 裁断幅A4 PK-513L 26-106
販売元:プラス
発売日:2009-09-01
おすすめ度:4.5

 こちらも新型ですが、変わったところはカットラインを照射するための電池が単2から単3になっただけの模様。で、こちらは3万強。「電子化」では実売2万強とありますので、旧型から随分価格が上がっています。スキャナが安くなってる分とでトントンですかね。

 ちなみに取説は刃の交換時の分解方法とか大事なことが書いてあるにも関わらずペラ1枚の頼りないものなので、記念すべき初スキャン対象となりました。

 合わせて7万弱。高いと見るか安いと見るかは人それぞれ。「本を置く空間分の家賃を考えたら得」なんて意見もありますが、俺はそれを支持しません。だって本はそこにある事自体嬉しいんだもの。

 まあそれで収まりきらなくなったから電子化するんですけどね。


裁断(本)

 「電子化」と同じ。カッターで本を裁断機に入る厚さに分割したら、背表紙部分を4〜5ミリ切り落とします。紙の束が一気に「ブルルルッ」っと切れる手応えが気持ちいい。

電子化02
分割

電子化03
アンド裁断

 本を裁断するという行為は、初めのうちは結構心にダメージがきます。「やっちゃった感」というか。なので慣れるまでは比較的どうでもいい本からやるといいと思います。コンビニ売りの漫画総集編とか。

 また、糊残りには本当に注意が必要です。S1500はダブルフィード(重なり)検出機能がついているので、ページがくっついてしまうぐらいならすぐにやり直しが効くので良いのですが、読み取り面に糊がついてしまうと、これがなかなか落ちないのでかなり切ないことになります。(体験済み)

 糊残りに限らず、読み取り面の汚れは致命的なので俺はレンズ掃除の定番、無水エタノールとキムワイプを購入しました。専用のクリーナーは高すぎるので。

無水エタノールP 500ml無水エタノールP 500ml
販売元:健栄製薬
発売日:2007-03-29
おすすめ度:5.0

武藤工業 キムワイプ 12×21.5cm /1箱(200枚入) S-200武藤工業 キムワイプ 12×21.5cm /1箱(200枚入) S-200
販売元:武藤工業
おすすめ度:5.0

 ちなみに切り落とした背表紙の部分ですが、これがしっかりと糊付けされた「丈夫な紙の棒」と化します。「かしこい主婦」ならうっかり小物入れや小物入れや小物入れを作ってしまいそうな素材感ですが、残しておいても何の役にも立たないのでとっとと捨てましょう。

電子化04
雑誌の背表紙。立派なのでなんとなく捨てづらい


裁断(カバー)

 作者が渾身の力を込めて描いた漫画のカバーは、どうせならカラーで残しておきたいところ。いろいろ取り込み方法を考えたのですが、

  • 広げてそのままscansnapで取り込み
      → どうしても折り曲げ癖のところで影ができる。
  • アイロン等で伸ばしてみては?
      → めんどい。あとたぶん熱で表面が溶ける。
  • フラットベッドスキャナで取り込み
      → 後でトリミングが必要

  •  ということで、これらの方法は断念。背表紙は断腸の思いで諦めて切り落とし、表紙・裏表紙に分けて取り込む事にしました。

     糊残りの心配はないので、本のサイズに合わせてカット。背表紙部分のたるみは刃の横のガイドが押さえてまっすぐにしてくれるのでそのまま行っちゃってOK。

    電子化05
    ピシッと伸ばしてくれる

     折り返しの部分はそのまま読み込ませるので、伸ばさずに。たまに折りが甘い本があるので、逆にしっかり折っておきましょう。俺は風邪薬の小瓶でぐぐっとしごいています。

    電子化08
    下拵え完了


    取り込み設定

     scansnapの設定。俺の場合は「ファイン」「カラー」「両面読み取り」で「継続読み取り有効」。オプションで「文字をくっきりにします」にチェック。その他自動補正系のオプションはOFF。

    電子化06

     とにかく「楽に・早く」電子化できることを主眼に置いているので、取り込みに時間がかかる設定はNG。取り込み後もレタッチやサイズ圧縮が不要、なおかつ画質もあまり劣化しない設定を探して色々試したところ「ファイン」に落ち着きました。

     取り込みスピードやHDDの容量に対して、自分の画質に対する許容範囲、本への思い入れを天秤にかけて決めれば良いかと思います。俺も本によっては「スーパーファイン」や「エクセレント」で取り込むつもりでいます。

     なお、白黒の漫画もカラーでスキャンします。理由は後述。


    スキャン(本)

     スキャン開始。一度に全部は読み込めないので適当に分けて読み込ませます。継続読み取りを有効にしてあるので、分割しても1つのファイルとして保存されます。

     「電子化」にならって原稿は横向き。縦に入れると確かにずれます。原因は、原稿の幅が完全には一致していないから。裁断するときに本が押しつぶされるので、少しだけ歪むんですね。それがズレを生む。多少の傾きは気にしないのならば後の回転処理が省略できるので、縦に読み込ませるのも有りです。

    電子化07
    ブックエンドをストッパー代わりに

     このブックエンドが重要。これがないと吐き出された原稿が滑ってしまって、順番どおりに重ならない場合が多々あります。もし汚れなどでスキャンがやり直しになった場合を考えてください。背表紙なしでページを正しく並べ替えるのは想像以上の苦行です。(体験済み)

     悪いことは言いませんので、100円ショップにでも行ってブックエンドは用意しておきましょう。

     (2010/3/7修正)本体上面がまるごとガパッと開いて排紙トレイになりました。ブックエンド要らないわ。コメント7番さんご指摘ありがとうございます。富士通さんごめんなさい。

     (2010/3/9追記)原稿のサイズにもよると思いますが、ブックエンドの方が安定するかも。排紙トレイの上で滑っちゃうので。


    スキャン(カバー)

     漫画本編をスキャンし終えたら、一旦名前をつけて保存。カバーのスキャンをします。継続読み取りでひとつのファイルにまとめることも可能ですが、カラーとグレースケールで後の処理が異なるのであえて別のファイルに分けます。

     カバーは折り返し部分から読み込むように原稿をセットします。逆にするとめくれて折れ曲がってぐしゃぐしゃになって、ひどい目に遭います。
    (体験済み)

     さて、カバーを折ったままスキャンすると、ダブルフィード検出機能が働いてエラーが出ます。

    電子化09
    エラーメッセージ

     ここで最後に読み取った原稿を「残す」にチェックして「読み取り中止」を選択。読み取ったファイルを削除するかどうか再度確認されるので「いいえ」を選択。これでスキャン結果を保存できます。これを表紙と裏表紙に対して行い、それぞれ別のファイルとして保存。

     ちなみに俺は「本の名前_表紙.pdf」「本の名前_本編.pdf」「本の名前_裏表紙.pdf」という名前で保存しています。こうすると文字コードが表>本>裏の順なので、名前でソートされるビューワを使うといい感じで順番どおりに表示されるのです。

     以上、ここまででスキャンは終了。


    回転と書き出し

     scansnapにはAdobe Acrobatがバンドルされています。以降の処理はAcrobat上で行います。

     PDFファイルを開いて、「文書」→「ページの回転」(ショートカットはCtrl+Shift+R)で偶数ページ・奇数ページをそれぞれ逆方向に90度回転。回転の方向はスキャンさせた向き次第。

    電子化10
    回転

     次に、ファイルサイズ圧縮&ビューワで軽快に読むためにJPEG書き出しをして圧縮します。が、pdf上での回転はどうも書き出しファイルには反映されないようです。

     そこで、Acrobatの良くわかんない仕様を利用します。カラースペースの変換をさせると何故か回転が反映されて書き出されるのです。

     白黒の漫画をグレースケールではなくカラーでスキャンした理由がここにあります。「ファイル」→「書き出し」→「画像」→「JPEG」を選択、「名前をつけて保存」ウィンドウが出たら「設定」ボタンを押してカラースペースを「グレースケール」に設定。

    電子化11
    JPEGとして保存 の設定

     これでJPEGに書き出すと、正しい向きでグレースケールの画像が出力されます。ここにたどり着くまでにえらい時間かかったよ…。

     カラーで保存したい表紙・裏表紙は仕方ないので横向きのまま書き出してJPEGを回転。回転にはPicasaを使っています。フリー・ロスレス回転・複数ファイルのドラッグ選択可能というのが選んだ理由。

     漫画をグレースケールでスキャンして横向きのまま書き出し、Picasaでカバーと一緒に回転させるという手もあるのですが、200枚前後のJPEG保存って意外と時間がかかるんです(2〜3分ぐらい)。

     Acrobatからの書き出しで時間をかけて、回転後の保存でさらに倍。マシンパワーに依存する部分が大きいと思いますが、俺の環境ではカバーと本を分けて処理するのが一番早かったということです。もっとも、オールカラーの本は素直にJPEGにしてから回転させるしかありませんが。

     最後に全てのページをzip圧縮して保存。以上、ここまでで12〜3分。JPEG書き出し中に次の本の下拵えをして時間の無駄をなくせば、1時間で5冊といったところ。ファイルサイズは本によりますが40M〜60Mぐらいになります。

     画質はこんなもん(等倍で切り出し)。

    電子化12
    サンプル1

    電子化13
    サンプル2


     等倍だとモヤッとしたモスキートノイズが気になるかもしれませんが、ビューワーで縮小されるとほとんど分かりません。解像度的にフリガナがつぶれないか不安だったのですがバッチリ読めます。

     ポツポツと見える汚れのようなものは、紙の粒子がスキャンされて、モスキートノイズがまとわりついたもの。これも縮小されればどうってことないのですが、どうしても気になるならばレタッチして消しましょう。

     

    漫画以外

     漫画以外はPDFで保存するので、Acrobat上で回転させたらおしまい。必要に応じて「文書」メニューからOCRをかけて検索可能に。小説ならはじめからグレースケールでスキャンしてしまえばいいし、読み取りオプションの傾き補正や原稿の向き判別も文字相手ならかなり賢く働いてくれるので、手間も時間も漫画よりずっと少なく済みます。

     一番めんどくさい漫画がちゃんとスキャンできるようになれば、大抵の本は応用でどうとでもなります。用途に合わせてカスタマイズしましょう。


    読む方法

     漫画(JPEG)はleeyes(PC)とicomic(iPhone)。
     PDFはAcrobat(PC)とGoodReader(iPhone)で読んでいます。

    電子化14
    icomic

     iPhoneの小さい画面でも漫画が十分に読めるのに驚き(流石にフリガナは潰れますが)。電車で立っていても吊り革を掴みながら片手で本が読める。素晴らしい。たくさん本を持ち歩ける以上のメリットかもしれません。じっくり読みたければPCで開けばいいしね。


    向いてる人

     以上で電子化手順の説明終わり。最後に自分でやってみて、「こういう人は電子化するといいんじゃない?」というのを挙げていきます。
    • 本が多すぎて部屋が埋もれそう
      • 大前提
    • 古本屋によく本を売りに行く
      • 二束三文で売るぐらいなら…という話
    • 同じ本を何度も読む人
      • デジタルデータは痛まない
    • 古い本をいっぱい持っている
      • 茶色く焼けた本もグレースケール化で新品のよう
        • 古本屋と相性抜群
    • モバイルで閲覧する手段がある
      • 蔵書をデジタルライブラリ化するメリットが飛躍的に上昇します。どこにでも大量の本を持ち歩けるというのは想像以上に便利
        • ジョジョを全巻持ち歩いていつでも読めます
    • ある程度大雑把な人
      • 75点ぐらいのスキャンは簡単にできますが、そこから100点に近づけていこうとすると、とんでもなく手間がかかります。ページごとに傾き補正、ガンマ調整、ノイズ除去…
        • 完璧主義者は労力が割に合わないのでやめといたほうが無難です
     こんなところでしょうか。特にiPhoneを持っている人には強力におすすめ。参考書を何冊か入れとけば、隙間の時間をかなり有効に使えること請け合いです。そして疲れたら漫画や小説で息抜き。俺なんか最近は図書館で借りてきた本までスキャンしたい衝動に駆られて大変です。


    トラックバックURL

    コメント一覧

    1. Posted by g   2010年03月07日 00:25
    凄く参考になりました。
    なんかのスイッチが入ったらやってみようと思います。
    2. Posted by サイトウ   2010年03月07日 01:14
    本棚の本が、縦と横に重なり、みっしりと詰まっている現状を、どうにかしないと…と思っていたので、熟読しました。
    デジタル化に向け、お金を貯めようと思います。
    親には見せられないような本にも、有効ですね!
    3. Posted by なたろに   2010年03月07日 12:10
    5 参考になります。自分も引越し前で本の段ボールの山を見てウンザリしてた所なので。ただ、スキャン後の本を処理する時も切なくなりそうですね。
    4. Posted by Melの   2010年03月07日 12:14
    将来、閲覧用デバイスの解像度や保存容量が向上したときに気になりそう…
    5. Posted by     2010年03月07日 12:53
    自分も同じことを考えて実行した時期がありました。
    が、スキャンする手間(自分の人件費)を考えて止めてしまいました。
    ビデオのダビングのように、一冊数百円程度で代行してくれるサービスが
    あったらいいのにと思ったり。
    6. Posted by     2010年03月07日 14:42
    早くこんなことしなくとも手軽に本を持ち歩けるようになって欲しい。正当な対価なら払うからさ。
    しかしいつになるかわかんないし、使い物にならないDRMがつけられてて結局ダメな気もするけど。
    そこでAppleには期待してます。「黒船」として馬鹿な井の中の蛙達を蹴散らして欲しい物です。
    7. Posted by     2010年03月07日 16:02
    スキャンするとき排紙トレイを出しておけばブックエンド要らなくないですか?
    8. Posted by 石橋   2010年03月07日 16:32
    >gさん
    なんかきっかけは必要ですよね。
    それなりの初期投資が必要になるし。

    >サイトウさん
    それでも本って捨てられないんですよね。
    裁断・スキャンしたあとの本でもちょっと抵抗あったり。
    親に見せられない本には超有効。

    >なたろにさん
    引越しはほんとにいいきっかけになりました。
    とにかくものを減らしたくなりますから。

    >Melのさん
    そしたらもう一冊買いますかねぇ。

    >5
    確かにそれなりの手間はかかりますね。
    まあ、本棚にある程度の余裕を残す目的でちょこちょこやっていく分には許容範囲です。
    本棚全ての完全電子化を目指したらやってらんないですね。

    >6
    日本の出版社はダメな感じですねぇ。音楽業界と同じか余計酷い有様になると予想。

    >7
    排紙トレイに気づいてませんでした。記事修正しました。ありがとうございます。
    9. Posted by 繊細居士   2010年03月07日 17:59
    5 ふむう…次はトンカツを取り込むのじゃよ?
    10. Posted by 苺   2010年03月07日 19:20
    付属の「ScanSnap Organizer ビューワー」で回転やらページの移動、複数PFDの合成、傾き補正、などいろいろできますよ。

    11. Posted by 石橋   2010年03月07日 19:42
    >繊細居士さん
    おいしい味だぜ。

    >苺さん
    両方試してみて、Acrobatの方が便利だと思ったのでそっちを使ってます。
    12. Posted by キムタオルについて   2010年03月07日 20:14
    キムワイプは繊維が硬いので読み取り面に傷が付くかもしれません。お勧めしかねます。
    もっとも、読み取り面よりも別の場所が先に壊れるから別にいいと言う考え出したらOKです。
    アマのアソシエイトの都合は理解しますが、ケイドライかせめてめがね拭きのようなものにして下さい。
    13. Posted by hnakamur   2010年03月07日 22:58
    横向きにしてスキャンというのはいいですね。今度やってみよう。
    背表紙の話ですが、私は背表紙は裏表紙との間だけカッターで切って、A3キャリアシートに入れて表表紙を表、表表紙の折り返しと背表紙を裏という両面でスキャンしています。
    14. Posted by 石橋   2010年03月08日 07:28
    >キムタオルについて さん
    仕事の関係で光学機器をよく扱うのですが
    ガラス面はキムワイプで拭いちゃいますけどね。
    よっぽど力を入れなければ大丈夫だと思ってますが。

    アソシエイトの都合とはどういう意味でしょう?

    >hnakamurさん
    折り曲げてキャリアシートというのは試しましたね。
    どうしても綺麗に読み取れなかったんですが、
    そうか、切ればいいのか。
    次からやってみます。
    15. Posted by キジモナカズバ   2010年03月08日 23:23
    acrobatの回転は、png形式だとちゃんといけます。
    私はカラーpngで出力して、藤でタテサイズをそろえてグレスケ化&白色化しています。

    あと、読み取り面に付着した糊は、iPodについてるメガネ拭きみたいなやつで拭くときれいになります。
    これ一枚で1年近く使ってますがへっちゃらです。
    16. Posted by 石橋   2010年03月09日 21:40
    なるほど。
    pngだと可逆圧縮だしアリですね。
    ファイルサイズ次第ですけど。

    icomicもpng読めるみたいだし試してみよっかな。
    17. Posted by 長野   2010年03月10日 00:01
    ふと思ったんですが、スキャン後に本を処分してディジタルデータだけ残すって、現行法的にはどういう扱いになるんでしょうか。バックアップ?
    スキャン後の本を誰かに譲渡しなければ大丈夫なのかな?
    18. Posted by あ   2010年03月10日 11:48
    ↑それはもう個人の常識の範囲で考えてって感じでは
    でもiPadとかkindleとか流行ったら問題になるかもね・・・

    最近は本を買うとネットからPDF版をダウンロードできますって本も出て来て嬉しい限り
    あと技術系雑誌のバックナンバー1年分をDVDにとかも嬉しい

    >PDFの画像回転
    私もハマりました、なんで出力すると元のままやねん!と
    結局、まめFile(ファイラー)で奇数?偶数?ファイル選択とかして一度フォルダを分けて、後はそれぞれPhotoShopでバッチ処理(回転、グレースケール、解像度、JPEG化)して、最後にzip圧縮してました
    19. Posted by 石橋   2010年03月10日 22:56
    >長野 さん
    私的複製の範囲でOKじゃないかと思ってます。

    >あ さん
    あの仕様なんとかして欲しいですよねえ。

    なんだかんだで電子化してる人は多いのね。
    20. Posted by 石毛   2010年03月13日 13:41
    引っ越したと思ったら、こんなことしてたのね。
    内閣総理大臣織田信長を電子化して欲しいから、新居にお邪魔しよかな。
    21. Posted by 石橋   2010年03月13日 20:02
    >石毛

    いいよ

    めんどいから作業自分でやってね
    代行って法律的にもややこしそうだし
    22. Posted by g   2010年03月19日 19:55
    割とあっさりスイッチがバチリとONになったので裁断機とスキャナを買ってしまいました。そしたら直後にパソコンがブッ壊れるという悲劇。

    一点質問があります。これ、スキャンしたデータってどうやってバックアップされてますか?完全な信頼性なんて存在しないと分かっているのですが、参考にさせて戴きたく。

    個人的に脳内では、外付けHDDにでもバックアップしときゃ十分かなと考えてるんですが、不幸な事故を避ける手段が他にありませんかねえ。
    23. Posted by 石橋   2010年03月19日 21:09
    そりゃ難儀なことで…。

    俺は1TのHDDを同時に買ったので、それに入れてます。

    でもHDDは基本的に消耗品だと考えてるので、ある程度たまったらDVDに焼くつもりです。
    本棚丸ごとクラッシュとか洒落にならん。

    1枚で50~100冊ぐらいですかね。
    こまごまバックアップ取るのも煩雑なので
    BD-Rドライブも安くなったら検討対象ですね。
    24. Posted by tagomori   2010年03月22日 11:43
    裁断本買い取ります。
    よければメールください。
    よろしくお願いいたします。
    高い値段では買い取れませんがアマゾンギフトカードでお渡しします。田子森美佐子

    コメントする

    名前:
    URL:
      情報を記憶: 評価:  顔   星
     
     
     
    スポンサードリンク
    アーカイブ
    管理人
    人気・注目エントリー

    アクセスランキング
    ツール



    グーグル ページランク


    ブログパーツ

    track link機械



    あわせて読みたいブログパーツ

    ブログパーツ アクセス解析