2018年10月7日午後、個人的にかなりショッキングなニュースが飛び込んできた。読書録データベースである「メディアマーカー」(MediaMarker)サービスが来年の 1月に終了してしまうというのだ。Amazon からのデータ提供がされなくなり、サービスが続けられなくなったとのこと。
「メディアマーカー」については、2009年のサービス開始当初から、約10年にわたって、自分の読書録・蔵書データベースとして活用し、本・Kindle だけでなく、CD、DVD(Blu-ray)も登録してきた。自分のための読書メモ・備忘録であり、また重複して購入することを防止するためのデータベースでもあった。登録件数は、約5,500件。この自分の10年分の記録を、これからどうすればいいのだろう? さて困った…。
いくつか同様の読書録サービスを探し、「メディアマーカー」ほど多機能ではないが、「読書メーター」か「ブクログ」に行き当たった。この二つを比較して、「ブクログ」に移行することにした。なぜならば「読書メーター」で登録できるのは本・洋書・Kindleのみだが、「ブクログ」では、Amazon で購入できるものは何でも、つまり CD も DVD も登録できるからである。またデータのエクスポート機能があるので、将来「ブクログ」が終了するようなことがあっても、データだけは取り出せると考えた。
そして数時間かけて、「メディアマーカー」から「ブクログ」へのデータの移行を行った。基本的には「メディアマーカー」から CSV ファイルをエクスポート(export)して、それを「ブクログ」向けに編集してから、「ブクログ」にインポート(import)する。試しに 1時間ほどかけて1ヶ月分のデータでやってみたら、うまく行っていそうだったので、次に 10年分、5,500件すべてを移行した。Excel で 5,500件のデータを扱うのは重く、編集に時間がかかるので、いくつかに分けてやるのも一法であろう。
CSV ファイルはテキストファイルなので、Ruby などのプログラムで変換するのが最も楽であろう。要するにこういう変換をすればよいのである。
ここでは Excel を使って CSV ファイルを編集して、「ブクログ」へ移行する手順をまとめておく:
(1) 「メディアマーカー」からデータを CSV 形式でエクスポートする
- 「メディアマーカー」の CSV エクスポート機能 を使う。
- エクスポートする項目:カテゴリ、ISBN/JAN、ASIN(アマゾン商品コード)、タグ、コメント、評価、購入日、状態、読了日
下図ではエキスポートする際の「並び順」は「降順(2018→2017)」となっているが、実際には「昇順(2017→2018)」の方がよい。「ブクログ」に登録する際に、古いものから順に登録されるからだ。降順にしておくと、新しいものほどファイルの上位の行に来るため、「ブクログ」への登録順が早くなり、登録順が逆転してしまうことになる。
(2) できあがった CSV ファイル "MediaMarker.csv" を Excel で編集する
「メディアマーカー」と「ブクログ」のデータ項目の対応関係は、概ね以下の通りとなる:
ブクログ | メディアマーカー | 補足 |
---|---|---|
サービスID | Amazon.co.jp = 1 / Amazon.com = 2 | |
アイテムID(ASIN) | ASIN | |
13桁ISBN | ISBN/JAN | |
カテゴリ | カテゴリ | |
評価 | 評価 | |
読書状況 | 状態 | 値が違う:「読みたい」←「未読」など |
レビュー | 公開されるレビュー。コメントと対応させてもよい | |
タグ | タグ | 書式違い:,で区切るか、改行で区切るか |
読書メモ(非公開) | コメント | 非公開の読書メモ |
登録日時 | 購入日 | 登録日はインポート時に上書きされてしまう |
読了日 | 読了日 |
- 上記の対応関係に合わせて、CSV ファイルの項目に相当する列を追加したり、列の順番を入れ替えたりする。
- 「サービスID」と「レビュー」列を追加。「サービスID」のすべての値に 1 を設定(Amazon.co.jp に相当)。「レビュー」は空欄にしておく。
- 「レビュー」には「コメント」をすべてコピーしてもよい。ただし「ブクログ」では「レビュー」は公開されるので要注意。非公開の「読書メモ」が別途用意されている。
- 列の順番を入れ替える:(左から)サービスID, ASIN, ISBN/JAN, カテゴリ, 評価, 状態, レビュー, タグ,コメント, 購入日, 読了日
- セルの書式設定を行う:
- 購入日、読了日:「ユーザ定義」で yyyy-m-d h:mm とする。
- ASIN:文字列
- ISBN/JAN:数値
- 「状態」列:値を下記のように置換する。
- 「未読」 → 「読みたい」
- 「読中」 → 「いま読んでる」
- 「読了」 → 「読み終わった」
- 「未読」 → 「積読」に置換することも考えられるが、僕の場合、未購入のものも登録するので「読みたい」に置き換えることとした。
- 第一行(項目名)を削除、データだけのファイルにする。
- 編集した Excel ファイルを CSV 形式で保存する("MedifaMarker.csv")。
- このファイルの拡張子を txt を変更、テキストファイルとする(”MediaMarker.txt”)。
(3) CSV 形式のテキストファイルを「ブクログ」でインポートする。
Amazon にないデータは移行できなかったり、複数のタグの処理をサボったりしたので、いくつか小さな課題はあるものの、「メディアマーカー」終了のニュースを聞いてから、取り急ぎ2-3時間程度の作業で、「ブクログ」への移行ができたので、ホッとしている。「メディアマーカー」は自分用のメモを残すコンセプトだったが、「ブクログ」はレビューを投稿し合う SNS のようなコンセプト。今のところメモは、非公開の自分用として残し、レビューとして公開することは控えておくつもりである。
そんなわけで、「ブクログ」の「muranaga の本棚」もよろしくお願いします。
booklog.jp