2014-04-08
■[研究] 書誌情報と論文PDFファイルの管理法
ここ1〜2年の書誌情報と論文PDFファイルの管理法。以前はこちら:私の論文メタデータ管理法。
まとめ
前提
- 基本の仕事環境はLaTeX(今はUbuntu)
- emacsの辞書連携およびスペルチェッカーが非常に便利なのでエディタとしてemacsを使う
- 論文はLaTeXで書く
- Windowsも利用
- 授業で使うスライドや各種事務書類はMS Officeを利用
- 自宅でネットサーフィンするときはたいていWindows
- 出張時にはノートPC利用
- 論文はiPadで読みたい
以上のことからPC3台利用&各PC上にWindows環境とLinux環境がある。そして、iPadも使うというのが私の環境。この環境で論文PDFファイルや書誌情報を使いたい!
論文PDFの管理
論文(PDF)の保管にはDropboxを利用している。Dropboxは最近流行りのオンラインストレージサービスの一つ。2GBまで無料で利用できる。私は600本強の論文のPDFファイルをDropboxに置いているけど現在の容量は 900MB強。
Dropboxの選択理由は、WindowsとLinuxの双方で使えること、また、iPadでPDFビューアとして購入していたGoodReader for iPadでもDropboxと連携できていたから。
Windows 8.1ではMicrosoft純正のオンラインストレージサービスSkyDriveが標準で使えるようになっているし、Mac OSはiCloudがあるので、環境に合わせてお好きなオンラインストレージサービスを使えば良いと思う。
書誌情報の管理
論文を書くときには基本的にLaTeXで書き、論文情報はBibTeX経由で埋め込んでいる。そこで、BibTeX形式で論文情報を出力でき、かつ、研究室のPC、自宅のPC、ノートPCにおいて論文情報を共有するようにできる Mendeleyを利用して論文情報を管理している。Mendeley Windows, Linux, Mac OS, 各種タブレットでクライアントソフトが利用でき、このクライアントソフトウェアを通して異なるデバイス間で書誌情報を共有できる。ただし、PDFファイルをMendeleyで管理していない場合は、書誌情報とPDFファイルの連携はできない。
Mendeleyの良い点はPDFから論文情報をある程度自動的に読み取る点(SpringerLINK、ACM DL, IEEE-CS DLからダウンロードしたPDFからはタイトル、著者名、ページ数は確実に、ScienceDirectからならすべてのデータを読み取る)。私が調べた範囲での読み取り精度は以下のエントリーを参照のこと。
実際の管理手順
私が論文PDFを集めるときの手順は以下のとおり。書誌情報の入力は論文のPDFファイルのダウンロード時に行っている(いつダウンロードした論文を読むのかわからないため)。論文PDFファイルの収集に1.5倍〜2倍の時間がかかるけど、論文締切り間際に書誌情報を調べ直すことを考えるとこのタイミングがベターだと思う。
論文のPDFファイルをダウンロード
いちいちMendeleyを立ち上げなくてもファイル名だけで何の論文なのかを判別できるように以下のルールで名づけている。
- 「著者名_キーワード_会議or雑誌情報_発表年.pdf」
名前は、「ファミリーネーム.ファーストネームのイニシャル」で管理すべき。著者が二人以上でも第一筆者の名前だけを使って管理している。たとえば、麻生太朗さんが、日本アニメ学会(Anime Society of Japan)で2008年に発表した論文は、「Aso.T_Anime_ASJ08.pdf」として名前をつける。こうしておくと、Unixコマンドのfindやls + grep などで引っ掛けられる。
そして、これをBibTeXのCitation Nameとして利用する。
Drobboxで論文ファイルを一元管理
DropboxのクライアントをインストールするとDropboxというディレクトリ(フォルダ)が作成される。
私はこの下に References というディレクトリを作成し、論文ファイルをすべてここに置いている。昔はサブディレクトリごとにわけていたが、今は Unixならgrepやfind、Windowsならファイル検索を使って論文を探すのでサブディレクトリは作っていない。このディレクトリに放り込んでおくだけで、他のDropboxクライアントをインストールしているデバイス間で論文PDFファイルを共有できる。
Mendely に書誌情報を記録
Dropbox/References に保存したファイルをMendeleyに読み込ませる。半分ぐらいの論文情報はMendeleyが読み取ってくれるので、足りない情報をダウンロード元のページにある情報を参考にしながら埋める。このときにちゃんと論文情報を集めておかないと、論文執筆時に無駄な時間を使うことになる。
Mendeley では論文のPDFファイルをネットワーク上のスペースにアップロードできるけど、私はDropboxを使っているのでアップロードの設定はオフにしている。
論文メモをEvernoteに
いままでは、はてなのサブアカウントにブログを作ってそこに論文を読んだときのメモを書いていたのだけど検索しづらいので、Evernoteを使ってメモすることにした。あと、自分の論文で役に立つ英語表現のメモする(PDFから文まるごとコピペしておく)こと、Snack Writingをしてみたいと思ったのもEvernoteを使い始めた理由。Evernoteにはメール経由でメモを投稿している。
BibTeXに出力
論文を書くときにはMendeleyに格納されている論文情報を 〜.bib というファイルにBibTeX形式でエクスポートしている。
LNCSやIEEE-CS、ACMは各参考文献書式用のBSTファイルを用意してくれているため、まず、このBSTファイルで参考文献部分を出力し、大まかな書式を整えます。その後に手動で書式を統一している。ここいらへんは計算機科学系の学会だからというのが大きい。
- Springer LNCSシリーズ曰く「MS Wordはお勧めしない」
- 4403 is written:IEEE CSのproceedingを書くときに見るエントリ
- ACM:ACM LaTeX Style Guide
Ubuntu 12.10での環境の整え方
関連エントリー(文献調査)
- 27 http://t.co/sjx4cjt73g
- 5 http://b.hatena.ne.jp/
- 4 http://feedly.com/index.html
- 4 http://ic.edge.jp/page2feed/http://d.hatena.ne.jp/next49/
- 3 http://pipes.yahoo.com/pipes/pipe.info?_id=VPw6npu13RGKo15vBRNMsA
- 1 http://a.hatena.ne.jp/high190/
- 1 http://a.hatena.ne.jp/jko7512/
- 1 http://a.hatena.ne.jp/nekoponbici/
- 1 http://a.hatena.ne.jp/nobsun/simple
- 1 http://a.hatena.ne.jp/sakoscc/