世間では卒論などが追い込みの時期だろう。昨年の今頃は私もそんな中に。
ここで昨年を思い出しつつ、論文執筆の上でお世話になったリソースをまとめてみようかと思う (ちなみに私は分類で行くと理系だと思います)。
以下、自分が世話になったもののまとめなので、万人に役立つものではないだろうし、 また現在進行形で追い込んでいる学生に役立つものとも限らない。どっちかというとB1〜3、M1などが役に立つんじゃないだろうか。
Webサイト・本・ソフトウェア、それぞれ3つずつ。
Webサイト
東大で学んだ卒論の書き方論文の書き方
もはや説明するまでもない。年に一度、 秋から冬にかけてほぼ確実にはてなブックマークのホットエントリーに浮上してくる風物詩的ページ。
まずはここを読もう。いつでもここに戻ってみよう。
Google・Google Scholar
論文・資料の検索に。
…は当然として、私は英語の表現方法がどうしても分からないときの答え合わせとして使った。 もちろん辞書や例文集は第一に頼るべきだが、その語句、節で検索することで、本当にそのような表現が論文において一般的であるか、 また自分の分野で使われているのかを確認することができる。また、思わぬ論文との出会いのきっかけにもなり、視野を広げるのにも役立つ。
Webcat Plus
キーワードだけでなく、文章でも文献検索ができる。「自分の大学の図書館にあの文献はあるだろうか?ないとしたら、どの大学、 図書館にお願いしたらいいんだろう?」そんなときに。
本
理科系の作文技術
もはや古典の感は否めないが、それでも論文執筆に当たって第一に読むべき本はこれ。冒頭で紹介した「東大で学んだ〜」と同じく、 執筆の前に読むべきで、執筆に詰まったら読むべきで、見直すときにも読むべき本。
基本的な部分はこの一冊がほとんど教えてくれる。
推計学のすすめ―決定と計画の科学
データ処理にあたって統計学が理解できていないと困るが、統計学はそれほど容易なものでもない。基本的な道具ですら、 少し突っ込むと手に負えない複雑さと難解さを垣間見せる。
そういったあまり見たくない一面を避けつつ、かつ雰囲気として理解しているべき最低限の部分を抑えているのがこの一冊。 統計学が推計学と呼ばれていたころの本だが、基礎部分が対象なので今でも通用する内容。
もちろん、統計学に自信のある人は特に読む必要はない。
卒論執筆に取り掛かってからというより、実験計画程度以前に読んでおくべき本。
統計でウソをつく法―数式を使わない統計学入門 
データとはどういう形をしているもので、統計学をデータにどのように適用するか、また、 他人のデータをどのように読み取るべきかということを教えてくれる。 どちらかというとデータの取り扱いに関する哲学みたいなものを扱っていて、具体的な方法が詳細に述べられているわけではない。 それでも一度は目を通しておくべき。長く読まれているものにはやはりそれなりの理由がある。
半世紀もの昔からのロングセラーで、いまだにこの本に書かれているような「ウソをつく法」が使われているのかと思いたくなるが、 残念なことにいまだに使われている場合が多い。
これもできたら実験計画以前に読んでおくべき本。
ソフトウェア
(基本的にWindowsユーザー向けです。 MacとかLinuxとか使う人は大概が変態なので私よりずっとパソコン関係には詳しいだろうし、そもそも勝手にやるでしょう。)
TeX・ LaTeX
(リンク先はTeXに関する有用な情報源であるTeX Wiki)組版ソフト。特に数式の出力が綺麗。 TeXではHTMLのようなマークアップ言語を処理することで、 DVIやPDFといった形式の文書を作成できる。仕上がりは非常に綺麗で、 出版物に使用される例も多い。
学会によっては論文提出用にTeXのスタイルファイルを配布している場合もあり、覚えておいて損はない。 特に数式を使用する可能性のある人は覚えておくべき。Wordをメインに使う場合でも、 数式の可読性を高めるためにTeXで処理した数式を貼り付けると良いだろう。
綺麗な数式が書けるということ以外の利点は、文章の本体がテキストファイルとなることで、 複数のバックアップを用意に取れるということ、突然のエラーでデータが消失する危険性が減るということだろう。また、 完全に無料であるという点も重要。
欠点は導入と初期設定のわずらわしさにある。 ただし最近は必要なものをまとめてインストールしてくれるインストーラもあるのでそれほどでは無いように思う。また、 HTMLなどに慣れていない場合は覚えたりなれたりするのに多少の時間が必要かもしれない。
それとWeb上にはそれ単体で学習できるようないいリソースがあまり無いような気がする。私は[改訂第4版]
LaTeX2ε美文書作成入門 という本を買って勉強した。後に辞書的にも使えるのでいい本だと思うが、
他のLaTeX関係の本を持っていないので比較はできない。まあでも一冊で済んでいるということはいい本なんだろう。
xyzzyというテキストエディタにKaTeXというモノを組み合わせて使うのがお勧め(参考: xyzzy + KaTeX [物理のかぎしっぽ])。
JabRef
(リンク先はJabRefの使用方法などを解説した「JabRefによるBibTeX文献管理とJab2HTML」) LaTeXではBibTeXというツールで文献管理ができる。 BibTeX形式で記述された文献リストのテキストファイルを所定の方法で処理することで、 LaTeX文書の中に自動で引用番号を振ったりできる。
また、BibTeX形式の文献情報提供がサポートされている場合も多い(たとえばGoogle Scholarなんかがそう)ため、 LaTeXとあわせて覚えておいて損はない。
JabRefはこのBibTeX形式の文献リストを管理するためのソフトウェアだが、検索機能はもちろんのこと、 論文ウェブサイトへのリンクを記憶したり、論文PDFをダウンロード・保存したりと文献の管理に有効な機能が多く含まれている。
そのため、たとえばBibTeXを使う気がなくとも文献管理ソフトとしてかなり有効なものである。フリーなのも重要。
R
(リンク先はRjpwiki)統計処理とグラフィックスに特化した言語、環境。
CUIなのでエクセルよりはとっつきにくいが、インタプリタ言語で入力内容を逐一解釈、実行してくれるので、 コンパイルが必要なC言語などに比べたらとっつきやすいだろう。 WindowsならRguiというRの作業を行うのに便利な環境とエディタが標準で付いてきて、 完全なCUIというわけでもなくなるのでとっつきやすさはさらに高い。
Rは多くの統計手法が「関数」の形で最初から用意されているのが特徴。t検定、分散分析、多重比較みたいな簡単なものから、 ブートストラップ、クラスタ分析など本当に数え切れないほどの手法がカバーされている。 テキストマイニングやマイクロアレイの解析だってできるし、画像も扱える。汎用性は極めて高い。
Excelとの連携性を高めた関数も多いので、別にExcelを窓から投げ捨てる必要もない。
最初にベクトルやデータフレームを丁寧に勉強し、次にExcelデータからそれらを作り出す方法を理解し、 その後に統計処理を行う関数の使い方やプログラミングへ進むと、統計に関しては比較的短期間で実用的なレベルの能力が身に付くと思う。
グラフは頑張れば綺麗なものも描けるけど、結構な勉強と慣れが必要。 ExcelやCalcの方が手っ取り早いし少ない労力で綺麗になると思う。
情報源として本を頼るのもいいけど、基本的なことならR-tipsでほとんど間に合う。 ありがたいことです。あと青木先生のWebサイトも同時にチェックしておきましょう。
フリー。驚くべきことにフリー。
----
これらは特に印象に残っているし、ほとんどは今でもお世話になっている。
あとはカフェインとブドウ糖とBGM。中毒にならない程度にほどほどに。