2015-03-15
みんな数式を恐れすぎなんだよ
これずっと思ってきたことなのですが最近とみに「言いたい熱」が高まったのでブログにしたためます。
先日、TJO教授によるデータサイエンティスト最低ラインみたいなエントリがバズってましたが、はてブコメントに「それ以前に数式が。。」みたいなコメントが散見されて、「それは違うよ!」って思いました。
数式って、物事を厳密に数量的に表現する「一つの言語」に過ぎなくて、いわば我々が生活してる世界のなかで「なんかスゲー厳密性を気にする村」で使われている「方言」みたいなもんだと思うんです。
そんな村に住んでる人たちはもちろんその「ことば」をちゃんと理解して使いこなす必要があります。エスキモー*1の人々は「雪」を表現するのに十数個の言葉を使うという話がありますが、それと似たように、数学村には我々標準語の世界ならば気にしないような細かな違いを豊富な数学語で使い分けるようなところがあります。
で、エスキモーが雪をたくさんの言葉で表現しわけるとしても、エスキモーの人たちと交流する際に標準語の世界に住む我々は「雪」の認識を「精緻な使い分けをするように」変えるでしょうか?変えないでしょう。また一方で、エスキモーの人たちと我々は雪に関してまったく意思疎通ができないでしょうか?そんなことはないですよね、だって、我々は「雪」を知ってるから。
つまり何がいいたいかというと、我々が日常よく使っている「普通のことば」というのは森羅万象を説明するうえでの汎用性がいちばん高い言語なので、数学語みたいな方言にひるむことはない、っていうことなんです。
また、数学の世界には、それぞれ必ずその「数学的概念」が生み出されるに至った「背景」があります。数学の分野でも「数論」と呼ばれる最高峰に「純粋数学」な分野があり、それは「数学の世界での事情を背景に持つ新しい数学的概念」という感じで純粋に村のコトバに属するもので立ち入ることが難しいのですが、数学的な世界でも特に「古典的な理論物理学」や「統計科学」に代表されるようないわば「応用数学」と呼ばれる分野は割と標準語の我々の世界と「経験を共有」する部分が大きいと思います。エスキモーのように雪を十数個の言葉で使い分けることはできなくても雪についての意思疎通は可能であるのと同様に、この応用数学の分野は「我々の普通の言葉」でのやりとりが可能です。もちろん、雪を十数個に分類しないと進捗しないプロジェクトはありますが、それでも「これは雪についての詳細に取り組んでいるのである」という認識を持つことは可能です。
機械学習を理解する一里塚のように目されているPRMLも、書いてある内容は(特に数式じゃないところに)「背景の事情」について十分説明が書かれていますし、多くの数式で表現される定理や手法やアルゴリズムもたいていは我々の日常使う語彙でうまく説明可能なものばかりです。
なので、数式が理解できないから先に進まないという人は、手段と目的を取り違えているというか、雪の種類が多すぎてエスキモーの人と話しが出来ない、って言ってるように聞こえます。
エスキモーの人と話すには、十数個の雪は必要ないんです。雪を知るだけでいい。で、データサイエンスの世界には、そういう我々が簡単に日常世界の常識と関連付けて理解できるような概念がいっぱいあります。そういうアブストラクトレベルで把握しておいて、何か具体的なプロジェクトにあたったら数式の詳細を吟味すればいいんです。いまはR言語の便利なパッケージもいっぱいそろってるわけですし。
- 54 http://t.co/20v0GR1zzX
- 42 http://b.hatena.ne.jp/
- 33 http://t.co/GTEab68Z09
- 21 http://b.hatena.ne.jp/hotentry/knowledge
- 20 https://www.google.co.jp/
- 12 http://t.co/fF3LiNlfnM
- 12 https://www.facebook.com/
- 7 http://b.hatena.ne.jp/entry/d.hatena.ne.jp/isobe1978/20150315/1426437377
- 4 http://b.hatena.ne.jp/entrylist
- 4 http://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&cd=4&ved=0CDQQFjAD&url=http://d.hatena.ne.jp/isobe1978/20140314/1394815018&ei=TTAGVeDMKefDmAWs4IHIAQ&usg=AFQjCNHf1_DSKBvDYwLR3tKZ-bWulPXk8w&bvm=bv.88198703,d.dGY