読者です 読者をやめる 読者になる 読者になる

めもめも

このブログに記載の内容は個人の見解であり、必ずしも所属組織の立場、戦略、意見を代表するものではありません。

TensorFlow Tutorialの数学的背景 − TensorFlow Mechanics 101(その2)

何の話かというと

enakai00.hatenablog.com

上記の記事では、隠れUnitが2個という、世界で最もシンプルなニューラルネットワークを構成しました。

これをちょこっとだけ、拡張して遊んでみます。

隠れUnitを増やす

それぞれの隠れUnitは平面を直線で分割するわけですので、隠れUnitを増やせば分割線がどんどん増やせます。

前回のコードでは、下記の部分で隠れUnitの個数を指定していたので、これを変えてためしてみます。ここでは、4個にしてみます。

    hidden1_units = 4


はい。予想通り、境界線がより複雑になりました。隠れUnitの数をどんどん増やすことで、どれほど複雑な関数でも表現できてしまいます。

Activationを変えてみる

前回のコードでは、隠れUnitを次のように定義しました。

 z_0 = \tanh(w_{00} x_0 + w_{10} x_1 + b_0)

 z_1 = \tanh(w_{01} x_0 + w_{11} x_1 + b_1)

\tanh は、下図のように、原点付近で-1から1にひょこっと値が立ち上がる関数です。これがActivationです。

一方、Activationに使用する関数を取り替えることで、ニューラルネットワークの性能が変化することが知られています。ディープラーニングでよく使われるのが、次のReLU(ランプ関数)です。

コードの下記の部分を修正して、ReLUをActivationに使ってみます。

      hidden1 = tf.nn.relu(tf.matmul(x, w0) + b0*mult)
#      hidden1 = tf.nn.tanh(tf.matmul(x, w0) + b0*mult)

結果は、次のとおりです。

この例では、右上の領域が(z_0,z_1)=(0,0)になっており、これが「◯の確率が高い領域」と判定されています。しかし、境界線をこえるとすぐにz_0, z_1の値が大きくなるわけではないので、境界線をはみだして確率が変化しています。結果として、単純な4分割よりもやや複雑な境界線を描くことに成功しています。

次回予告

今回は、1段の隠れ層に含まれるUnitの数を増やして、分割線を複雑にしていきました。しかしながら、(カクカク曲がってはいても)結局は、1本の線で分割することしかできないという限界があります。次のステップは、隠れ層の後ろに、さらに隠れ層を追加して、隠れ層の段数を増やしていくという拡張になります。これにより、平面上の離れた部分を結びつけるような計算処理が可能になります。(なんとなく想像できますよね?)