ゼロから作るDeep Learning
層数とニューロン数による学習効果の違い
昨今注目を集めているAI(人工知能)を学びたいと思い立ち、ディープラーニング(Deep Learning、深層学習)と呼ばれるAIの数理モデルである多層構造のニューラルネットワークを書籍「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」を参考にを独習していきたいと思います。本書籍ではプログラミング言語としてPythonが利用されていますが、本項ではJavaScriptで実装していきます。
目次
- 準備1:行列の和と積を計算する関数の実装
- 準備2:ベクトルと行列の積を計算する関数の実装
- 準備3:多変数関数の数値微分と極小値の探索
- 1.1層ニューラルネットワークの実装(バイアスなし、活性化関数なし、学習なし)
- 2.1層ニューラルネットワークへのバイアスと活性化関数の追加
- 3.1n1型2層ニューラルネットワークの実装(学習なし)
- 4.1変数関数を学習させてみる1:勾配法による学習計算アルゴリズム
- 5.1変数関数を学習させてみる2:勾配法による学習計算アルゴリズムの実装
- 6.1変数関数を学習させてみる3:ニューロン数による学習効果の違い
- 7.誤差逆伝搬法(バックプロパゲーション)の導出
- 8.順伝播型ニューラルネットワーク「FFNNクラス」の実装(JavaScript)
- 9.三角関数のサンプリング学習(WebWorkersによる並列計算)
- 10.学習後の各層ニューロンの重みの可視化
- 11.層数とニューロン数による学習効果の違い
層数とニューロン数による学習効果の違い
前項では6層(1-10-10-10-10-1)の順伝播型ニューラルネットワークを用いて三角関数を学習させた後の、各層のニューロン間をつなぐ重み(多重配列)がどのような値になっているかを調べました。 次に気になるのは層数や各層のニューロン数によって学習効果がどのように異なるかを調べてみました。なお、任意の関数は3層ニューラルネットワークの中間層のニューロン数を増やすことでいくらでも近づけることが証明されています。
実行結果
次の結果は3層ニューラルネットワークの中間層のニューロン数を10個、100個、1000個とした場合と、各層ニューロン10個の中間層を1層、2層、3層、4層、5層とした場合の学習回数に対する損失関数の値です。