A way of thinking

筆者個人の思考過程です。意見には個人差があります。

深層学習の原理に迫る

120pくらいしかないのでさらりと読めて、むしろなんかちょっと物足りにない感じはなくはないんだけど、過剰に増えたパラメータがむしろoverfittingを防ぐ(overfittingにならない)というところの数学的な説明*1が、たしかにそうなるなぁと面白かったり、ニューラルネットワークってこういう中身だったんですね、と今更ながら勉強になったり。深層学習ってぶっとんでて、数学がそれに追いついていないって現状自体も、面白い。

*1:というほど難しい説明では全然ないんだけど