https://github.com/oreilly-japan/deep-learning-from-scratch/blob/master/ch04/two_layer_net.py
loss_W = lambda W: self.loss(x, t)
grads = {}
numerical_gradient(loss_W, self.params['W1'])
Es scheint jedoch, dass das zweite Argument von "numerischer Gradient" als Referenz übergeben wird.