[PYTHON] Deep Learning from scratch ① Chapitre 6 "Techniques liées à l'apprentissage"

J'ai fait une bonne implémentation dans le chapitre 6 de Deep Learning ① fait à partir de zéro, donc un mémorandum. Jupyter sera également publié, je vous serais donc reconnaissant si vous pouviez signaler des erreurs. Dans le livre, le jeu de données a été téléchargé localement, mais comme sklearn a un jeu de données pour l'apprentissage tel que mnist, j'ai ajusté le code afin que je n'ai besoin que d'importer depuis sklearn. [cahier jupyter pour publication @github](https://github.com/fumitrial8/DeepLearning/blob/master/%E3%82%BB%E3%82%99%E3%83%AD%E3%81%8B% E3% 82% 89% E4% BD% 9C% E3% 82% 8BDeepLearning% 20% E7% AC% AC6% E7% AB% A0.ipynb)

SGD (descente de gradient stochastique)

Méthode d'ajustement du poids de chaque réseau en soustrayant la valeur obtenue en multipliant le gradient de la fonction de perte par un certain coefficient d'apprentissage du poids. Exprimé comme une expression

W (poids après ajustement) = W (poids avant ajustement) --η * dL / dW (coefficient d'apprentissage * gradient de la fonction de perte)

Méthode AdaGrad

Une méthode d'ajustement du poids de chaque réseau en réduisant le coefficient d'apprentissage en fonction de la progression de l'apprentissage. Exprimé comme une expression

h (Historique de la pente après ajustement) = h (Historique de la pente avant ajustement) --dL / dW * dL / dW (Carré de la fonction de pente de perte)

W (poids après ajustement) = W (poids avant ajustement) --η * h *** (-1 / 2) * dL / dW (coefficient d'apprentissage * historique du gradient * gradient de la fonction de perte)

Méthode Momentum

Comment ajuster le poids de chaque réseau en apprenant plus car le gradient est plus grand et en apprenant moins quand le gradient est plus petit (je n'ai pas trouvé une bonne expression ...). Exprimé comme une expression

v (Historique des poids après ajustement) = αv (Historique des poids avant ajustement) --η * dL / dW (Coefficient d'apprentissage * Gradient de la fonction de perte) Il semble que α soit généralement fixé à 0,9.

W (poids après ajustement) = W (poids avant ajustement) + v

Recommended Posts

Deep Learning from scratch ① Chapitre 6 "Techniques liées à l'apprentissage"

Apprentissage profond à partir de zéro

[Mémo d'apprentissage] Le Deep Learning fait de zéro [Chapitre 7]

Deep learning / Deep learning made from scratch Chapitre 6 Mémo

[Mémo d'apprentissage] Deep Learning fait de zéro [Chapitre 5]

[Mémo d'apprentissage] Le Deep Learning fait de zéro [Chapitre 6]

Deep learning / Deep learning made from scratch Chapitre 7 Mémo

[Mémo d'apprentissage] Deep Learning fait de zéro [~ Chapitre 4]

Deep Learning from scratch Chapter 2 Perceptron (lecture du mémo)

Apprentissage profond à partir de zéro 1 à 3 chapitres

[Deep Learning from scratch] J'ai essayé d'expliquer le décrochage

Deep learning / Deep learning from scratch 2 Chapitre 4 Mémo

Deep learning / Deep learning made from scratch Chapitre 3 Mémo

Deep Learning / Deep Learning à partir de Zero 2 Chapitre 5 Mémo

Apprentissage profond à partir de zéro (calcul des coûts)

Deep Learning / Deep Learning à partir de Zero 2 Chapitre 7 Mémo

Deep Learning / Deep Learning à partir de Zero 2 Chapitre 8 Mémo

Deep learning / Deep learning made from scratch Chapitre 5 Mémo

Deep learning / Deep learning made from scratch Chapitre 4 Mémo

Deep learning / Deep learning from scratch 2 Chapitre 3 Mémo

Mémo d'apprentissage profond créé à partir de zéro

Deep Learning / Deep Learning à partir de Zero 2 Chapitre 6 Mémo

Un amateur a trébuché dans le Deep Learning à partir de zéro Note: Chapitre 1

Un amateur a trébuché dans le Deep Learning ❷ fait à partir de zéro Note: Chapitre 5

Un amateur a trébuché dans le Deep Learning ❷ fait à partir de zéro Note: Chapitre 2

Un amateur a trébuché dans le Deep Learning à partir de zéro Note: Chapitre 3

Un amateur a trébuché dans le Deep Learning à partir de zéro Note: Chapitre 7

Un amateur a trébuché dans le Deep Learning à partir de zéro Note: Chapitre 5

Un amateur a trébuché dans le Deep Learning ❷ fait de zéro Note: Chapitre 1

Un amateur a trébuché dans le Deep Learning ❷ fait à partir de zéro Note: Chapitre 4

Un amateur a trébuché dans le Deep Learning à partir de zéro.

Un amateur a trébuché dans le Deep Learning à partir de zéro Note: Chapitre 2

J'ai essayé d'implémenter Perceptron Part 1 [Deep Learning from scratch]

Apprentissage amélioré pour apprendre de zéro à profond

Apprentissage profond à partir de zéro (propagation vers l'avant)

Apprentissage profond / Apprentissage profond à partir de zéro 2-Essayez de déplacer GRU

Alignement d'image: du SIFT au deep learning

"Deep Learning from scratch" avec Haskell (inachevé)

[Windows 10] Construction de l'environnement "Deep Learning from scratch"

Enregistrement d'apprentissage de la lecture "Deep Learning from scratch"

[Deep Learning from scratch] À propos de l'optimisation des hyper paramètres

Mémo d'auto-apprentissage "Deep Learning from scratch" (partie 12) Deep learning

Mémo d'auto-apprentissage "Deep Learning from scratch" (glossaire illisible)

"Deep Learning from scratch" Mémo d'auto-apprentissage (n ° 9) Classe MultiLayerNet

GitHub du bon livre "Deep Learning from scratch"

[Mémo d'apprentissage] Apprentissage profond à partir de zéro ~ Mise en œuvre de l'abandon ~

[Deep Learning from scratch] J'ai essayé d'implémenter la couche sigmoïde et la couche Relu

Python vs Ruby «Deep Learning from scratch» Chapitre 2 Circuit logique par Perceptron

Chapitre 1 Introduction à Python Découpez uniquement les bons points de Deeplearning à partir de zéro

Résumé Python vs Ruby "Deep Learning from scratch"

Mémo d'auto-apprentissage «Deep Learning from scratch» (10) Classe MultiLayerNet

Mémo d'auto-apprentissage «Deep Learning from scratch» (n ° 11) CNN

[Deep Learning from scratch] Implémentation de couche de la fonction softmax à l'erreur d'entropie croisée

Python vs Ruby "Deep Learning from scratch" Chapitre 4 Implémentation de la fonction de perte

Python vs Ruby "Deep Learning from scratch" Chapitre 3 Implémentation d'un réseau neuronal à 3 couches

Deep Learning from scratch La théorie et la mise en œuvre de l'apprentissage profond appris avec Python Chapitre 3

Mémo d'auto-apprentissage «Deep Learning from scratch» (n ° 19) Augmentation des données

Application de Deep Learning 2 à partir de zéro Filtre anti-spam