Cet article décrit des modèles et des paramètres pour les novices en apprentissage profond.
Le but est d'aider les lecteurs à comprendre ce qu'est un modèle, ce qu'est un paramètre et pourquoi l'IA peut être créée avec ces deux éléments.
--Connaissance des fonctions en mathématiques
Dans le développement de l'IA, tel que l'apprentissage en profondeur, l'IA nécessite toujours ** des entrées et des sorties **. Par exemple, dans le cas de la reconnaissance d'image AI, l'entrée est l'image à reconnaître et la sortie est le nom de l'animal reconnu.
L'IA peut être créée en trouvant l'expression relationnelle entre y et x, c'est-à-dire $ f (x) $ telle que $ y = f (x) $ lorsque l'entrée est x et la sortie est y.
Je vais vous montrer la procédure pour créer une IA avec des données simples. Regarde la table
Poignée[kg] | Distance de vol de la balle[m] |
---|---|
35 | 71 |
45 | 92 |
38 | 76 |
15 | 31 |
10 | 19 |
20 | 39 |
Ce tableau montre la distance de vol y [m] qu'une personne avec une force de préhension x [kg] volera en lançant la balle. Ceci est représenté dans un graphique avec l'axe x comme force de préhension et l'axe y comme distance de vol de la balle.
En regardant la disposition de ces points, je pense que la relation entre la force de préhension et la distance de vol de la balle peut être exprimée par une ligne droite. La formule pour une ligne droite est $ y = ax + b $.
Cette fois, l'axe des x est la force de préhension [kg] et l'axe y est la distance de vol de la balle [m], donc si x est la force de préhension [kg] et y est la distance de vol de la balle [m], la relation $ y = ax + b $ est valable. Peut être prédit à partir de ce chiffre.
Trouvez ensuite a et b. À l'origine, il est calculé par une méthode telle que la méthode du carré minimum, mais c'est difficile, donc je n'en parlerai pas ici.
Si a = 2 et b = 0 cette fois, la ligne droite chevauchera presque tous les points comme indiqué dans la figure ci-dessous. (La ligne pointillée dans la figure ci-dessous est $ y = 2x + 0 $.)
Cette ligne droite ** y = 2x + 0 ** peut être utilisée pour prédire la distance à laquelle une balle peut être lancée par des personnes aux prises différentes. Par exemple, une personne avec une prise de 50 [kg] pourra lancer une balle d'environ 100 [m] à partir de $ y = 2 x 50 = 100 $.
Dans l'exemple ci-dessus, nous nous attendions à ce que la relation entre x et y soit $ y = ax + b $. À ce stade, la forme elle-même de $ y = ax + b $ est appelée un modèle, et les caractères autres que x et y tels que a et b sont appelés paramètres.
Par exemple, dans l'exemple ci-dessus, si le modèle est $ y = ax ^ 5 + bx ^ 4 + cx ^ 3 + dx ^ 2 + ex + f $, il sera comme indiqué dans la figure ci-dessous. (Les paramètres a à f ont été obtenus par Excel.)
Il passe sur tous les points, mais ce modèle ne semble pas représenter correctement la relation entre adhérence et distance de la balle. Si vous ne concevez pas un modèle approprié comme celui-ci, la précision de l'IA sera considérablement réduite.
Les données réelles sont difficiles à représenter graphiquement et les modèles sont compliqués et difficiles à comprendre. Cependant, même si vous regardez le code du pionnier, il sera plus facile d'entrer dans votre esprit si vous le lisez tout en comprenant que vous faites réellement quelque chose comme ça.
En fait, je ne pense pas qu'il y ait une grande corrélation entre l'adhérence et la distance de vol de la balle.
Recommended Posts