J'étudie l'apprentissage profond en exécutant l'exemple de code de Chainer.
Au moment de la rédaction de cet article (juin 2017), la dernière version de Chainer est 2.0, mais elle peut ne pas être compatible avec 1.x et les versions antérieures du code peuvent ne pas fonctionner. Référence: Différences entre les versions de chainer (au 19 janvier 2016)
Cet article est un exemple de Chainer 2.0 MNIST, une note d'implémentation pour la conduite de l'inférence.
Pour la mise en œuvre, je me suis référé à cet article. Chainer: Tutoriel pour les débutants Vol.1
Chainer 2.0 python 2.7.10 Exécuter sur CPU
Échantillon Chainer 2.0 MNIST (original) https://github.com/chainer/chainer/tree/v2.0.0/examples/mnist
# Run the training
chainer.serializers.save_npz('my_mnist.model', model) # Added
$ python train_mnist.py --epoch 3
GPU: -1
# unit: 1000
# Minibatch-size: 100
# epoch: 3
epoch main/loss validation/main/loss main/accuracy validation/main/accuracy elapsed_time
1 0.191836 0.0885223 0.942233 0.9718 26.099
2 0.0726428 0.0825069 0.9768 0.974 53.4849
3 0.0466335 0.0751425 0.984983 0.9747 81.2683
$ ls
my_mnist.model result/ train_mnist.py*
#!/usr/bin/env python
from __future__ import print_function
import matplotlib
except ImportError:
import argparse
import chainer
import chainer.functions as F
import chainer.links as L
from chainer import training
from chainer.training import extensions
# Network definition
class MLP(chainer.Chain):
def __init__(self, n_units, n_out):
super(MLP, self).__init__()
with self.init_scope():
# the size of the inputs to each layer will be inferred
self.l1 = L.Linear(None, n_units) # n_in -> n_units
self.l2 = L.Linear(None, n_units) # n_units -> n_units
self.l3 = L.Linear(None, n_out) # n_units -> n_out
def __call__(self, x):
h1 = F.relu(self.l1(x))
h2 = F.relu(self.l2(h1))
return self.l3(h2)
def main():
parser = argparse.ArgumentParser(description='Chainer example: MNIST')
parser.add_argument('--unit', '-u', type=int, default=1000,
help='Number of units')
args = parser.parse_args()
print('# unit: {}'.format(args.unit))
# Set up a neural network
model = L.Classifier(MLP(args.unit, 10))
# Load the MNIST dataset
train, test = chainer.datasets.get_mnist()
chainer.serializers.load_npz('my_mnist.model', model)
x, t = test[0]
print('label:', t)
x = x[None, ...]
y = model.predictor(x)
y = y.data
print('predicted_label:', y.argmax(axis=1)[0])
if __name__ == '__main__':
Predict_mnist.py lit my_mnist.model et déduit l'étiquette des données de test.
$ python predict_mnist.py
# unit: 1000
label: 7
predicted_label: 7
J'ai la même étiquette que l'étiquette de réponse correcte.
# iteration, which will be used by the PrintReport extension below.
model = L.Classifier(MLP(args.unit, 10))
Dans train_mnist.py, j'ai créé un modèle en utilisant L.Classifier. Vous devez également utiliser L.Classifier lors de la création d'un objet de modèle lors de l'inférence.
Si vous créez un objet pour le modèle sans passer par L.Classifier, vous obtiendrez une erreur lors du chargement du modèle.
# Set up a neural network
model = MLP(args.unit, 10)
KeyError: 'l2/b is not a file in the archive'
Référence Enregistrer et charger le modèle Chainer
Recommended Posts