Reference
Zusammenfassung der Prozedur des neuronalen Netzwerks zum Erkennen des Bildes unter Verwendung der Trainingsdaten von MNIST.
MNIST Ein Datensatz handgeschriebener Zahlen von "0" bis "9". Jede Zahl ist in $ 28 \ times28 $ Pixel unterteilt, und jede Zahl ist in 8-Bit-256-Schritten farbcodiert. Es kann leicht von der von Keras bereitgestellten API gelesen werden.
>>> from keras.datasets import mnist
>>> (x_train, y_train), (x_test, y_test) = mnist.load_data()
>>> x_train[0]
array([[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0],
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0],
・ ・ ・(Kürzung)
>>> y_train[0]
5
Konvertieren Sie die Eingabeinformationen in ein eindimensionales Array.
>>> x_train = x_train.reshape(60000, 784)
>>> x_train[0]
array([ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
Außerdem werden die richtigen Antwortdaten in eine One-Hot-Codierung (Dummy-Variable) konvertiert. Da es mit dem Lernwert als Wahrscheinlichkeit in der endgültigen Ausgabeschicht verglichen wird, wenn es beispielsweise 5 ist, ist die Matrix [0,0,0,0,0,1,0,0,0,0,]. Dies kann auch mit der Keras-API erstellt werden.
>>> y_train = keras.utils.to_categorical(y_train, 10)
>>> y_test = keras.utils.to_categorical(y_test, 10)
Basierend auf der einfachen Codierung im Tutorial werden wir zu einer praktischeren Bilderkennung übergehen. Das letzte Ziel der Herausforderung besteht darin, die Umrisse der Person zu extrahieren.
Recommended Posts