Python-Anfänger berührt Pytorch (3)

Dies ist eine Fortsetzung von Python-Anfänger berühren Pytorch (2). Ich persönlich schreibe dreimal einen Artikel. Abschließend erkläre ich das neuronale Netzwerk, das mich dazu inspiriert hat, Pytorch zu berühren.

1. Neuronales Netz Lassen Sie uns zunächst über neuronale Netze sprechen. Ein neuronales Netzwerk ist eine mathematische Darstellung eines neuronalen Modells des Gehirns unter Verwendung von Knoten und Verbindungen. ![ニューラルネットワーク.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/722110/607493df-3240-7e1f-a17a-8e4069043127.png)

In der Abbildung sehen Sie, warum es als Netzwerk bezeichnet wird. Der Knoten hat übrigens die Form eines Kreises, und die Verknüpfung verbindet die durch die Pfeile dargestellten Knoten.

"Deep Learning", das in den letzten Jahren ein heißes Thema geworden ist, ist ein Stapel von "Zwischenschichten (zwei Schichten dazwischen)" in dieser Abbildung. Dieses Modell wird auch als hierarchisch bezeichnet. Es gibt auch ein Modell namens rekursiv (RNN) . Bitte sehen Sie das Bild unten. Dies ist gut im Lernen, das Zeitreihen hält. Der Rechenaufwand ist jedoch groß, was die Berechnung schwierig macht.

Das Folgende ist ein Vergleich beider Netzwerke. Sie sollten das Netzwerk entsprechend der Anwendung auswählen, die Sie lösen möchten. Übrigens wird häufig der hierarchische Typ für die Bilderkennung und der rekursive Typ häufig für die Verarbeitung natürlicher Sprache (Zeichenerkennung, Spracherkennung) verwendet.

2. Betrachten Sie ein hierarchisches neuronales Netzwerk Dieses Mal werden wir ein hierarchisches neuronales Netzwerk erstellen, das die Grundlage der Grundlage bildet. Daher werden wir etwas mehr über hierarchische neuronale Netze lernen. Lassen Sie uns zunächst die vom neuronalen Netzwerk durchgeführten Berechnungen verstehen. Ich werde es nur durch einfache Multiplikation und Addition erklären, also danke.
2-1. Gewichte und Vorwärtsausbreitung
Das Gewicht repräsentiert die Wichtigkeit der Eingabe. Wenn das Gewicht hoch ist, ist der Teil mit dem hohen Gewicht von großer Bedeutung für die Unterscheidung des Ereignisses, das ein neuronales Netzwerk ist.

Lassen Sie uns anhand eines konkreten Beispiels etwas tiefer in die Gewichte eintauchen. Zum Beispiel denke ich, dass es beim Kauf einer Tasche für jede Person etwas Wichtiges gibt, zu entscheiden (zu bestimmen), ob sie kauft oder nicht. Grob gesagt gibt es "Haltbarkeit", "Kapazität", "Design", "Namenserkennung" und so weiter. Da ich dem Design große Bedeutung beimesse, ist, wenn jedes Gewicht numerisch ausgedrückt wird, "Element" = Gewicht: "Haltbarkeit" = 5, "Kapazität = 5", "Design = 8", " Vertrautheit = 5 ". Da Design von größter Bedeutung ist, ist es natürlich, dass das Gewicht des Designs hoch ist.

Lassen Sie es uns in einem Diagramm zeigen.

Das Diagramm ist leicht zu verstehen und einfach. In dieser Abbildung sehen Sie, dass "Eingabe 1" ein wichtiges Element in dieser Ebene ist. Wenn die nächste Eingabeebene zunimmt, nimmt auch die Anzahl der Gewichte entsprechend zu. Wenn Sie sich die Abbildung ansehen, sehen Sie, dass unterschiedliche Nummern an die beiden nächsten Ebenen übergeben werden.

Übrigens heißt es Vorwärtsausbreitung , dass sich die Eingabe in dieser Reihenfolge ausbreitet (überträgt).

In dem neuronalen Netzwerk wird jedes Gewicht durch "Training" korrigiert, um das geeignete Gewicht zu finden. Diesmal gibt es also kein Problem, wenn Sie das Gewicht verstehen können. Als nächstes werde ich die unbekannte Funktion "Aktivierungsfunktion" erklären.

2-2. Aktivierungsfunktion Lassen Sie uns nun über die Aktivierungsfunktion sprechen. Die Aktivierungsfunktion ist sehr wichtig, um dem neuronalen Netzwerk mehr Flexibilität zu verleihen.
Als berühmte Aktivierungsfunktion

Sigmoidfunktion

ReLU-Funktion 3.tanh (hyperbolische Tangente)

Schwere Nebenfunktion

es gibt. Bitte überprüfen Sie die Funktion selbst. Es mag schwierig erscheinen, nur mathematische Formeln zu verwenden, aber was für die Aktivierungsfunktion wichtig ist, ist nicht die Schwierigkeit mathematischer Formeln. 1. Nicht linear, 2. Leicht zu unterscheiden . Nichtlinear bedeutet, dass es nicht gerade ist. Schauen wir uns das Diagramm der ReLU-Funktion an. Es ist auf Wikipedia aufgeführt. [Aktivierungsfunktion (Wikipedia)](https://ja.wikipedia.org/wiki/%E6%B4%BB%E6%80%A7%E5%8C%96%E9%96%A2%E6%95% B0 # ReLU% EF% BC% 88% E3% 83% A9% E3% 83% B3% E3% 83% 97% E9% 96% A2% E6% 95% B0% EF% BC% 89)

Was denken Sie. Sicher war es nicht linear. Als nächstes kommt die Leichtigkeit der Differenzierung. Informationen zu den Grundlagen der Differenzierung finden Sie in Vorheriger Artikel sowie in Websites und Büchern, die professionellere Erklärungen enthalten. Die einfache Unterscheidung erleichtert das Netzwerktraining und das Auffinden von Gewichten. (Wenn Sie ein neuronales Netzwerk mithilfe eines Frameworks erstellen, machen Sie sich keine Sorgen, da das Programm dies automatisch ausführt.)

Als nächstes lernen wir, wann wir die Aktivierungsfunktion verwenden müssen. Der Zeitpunkt für die Verwendung der Aktivierungsfunktion ist unmittelbar vor , der sich vorwärts ausbreitet und an die nächste Schicht übertragen wird.

Was bedeutet es, ein neuronales Netzwerk mit einer Aktivierungsfunktion flexibler zu machen? Lassen Sie uns dies auch in der Abbildung überprüfen. Erstens, wenn ein neuronales Netzwerk normalerweise linear aufgebaut wird, ohne eine Aktivierungsfunktion einzufügen und zu unterscheiden

Nicht alle Objekte sind ordentlich unterteilt, auch wenn sie unterschieden werden. So wie wir Menschen Dinge verwechseln, die leicht zu verstehen sind, können Dinge mit ähnlicher künstlicher Intelligenz fälschlicherweise identifiziert werden. Fügen wir eine Aktivierungsfunktion hinzu und konvertieren sie nicht linear Das Diagramm sieht etwas zu gut aus, aber Sie können die Breite der Unterscheidung wie folgt ändern. Es gibt keine Garantie dafür, dass es möglich ist, ein korrektes Urteil zu fällen, aber es besteht zumindest kein Zweifel daran, dass sich die richtige Antwortrate im Vergleich zum linearen Bleiben ändert.

3. Bauen Sie mit Pytorch ein neuronales Netzwerk auf Verwenden wir das bisher Gelernte, um ein neuronales Netzwerk aufzubauen
import torch import torch.nn as nn import torch.nn.functional as F

Importieren Sie zunächst die erforderlichen Module. Als nächstes werden wir ein Netzwerk aufbauen. Das Netzwerk, das dieses Mal aufgebaut werden soll, ist übrigens so.

class Net(nn.Module): def __init__(self): super(Net,self).__init__() self.fc1 = nn.Linear(2,4) self.fc2 = nn.Linear(4,4) self.fc3 = nn.Linear(4,1) def forword(self,x): y = F.relu(self.fc1(x)) y = F.relu(self.fc2(y)) y = self.fc3(y) return y

In Pytorch bauen wir ein neuronales Netzwerk auf, sodass das Netzwerk definiert und dann von einer Funktion aufgerufen wird. Es ist ein sogenannter dynamischer Graph (durch Ausführen definieren). Im Vergleich zu TensorFlow (einem von Google entwickelten Framework) habe ich das Gefühl, dass die Python-Ähnlichkeit erhalten bleibt und leicht zu verstehen ist.

Ich werde den Code erklären. Class Net wird mit dem Modul nn.Module von Pytorch erstellt. Wir werden dieses nn.Modelu verwenden, um das Diagramm zu definieren. Erstellen Sie zunächst def \ __ init \ __ (self) durch Initialisierung und rufen Sie \ __ init \ __ von nn.Module auf. Erstellen Sie danach eine Ebene mit self (Name der Ebene). Diesmal wie im Bild erklärt

Schicht (Eingabe = 2, Ausgabe = 4)

Schicht (Eingabe = 4, Ausgabe = 4)

Schicht (Eingabe = 4, Ausgabe = 1)

Netzwerkkonfiguration.

Im Programm self. (Layername) = nn.Linear (Anzahl der Eingänge, Anzahl der Ausgänge) 

Lass uns schreiben. nn.Linear ist ein Modul namens , das vollständig verbunden ist und zum Erstellen eines Diagramms verwendet wird, in dem sich die Knoten der Eingabeebene auf alle Knoten der nächsten Ebene ausbreiten. ..

Die Vorwärtsfunktion beschreibt das Verhalten des neuronalen Netzwerks bei einer tatsächlichen Eingabe. Geben Sie in der ersten Zeile das Argument "x" in der ersten Ebene ein und führen Sie die Aktivierungsfunktion ReLU aus. Die zweite Zeile gibt den Ausgang "y" der ersten Schicht in die zweite Schicht ein und wendet die ReLU-Funktion an. Geben Sie schließlich die letzte Ebene ein und geben Sie das Ausgabeergebnis zurück.

Schauen Sie sich die Netzwerkübersicht an

net = Net() print(net)

Net( (fc1): Linear(in_features=2, out_features=4, bias=True) (fc2): Linear(in_features=4, out_features=4, bias=True) (fc3): Linear(in_features=4, out_features=1, bias=True) )

Sie können bestätigen, dass das Netzwerk fest aufgebaut wurde.

Übrigens können Sie auch den Anfangswert der Netzwerkgewichtung sehen.

for param_tensor in net.state_dict(): print(param_tensor, "\t", net.state_dict()[param_tensor].size())

fc1.weight torch.Size([4, 2]) fc1.bias torch.Size([4]) fc2.weight torch.Size([4, 4]) fc2.bias torch.Size([4]) fc3.weight torch.Size([1, 4]) fc3.bias torch.Size([1])

Hier gibt es eine "Vorspannung", die als Vorspannung bezeichnet wird und zur Berechnung jeder Schicht hinzugefügt wird.

2x+3

Die "3" in der obigen linearen Funktion ist die Vorspannung. In mathematischen Begriffen handelt es sich um einen Abschnitt .

Endlich Dieses Mal gab ich eine kurze Erklärung des neuronalen Netzwerks und baute mit Pytorch ein neuronales Netzwerk auf. Es gab einen Teil, den ich gemacht und erklärt habe, aber ich glaube, es gab einen Punkt, den ich nicht verstanden habe. Bitte kontaktieren Sie mich, wenn Sie Fragen haben.
Das nächste Mal werde ich die diesmal erlernte Methode zum Aufbau eines neuronalen Netzwerks verwenden, um ein praktischeres neuronales Netzwerk aufzubauen. Insbesondere werden wir die "ODER-Schaltung" und "UND-Schaltung" der Logikschaltung mit einem neuronalen Netzwerk lösen. Vielen Dank für das Lesen bis zum Ende.

Recommended Posts
Python-Anfänger berührt Pytorch (3)

Python-Anfänger berührt Pytorch (1)

Python-Anfänger berührt Pytorch (2)

Anfänger üben Python

Python-Anfängernotiz

Berühren Sie MySQL in Python 3

Python-Anfänger organisieren Heap-Sortierungen

Python-Anfänger organisieren schnelle Sortierungen

[ev3dev × Python] Berührungssensor

Python Lehrbuch für Anfänger

Python Dictionary Anfängerhandbuch

Tipps zur Installation von Python PyTorch

Python-Anfängerhandbuch (Einführung)

OpenCV für Python-Anfänger

PyTorch C ++ VS Python (Ausgabe 2019)

Lernablauf für Python-Anfänger

Python-Anfänger-Memorandum-Funktion

Python3-Umgebungskonstruktion (für Anfänger)

3 Gründe für die Programmierung Anfänger sollten mit Python beginnen

Python #Funktion 2 für Super-Anfänger

Python-Anfänger organisieren Blasensorten

Python-Anfängerhandbuch (Variationen / Arrays)

Grundlegende Python-Grammatik für Anfänger

Berühren Sie Apache Beam mit Python

100 Pandas klopfen für Python-Anfänger

Python #Funktion 1 für Super-Anfänger

Python #Liste für Super-Anfänger

~ Tipps für Python-Anfänger mit Liebe von Pythonista ③ ~

Ich habe versucht, Python zu berühren (Installation)

Python-Übungen für Anfänger # 2 [für Anweisung / while-Anweisung]

Python für Super-Anfänger Super-Anfänger Python # Wörterbuch Typ 1

Zusammenfassung des maschinellen Lernens von Python-Anfängern

Python #index für Super-Anfänger, Slices

Typisierungsautomatisierungsnotiz von Python-Anfängern

<Für Anfänger> Python-Bibliothek <Für maschinelles Lernen>

Python #len Funktion für Super-Anfänger

Web Scraping für Anfänger in Python (1)

# 2 Python-Anfänger fordern AtCoder heraus! ABC085C --Otoshidama

Führen Sie unittest in Python aus (für Anfänger)

pytorch @ python3.8 Umgebungskonstruktion mit pipenv

Anfänger Memorandum Python "isdigit" Bewegung

Web Scraping für Anfänger in Python (4) -1

Python #Hello World für Super-Anfänger

Python für Super-Anfänger Super-Anfänger Python # Wörterbuch Typ 2

Python-Anfänger versuchten es herauszufinden

Lernen Sie die Grundlagen von Python ① Grundlegende Anfänger

INSERT in MySQL mit Python [Für Anfänger]

[Python] Protokoll des Studientreffens für Anfänger (7/15)

Antwort auf AtCoder Beginners Selection von Python3

[Episode 2] Anfänger haben Numeron AI mit Python ausprobiert

[Episode 3] Anfänger haben Numeron AI mit Python ausprobiert

Lassen Sie uns Python für Super-Anfänger zusammenstellen

[Episode 0] Anfänger haben Numeron AI mit Python ausprobiert

[Episode 1] Anfänger haben Numeron AI mit Python ausprobiert

10 Python-Fehler, die Anfängern häufig sind

[Python] Bilder mit OpenCV lesen (für Anfänger)

Berühren Sie einen virtuellen Roboter mit Peppers Python SDK

WebApi-Erstellung mit Python (CRUD-Erstellung) Für Anfänger

Ich habe versucht, Python zu berühren (grundlegende Syntax)

Wie Python-Anfänger mit Progete beginnen