[PYTHON] Trainingsdaten und Testdaten (Was sind X_train und y_train?) ②

In Anlehnung an das vorherige ① werden wir die Trainingsdaten und Testdaten etwas praktischer aufteilen.

Bereiten Sie zuerst die Daten vor.

Jetzt gibt es zwei Variablen x. image.png Wenn also beim maschinellen Lernen zwei oder mehr Variablen x vorhanden sind Wir werden sie zu einer kombinieren und sie als oberes Kapital $ \ mathbf {X} $ behandeln.

Teilen Sie es anschließend in Trainingsdaten und Testdaten auf.

Trainingsdaten image.png Testdaten image.png Anschließend erstellen wir aus den Trainingsdaten eine Modellformel. Wenn dies nach der Methode der kleinsten Quadrate berechnet wird, kann es wie folgt erhalten werden.

y=0.9+2x_1+2.0\times10^{-16}x_2

Und wir werden dies auf die Testdaten anwenden.

y_{pred}=0.9+2x_{1_{test}}+2.0\times10^{-16}x_{2_{test}}=9,11

Aus dem Obigen für y_test der richtigen Antwortdaten Ich fand, dass der erwartete y_pred ungefähr korrekt war.

Wenn es zwei oder mehr $ x $ für $ y $ gibt Stellen Sie sich Trainingsdaten und Testdaten wie oben beschrieben vor.

Beim tatsächlichen maschinellen Lernen für Daten wie diese y ist die Miete, x1 und x2 sind die Bestandteile (Bahnhofsspaziergang, Alter usw.) Wir analysieren die Daten.

Auch der vorherige Artikel ① und dieser Artikel ② Beide verwenden eine Methode namens lineare Regression. Ich hoffe, in naher Zukunft wieder zu posten.

Recommended Posts

Trainingsdaten und Testdaten (Was sind X_train und y_train?) ①
Trainingsdaten und Testdaten (Was sind X_train und y_train?) ②
[Python] Was sind @classmethod und Dekorateure?
(Anfänger) Was sind Kerne und Threads?
Was sind Go Mod, Go Get und Go Mod Anbieter?
Was sind Linux POSIX Option und GNU Option?
[Mathematik] Visualisieren wir, was Eigenwerte und Eigenvektoren sind
Maschinelles Lernen Aufteilung der Trainingsdaten und Lernen / Vorhersage / Verifizierung
Was vergleichst du mit Python und ==?
Was sind Python Taples und * Args?
Trainingsdaten erstellen
Verteilung und Test
[PyTorch Tutorial ⑦] Visualisieren von Modellen, Daten und Training mit Tensorboard
MySQL-Installation unter Aws Linux 2 und Vorbereitung der Testdaten