In Anlehnung an das vorherige ① werden wir die Trainingsdaten und Testdaten etwas praktischer aufteilen.
Bereiten Sie zuerst die Daten vor.
Jetzt gibt es zwei Variablen x. Wenn also beim maschinellen Lernen zwei oder mehr Variablen x vorhanden sind Wir werden sie zu einer kombinieren und sie als oberes Kapital $ \ mathbf {X} $ behandeln.
Teilen Sie es anschließend in Trainingsdaten und Testdaten auf.
Trainingsdaten Testdaten Anschließend erstellen wir aus den Trainingsdaten eine Modellformel. Wenn dies nach der Methode der kleinsten Quadrate berechnet wird, kann es wie folgt erhalten werden.
Und wir werden dies auf die Testdaten anwenden.
Aus dem Obigen für y_test der richtigen Antwortdaten Ich fand, dass der erwartete y_pred ungefähr korrekt war.
Wenn es zwei oder mehr $ x $ für $ y $ gibt Stellen Sie sich Trainingsdaten und Testdaten wie oben beschrieben vor.
Beim tatsächlichen maschinellen Lernen für Daten wie diese y ist die Miete, x1 und x2 sind die Bestandteile (Bahnhofsspaziergang, Alter usw.) Wir analysieren die Daten.
Auch der vorherige Artikel ① und dieser Artikel ② Beide verwenden eine Methode namens lineare Regression. Ich hoffe, in naher Zukunft wieder zu posten.
Recommended Posts