Ich mache es als Ergebnis des Studiums, also kann ich einen Fehler machen. Fühlen Sie sich frei zu kommentieren.
Dieses Mal habe ich im vorherigen Artikel "Predictive Statistics (Theory)" geschrieben, aber ich denke, dass es einige Dinge gibt, die nicht allein aus der Theorie verstanden werden können, also eigentlich Python Ich werde die Nutzung der Bibliothek von üben. Dieses Mal verwenden wir eine Methode namens Regression </ b> in der Vorhersage.
・ Modellierungsfluss ・ Lassen Sie uns eine einfache Regressionsanalyse durchführen
(1) Bestimmen Sie die erklärende Variable (x-Achse) und die Zielvariable (y-Achse) im Voraus. ② Lesen Sie die Daten ③ Bereiten Sie Variablen zum Speichern des Modells vor ④ Modellerstellung ⑤ Vorhersage aus dem Modell
Es ist eine einfache Analyse, aber der tatsächliche Code-Fluss sieht folgendermaßen aus:
import pandas as pd
import numpy as np
from matplotlib import pyplot
%matplotlib inline #Aktuelle Browseranzeige
from sklearn.linear_model import LinearRegression as LR #Klasse für lineare Regression
train = pd.read_csv("train.csv") #Phase (2), Lesen von Trainingsdaten
test = pd.read_csv("test.csv") #Phase (2), Lesen der Bewertungsdaten
sample = pd.read_csv("sample.csv") #Phase (2) Lesen Sie die Probe, um die Bewertungsdaten zu schreiben
trainX = train["Spaltenname"] #Erklärende Variablen setzen
testX = test["Spaltenname"] #Erklärende Variable
y = train["Spaltenname"] #Zielvariable einstellen
trainX = trainX.values.reshape(-1,1) #Bei einer einfachen Regression müssen die Daten vorbereitet werden
testX = testX.values.reshape(-1,1)
model = LR() #Bereiten Sie Variablen für das Regressionsmodell vor ③ Phase
model.fit(trainX, y) #Erstellen Sie eine einfache Phase des Regressionsmodells
pred = model.predict(testX) #Ersetzen Sie testX durch das Vorhersageergebnis und geben Sie für jeden Spaltennamen den Wert y an
sample["Spaltenname, den Sie zuweisen möchten"] = pred #Fügen Sie die Vorhersage in die Beispieldatei ein
sample.to_csv("Dateiname.csv") #Schreiben Sie die Datendatei aus
* Wenn die Spaltennamen von Zug und Test nicht identisch sind, ist dies bedeutungslos. </ b>
Recommended Posts