Vorhersagestatistik (einfache Regression üben) Python

Ich mache es als Ergebnis des Studiums, also kann ich einen Fehler machen. Fühlen Sie sich frei zu kommentieren.

Dieses Mal habe ich im vorherigen Artikel "Predictive Statistics (Theory)" geschrieben, aber ich denke, dass es einige Dinge gibt, die nicht allein aus der Theorie verstanden werden können, also eigentlich Python Ich werde die Nutzung der Bibliothek von üben. Dieses Mal verwenden wir eine Methode namens Regression </ b> in der Vorhersage.

Inhalt

・ Modellierungsfluss ・ Lassen Sie uns eine einfache Regressionsanalyse durchführen

Modellierungsfluss

(1) Bestimmen Sie die erklärende Variable (x-Achse) und die Zielvariable (y-Achse) im Voraus. ② Lesen Sie die Daten ③ Bereiten Sie Variablen zum Speichern des Modells vor ④ Modellerstellung ⑤ Vorhersage aus dem Modell

Lassen Sie uns eine einfache Regressionsanalyse durchführen

Es ist eine einfache Analyse, aber der tatsächliche Code-Fluss sieht folgendermaßen aus:

import pandas as pd
import numpy as np
from matplotlib import pyplot
%matplotlib inline #Aktuelle Browseranzeige
from sklearn.linear_model import LinearRegression as LR #Klasse für lineare Regression

train = pd.read_csv("train.csv") #Phase (2), Lesen von Trainingsdaten
test  = pd.read_csv("test.csv") #Phase (2), Lesen der Bewertungsdaten
sample = pd.read_csv("sample.csv") #Phase (2) Lesen Sie die Probe, um die Bewertungsdaten zu schreiben

trainX = train["Spaltenname"] #Erklärende Variablen setzen
testX = test["Spaltenname"] #Erklärende Variable
y = train["Spaltenname"] #Zielvariable einstellen

trainX = trainX.values.reshape(-1,1) #Bei einer einfachen Regression müssen die Daten vorbereitet werden
testX  = testX.values.reshape(-1,1) 

model = LR() #Bereiten Sie Variablen für das Regressionsmodell vor ③ Phase

model.fit(trainX, y) #Erstellen Sie eine einfache Phase des Regressionsmodells

pred = model.predict(testX) #Ersetzen Sie testX durch das Vorhersageergebnis und geben Sie für jeden Spaltennamen den Wert y an

sample["Spaltenname, den Sie zuweisen möchten"] = pred #Fügen Sie die Vorhersage in die Beispieldatei ein

sample.to_csv("Dateiname.csv") #Schreiben Sie die Datendatei aus

* Wenn die Spaltennamen von Zug und Test nicht identisch sind, ist dies bedeutungslos. </ b>

Recommended Posts