Statistiques prédictives (pratique de la régression simple) Python

Je le fais comme résultat d'étude, alors je peux faire une erreur. N'hésitez pas à commenter.

Cette fois, j'ai écrit "Statistiques prédictives (Théorie)" dans l'article précédent, mais je pense qu'il y a des choses qui ne peuvent pas être comprises à partir de la théorie seule, donc en fait python Je vais m'entraîner à utiliser la bibliothèque de. Cette fois, nous utiliserons une méthode appelée régression </ b> dans la prédiction.

Contenu

・ Flux de modélisation ・ Faisons une analyse de régression simple

Modélisation du flux

(1) Déterminez à l'avance la variable explicative (axe x) et la variable objective (axe y). ② Lisez les données ③ Préparez les variables pour stocker le modèle ④ Création de modèle ⑤ Prédire à partir du modèle

Faisons une simple analyse de régression

C'est une analyse simple, mais le flux de code réel ressemble à ceci:

import pandas as pd
import numpy as np
from matplotlib import pyplot
%matplotlib inline #Affichage actuel du navigateur
from sklearn.linear_model import LinearRegression as LR #Classe qui effectue une régression linéaire

train = pd.read_csv("train.csv") #Phase (2), lecture des données d'entraînement
test  = pd.read_csv("test.csv") #Phase (2), lecture des données d'évaluation
sample = pd.read_csv("sample.csv") #Phase (2) Lire l'exemple pour écrire les données d'évaluation

trainX = train["Nom de colonne"] #Définition de variables explicatives
testX = test["Nom de colonne"] #Variable explicative
y = train["Nom de colonne"] #Définition de la variable objectif

trainX = trainX.values.reshape(-1,1) #Dans le cas d'une régression simple, il est nécessaire de préparer les données
testX  = testX.values.reshape(-1,1) 

model = LR() #Préparer les variables pour le modèle de régression ③ Phase

model.fit(trainX, y) #Créer un modèle de régression simple ④ phase

pred = model.predict(testX) #Remplacez le résultat de la prédiction par testX et donnez la valeur de y pour chaque nom de colonne

sample["Nom de colonne que vous souhaitez attribuer"] = pred #Insérer une prédiction dans un fichier d'exemple

sample.to_csv("nom de fichier.csv") #Écrivez le fichier de données

* Si les noms des colonnes train et test ne sont pas les mêmes, cela n'a pas de sens. </ b>

Recommended Posts