[PYTHON] Herausforderung Kaggle [Hauspreise]

Überblick

Ich habe einen Wettbewerb herausgefordert, um den Preis eines Hauses anhand von Merkmalen wie Grundstücksfläche und Alter vorherzusagen.

Bibliotheksdefinition

import pandas as pd

Trainingsdaten und Testdaten lesen

train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')

Aufteilung der Trainingsdaten und Testdaten

Trennen Sie in die Zielvariable "Verkaufspreis" und andere abhängige Variablen.

train_x = train.drop(['Id', 'SalePrice'], axis=1)
train_y = train['SalePrice']
test_x = test.drop(['Id'], axis=1)

Ersetzen Sie kategoriale Variablen durch Zahlen

for column in train_x.columns:
    labels, uniques = pd.factorize(train_x[column])
    train_x[column] = labels
for column in test_x.columns:
    labels, uniques = pd.factorize(test_x[column])
    test_x[column] = labels

Anpassung mit linearer Regression

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(train_x, train_y)

Prognose

pred_y = regressor.predict(test_x)

CSV-Erstellung

submission = pd.DataFrame({'Id':test['Id'], 'SalePrice':pred_y})
submission.to_csv('submission.csv', index=False)

Recommended Posts

Herausforderung Kaggle [Hauspreise]
Kaggle House Preise ③ ~ Prognose / Einreichung ~
Kaggle House Preise ② ~ Modellierung ~
Kaggle House Preise ~ ~ Feature Engineering ~
RECRUIT Challenge @ kaggle
Kaggle ~ Home Preisprognose ② ~
Amateur-Vermarkter für maschinelles Lernen forderten Kaggles Hauspreise heraus (Teil 1)
Immobilienpreise: Fortgeschrittene Regressionstechniken