[PYTHON] Einfacher Code, der in Kaggles Titanic: Maschinelles Lernen aus Katastrophen eine Punktzahl von 0,81339 ergibt

Wenn Sie dies verschieben, sollte dies eine angemessene Vorhersagegenauigkeit sein. Ich werde versuchen, es ein bisschen mehr aufzufrischen.

from sklearn.ensemble import RandomForestClassifier

#Daten importieren und Inhalte überprüfen
train_data = pd.read_csv("../input/titanic/train.csv")
test_data = pd.read_csv("../input/titanic/test.csv")

#Umgang mit fehlenden Werten
train_data['Age'].fillna(train_data['Age'].median(), inplace=True)
train_data['Embarked'].fillna(train_data['Embarked'].mode(), inplace=True)
test_data['Age'].fillna(test_data['Age'].median(), inplace=True)
test_data['Fare'].fillna(test_data.groupby('Pclass')['Fare'].median()[3], inplace=True)

#Datenaufbereitung
y_train = train_data["Survived"]
features = ["Pclass", "Sex", "SibSp", "Parch", 'Embarked']
X_train = pd.get_dummies(train_data[features])
X_test = pd.get_dummies(test_data[features])

#Feature Quantity Engineering von Trainingsdaten
X_train['Young'] = np.where(train_data['Age'] < 15, 1, 0)
X_train['Old'] = np.where(train_data['Age'] >= 65, 1, 0)
X_train['Family'] = train_data['SibSp'] + train_data['Parch']
X_train['Alone'] = np.where(X_train['Family'] == 0, 1, 0)
X_train['Fare'] = (train_data['Fare'] - train_data['Fare'].min()) / (train_data['Fare'].max() - train_data['Fare'].min())

#Feature Engineering von Testdaten
X_test['Young'] = np.where(test_data['Age'] < 15, 1, 0)
X_test['Old'] = np.where(test_data['Age'] >= 65, 1, 0)
X_test['Family'] = test_data['SibSp'] + test_data['Parch']
X_test['Alone'] = np.where(X_test['Family'] == 0, 1, 0)
X_test['Fare'] = (test_data['Fare'] - test_data['Fare'].min()) / (test_data['Fare'].max() - test_data['Fare'].min())

#Modellierung und Anpassung
model = RandomForestClassifier(n_estimators=100, max_depth=5, random_state=1)
model.fit(X_train, y_train)
predictions = model.predict(X_test)

#Speichern von Daten zur Übermittlung
output = pd.DataFrame({'PassengerId': test_data.PassengerId, 'Survived': predictions})
output.to_csv('my_submission.csv', index=False)
print("Your submission was successfully saved!")

Recommended Posts

Einfacher Code, der in Kaggles Titanic: Maschinelles Lernen aus Katastrophen eine Punktzahl von 0,81339 ergibt
[Maschinelles Lernen] Verstehen Sie aus der Mathematik, dass Standardisierung zu einem Durchschnitt von 0 und einer Standardabweichung von 1 führt.
Lassen Sie uns einen Teil des maschinellen Lernens mit Python berühren
Installation von TensorFlow, einer Bibliothek für maschinelles Lernen von Google
Einführung in das maschinelle Lernen mit Simple Perceptron
MALSS (Einführung), ein Tool, das maschinelles Lernen in Python unterstützt
Ein Beispiel für einen Mechanismus, der eine Vorhersage von HTTP aus dem Ergebnis des maschinellen Lernens zurückgibt
Lassen Sie Code Day45 ab Null "1379. Finden Sie einen entsprechenden Knoten eines Binärbaums in einem Klon dieses Baums"
Code lesen von faker, einer Bibliothek, die Testdaten in Python generiert
Kostenlose Version von DataRobot! ?? Einführung in "PyCaret", eine Bibliothek, die maschinelles Lernen automatisiert
Liste der wichtigsten Wahrscheinlichkeitsverteilungen, die beim maschinellen Lernen und in der Statistik verwendet werden, sowie Code in Python
[Django] Erstellen Sie ein Formular, das automatisch die Adresse aus der Postleitzahl ausfüllt
Implementierung eines Modells, das Wechselkurse (Dollar-Yen-Kurs) durch maschinelles Lernen vorhersagt
Ein Memorandum über Methoden, die häufig beim maschinellen Lernen mit Scikit-Learn (für Anfänger) verwendet werden.
Maschinelles Lernen eines jungen Ingenieurs Teil 1
Eine Geschichte über einfaches maschinelles Lernen mit TensorFlow
Vollständige Offenlegung der beim maschinellen Lernen verwendeten Methoden
Liste der Links, die Anfänger des maschinellen Lernens lernen
Überblick über maschinelle Lerntechniken, die aus Scikit-Learn gelernt wurden
Zusammenfassung der beim maschinellen Lernen verwendeten Bewertungsfunktionen
Maschinelles Lernen eines jungen Ingenieurs Teil 2
Tool MALSS (Anwendung), das maschinelles Lernen in Python unterstützt
Eine Code-Sammlung, die häufig in persönlichem Python verwendet wird
Informationen zur Datenvorverarbeitung von Systemen, die maschinelles Lernen verwenden
Tool MALSS (Basic), das maschinelles Lernen in Python unterstützt
Über das Testen bei der Implementierung von Modellen für maschinelles Lernen
#Eine Funktion, die den Zeichencode einer Zeichenfolge zurückgibt
Shell-Programm, das in Vielfachen von 3 aho wird
Super einfach: Eine Sammlung von Shells, die Daten ausgeben
Erstellen Sie mit Winsows 10 eine maschinelle Lernumgebung von Grund auf neu
Papier: Maschinelles Lernpapier, das Bilder im Gehirn reproduziert (Tiefenbildrekonstruktion aus menschlicher Gehirnaktivität)