[PYTHON] Ich habe irgendwie versucht, ein Jupyter-Notebook zu verwenden


Ich habe irgendwie versucht, ein Jupyter-Notebook zu verwenden


Berühmt als Tutorial für Kaggle Verwenden Sie Passagierdaten der Titanic

Die Umgebungskonstruktion basierte auf Folgendem http://qiita.com/mix_dvd/items/29dfb8d47a596b4df36d

Legen Sie die erforderlichen Bibliotheken

import pandas as pd
from pandas import DataFrame,Series
import numpy as np

Lesen Sie csv und tauchen Sie in einen Datenrahmen ein

titanic_df = pd.read_csv('train.csv')

Zeigen Sie die ersten 5 Zeilen an

titanic_df.head()
ssengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked
0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S
1 2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Th... female 38.0 1 0 PC 17599 71.2833 C85 C
2 3 1 3 Heikkinen, Miss. Laina female 26.0 0 0 STON/O2. 3101282 7.9250 NaN S
3 4 1 1 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35.0 1 0 113803 53.1000 C123 S
4 5 0 3 Allen, Mr. William Henry male 35.0 0 0 373450 8.0500 NaN S

Stellen Sie die zum Zeichnen erforderliche Bibliothek ein

import matplotlib.pyplot as plt
import seaborn as sns
% matplotlib inline

Nach Geschlecht zählen

sns.countplot('Sex',data = titanic_df)

output_10_2.png

Wenn es weniger als 16 ist, ist es eine Funktion, die das Geschlecht anderweitig zurückgibt.

def male_female_child(passenger):
    age, sex  = passenger
    if age < 16:
        return 'child'
    else:
        return sex  

Fügen Sie das Ergebnis der Funktion zur Personenspalte hinzu

titanic_df['person'] = titanic_df[['Age','Sex']].apply(male_female_child,axis = 1)

Stellen Sie sicher, dass die Personenspalte hinzugefügt wurde

titanic_df.head(10)
ssengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked person
0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S male
1 2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Th... female 38.0 1 0 PC 17599 71.2833 C85 C female
2 3 1 3 Heikkinen, Miss. Laina female 26.0 0 0 STON/O2. 3101282 7.9250 NaN S female
3 4 1 1 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35.0 1 0 113803 53.1000 C123 S female
4 5 0 3 Allen, Mr. William Henry male 35.0 0 0 373450 8.0500 NaN S male
5 6 0 3 Moran, Mr. James male NaN 0 0 330877 8.4583 NaN Q male
6 7 0 1 McCarthy, Mr. Timothy J male 54.0 0 0 17463 51.8625 E46 S male
7 8 0 3 Palsson, Master. Gosta Leonard male 2.0 3 1 349909 21.0750 NaN S child
8 9 1 3 Johnson, Mrs. Oscar W (Elisabeth Vilhelmina Berg) female 27.0 0 2 347742 11.1333 NaN S female
9 10 1 2 Nasser, Mrs. Nicholas (Adele Achem) female 14.0 1 0 237736 30.0708 NaN C child

Zeichne eine Klasse (Raumklasse, 1. Klasse, 2. Klasse, 3. Klasse)

sns.countplot('Pclass',data = titanic_df ,hue = 'person')

output_17_2.png

Vorerst habe ich versucht, Jupyter zu verwenden, aber es ist praktisch Es ist schön, den Code und die Ergebnisse zusammen zu lassen

Lassen Sie uns das nächste Mal die Überlebensanalyse der Titanic-Passagiere von kaggle durchführen.

Recommended Posts

Ich habe irgendwie versucht, ein Jupyter-Notebook zu verwenden
Ich habe versucht, Jupyter zu verwenden
[Pythonocc] Ich habe versucht, CAD auf einem Jupyter-Notebook zu verwenden
Ich habe das Jupyter-Notebook von VS Code ausprobiert
Ich habe versucht, parametrisiert zu verwenden
Ich habe versucht, Argparse zu verwenden
Ich habe versucht, Mimesis zu verwenden
Ich habe versucht, anytree zu verwenden
Ich habe versucht, Summpy zu verwenden
Ich habe versucht, Coturn zu verwenden
Ich habe versucht, Pipenv zu verwenden
Ich habe versucht, Matplotlib zu verwenden
Ich habe versucht, "Anvil" zu verwenden.
Ich habe versucht, Hubot zu verwenden
Ich habe versucht, ESPCN zu verwenden
Ich habe versucht, openpyxl zu verwenden
Ich habe versucht, Ipython zu verwenden
Ich habe versucht, PyCaret zu verwenden
Ich habe versucht, Cron zu verwenden
Ich habe versucht, ngrok zu verwenden
Ich habe versucht, face_recognition zu verwenden
Ich habe versucht, Folium zu verwenden
Ich habe versucht, jinja2 zu verwenden
Ich habe versucht, Folium zu verwenden
Ich habe versucht, das Zeitfenster zu verwenden
Verwenden von Graphviz mit Jupyter Notebook
[Ich habe versucht, Pythonista 3 zu verwenden] Einführung
Ich habe versucht, easydict (Memo) zu verwenden.
Ich habe versucht, das Gesicht mit Face ++ zu erkennen
Ich habe versucht, RandomForest zu verwenden
Ich habe versucht, BigQuery ML zu verwenden
Versuchen Sie, Jupyter Notebook dynamisch zu verwenden
Ich habe versucht, Magenta / TensorFlow zu verwenden
jupyter ich habe es berührt
Ich habe versucht, AWS Chalice zu verwenden
Ich habe versucht, Slack Emojinator zu verwenden
Ich habe versucht, PySpark von Jupyter 4.x auf EMR zu verwenden
Ich habe versucht, Rotrics Dex Arm # 2 zu verwenden
Ich habe versucht, Rotrics Dex Arm zu verwenden
Ich habe versucht, GrabCut von OpenCV zu verwenden
Ich habe versucht, mit dem Server-Client über tmux zu kommunizieren
Ich habe versucht, mit Theano tief zu lernen
[Kaggle] Ich habe versucht, mit unausgeglichenem Lernen zu unterabtasten
Ich habe versucht, mit OpenPose eine Schildkrötenwelle zu schießen
Ich habe versucht, die checkio-API zu verwenden
Ich habe versucht, asynchrone Verarbeitung mit Asyncio
Ich habe versucht, Amazon SQS mit Django-Sellerie zu verwenden
Ich möchte einen Blog mit Jupyter Notebook schreiben
Ich habe versucht, ○ ✕ mit TensorFlow zu spielen
Ich habe versucht, YOUTUBE Data API V3 zu verwenden
Ich habe versucht, Selen mit Headless-Chrom zu verwenden
Ich habe versucht, mit einer Schildkröte eine Linie zu ziehen
Ich habe versucht, die Bayes'sche Optimierung von Python zu verwenden
Ich habe versucht, Text mit TensorFlow zu klassifizieren
Ich habe versucht, die selektive Suche als R-CNN zu verwenden
Ich habe versucht, die UnityCloudBuild-API von Python zu verwenden
Ich habe mit Jupyter eine einfache Bilderkennung versucht