[PYTHON] J'ai essayé d'utiliser le notebook jupyter d'une manière ou d'une autre


J'ai essayé d'utiliser le notebook jupyter d'une manière ou d'une autre


Célèbre comme tutoriel pour kaggle Utiliser les données des passagers du Titanic

La construction de l'environnement était basée sur les éléments suivants http://qiita.com/mix_dvd/items/29dfb8d47a596b4df36d

Mettez les bibliothèques requises

import pandas as pd
from pandas import DataFrame,Series
import numpy as np

Lire csv et plonger dans une trame de données

titanic_df = pd.read_csv('train.csv')

Afficher les 5 premières lignes

titanic_df.head()
ssengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked
0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S
1 2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Th... female 38.0 1 0 PC 17599 71.2833 C85 C
2 3 1 3 Heikkinen, Miss. Laina female 26.0 0 0 STON/O2. 3101282 7.9250 NaN S
3 4 1 1 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35.0 1 0 113803 53.1000 C123 S
4 5 0 3 Allen, Mr. William Henry male 35.0 0 0 373450 8.0500 NaN S

Mettez la bibliothèque requise pour le dessin

import matplotlib.pyplot as plt
import seaborn as sns
% matplotlib inline

Compter par sexe

sns.countplot('Sex',data = titanic_df)

output_10_2.png

S'il est inférieur à 16, c'est un enfant. À part ça, c'est une fonction qui renvoie le sexe.

def male_female_child(passenger):
    age, sex  = passenger
    if age < 16:
        return 'child'
    else:
        return sex  

Ajouter le résultat de la fonction à la colonne personne

titanic_df['person'] = titanic_df[['Age','Sex']].apply(male_female_child,axis = 1)

Assurez-vous que la colonne de personne a été ajoutée

titanic_df.head(10)
ssengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked person
0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S male
1 2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Th... female 38.0 1 0 PC 17599 71.2833 C85 C female
2 3 1 3 Heikkinen, Miss. Laina female 26.0 0 0 STON/O2. 3101282 7.9250 NaN S female
3 4 1 1 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35.0 1 0 113803 53.1000 C123 S female
4 5 0 3 Allen, Mr. William Henry male 35.0 0 0 373450 8.0500 NaN S male
5 6 0 3 Moran, Mr. James male NaN 0 0 330877 8.4583 NaN Q male
6 7 0 1 McCarthy, Mr. Timothy J male 54.0 0 0 17463 51.8625 E46 S male
7 8 0 3 Palsson, Master. Gosta Leonard male 2.0 3 1 349909 21.0750 NaN S child
8 9 1 3 Johnson, Mrs. Oscar W (Elisabeth Vilhelmina Berg) female 27.0 0 2 347742 11.1333 NaN S female
9 10 1 2 Nasser, Mrs. Nicholas (Adele Achem) female 14.0 1 0 237736 30.0708 NaN C child

Dessinez Pclass (classe de salle, première classe, deuxième classe, troisième classe) en couches

sns.countplot('Pclass',data = titanic_df ,hue = 'person')

output_17_2.png

Pour le moment, j'ai essayé d'utiliser jupyter, mais c'est pratique C'est bien de pouvoir laisser le code et les résultats ensemble

Faisons l'analyse de survie des passagers du Titanic de Kaggle la prochaine fois.

Recommended Posts

J'ai essayé d'utiliser le notebook jupyter d'une manière ou d'une autre
J'ai essayé d'utiliser Jupyter
[Pythonocc] J'ai essayé d'utiliser la CAO sur un notebook Jupyter
J'ai essayé le notebook Jupyter de VS Code
J'ai essayé d'utiliser paramétré
J'ai essayé d'utiliser argparse
J'ai essayé d'utiliser la mimesis
J'ai essayé d'utiliser anytree
J'ai essayé d'utiliser Summpy
J'ai essayé d'utiliser coturn
J'ai essayé d'utiliser Pipenv
J'ai essayé d'utiliser matplotlib
J'ai essayé d'utiliser "Anvil".
J'ai essayé d'utiliser Hubot
J'ai essayé d'utiliser ESPCN
J'ai essayé d'utiliser openpyxl
J'ai essayé d'utiliser Ipython
J'ai essayé d'utiliser PyCaret
J'ai essayé d'utiliser cron
J'ai essayé d'utiliser ngrok
J'ai essayé d'utiliser face_recognition
J'ai essayé d'utiliser du folium
J'ai essayé d'utiliser jinja2
J'ai essayé d'utiliser du folium
J'ai essayé d'utiliser la fenêtre de temps
Utilisation de Graphviz avec Jupyter Notebook
[J'ai essayé d'utiliser Pythonista 3] Introduction
J'ai essayé d'utiliser easydict (mémo).
J'ai essayé la reconnaissance faciale avec Face ++
J'ai essayé d'utiliser RandomForest
J'ai essayé d'utiliser BigQuery ML
Essayez d'utiliser Jupyter Notebook de manière dynamique
J'ai essayé d'utiliser magenta / TensorFlow
jupyter je l'ai touché
J'ai essayé d'utiliser AWS Chalice
J'ai essayé d'utiliser l'émojinateur Slack
J'ai essayé d'utiliser PySpark de Jupyter 4.x sur EMR
J'ai essayé d'utiliser Rotrics Dex Arm # 2
J'ai essayé d'utiliser Rotrics Dex Arm
J'ai essayé d'utiliser GrabCut d'OpenCV
J'ai essayé de communiquer avec le client serveur en utilisant tmux
J'ai essayé l'apprentissage en profondeur avec Theano
[Kaggle] J'ai essayé le sous-échantillonnage en utilisant un apprentissage déséquilibré
J'ai essayé de photographier une vague de tortue en utilisant OpenPose
J'ai essayé d'utiliser l'API checkio
J'ai essayé le traitement asynchrone en utilisant asyncio
J'ai essayé d'utiliser Amazon SQS avec django-celery
Je veux écrire un blog avec Jupyter Notebook
J'ai essayé de jouer au jeu ○ ✕ en utilisant TensorFlow
J'ai essayé d'utiliser l'API de données YOUTUBE V3
J'ai essayé d'utiliser du sélénium avec du chrome sans tête
J'ai essayé de dessiner une ligne en utilisant une tortue
J'ai essayé d'utiliser l'optimisation bayésienne de Python
J'ai essayé de classer le texte en utilisant TensorFlow
J'ai essayé d'utiliser la recherche sélective comme R-CNN
J'ai essayé d'utiliser l'API UnityCloudBuild de Python
J'ai essayé la reconnaissance d'image simple avec Jupyter