Un beau dessin graphique avec Python -seaborn facilite l'analyse et la visualisation des données Partie 1

Dessin graphique en Python

La norme pour dessiner des graphiques Python est "matplotlib", mais il a été souligné que son apparence est un peu démodée et que la notation est compliquée. Par conséquent, dans cet article, je vais discuter de la façon d'utiliser "Seaborn", qui est un wrapper pour réaliser les fonctions de Matplotlib plus magnifiquement et plus facilement.

◆ Overview of Python Visualization Tools http://pbpython.com/visualization-tools-1.html

Dans l'article ci-dessus, Matplotlib et Seaborn sont écrits comme suit.

À propos de matplotlib

Matplotlib is the grandfather of python visualization packages. It is extremely powerful but with that power comes complexity. You can typically do anything you need using matplotlib but it is not always so easy to figure out.

À propos de Seaborn

Seaborn is a visualization library based on matplotlib. It seeks to make default data visualizations much more visually appealing. It also has the goal of making more complicated plots simpler to create. It does integrate well with pandas.

En bref

matplotlib peut faire beaucoup de choses, mais c'est compliqué à gérer et Mendo (´ ・ ω ・ `) seaborn est basé sur matplotlib, mais il est plus beau et plus facile à appliquer, donc c'est génial (; ´∀ `)

C'est vrai. (adapté)

Réglage

installer seaborn (Si vous n'avez pas matplotlib, incluez matplotlib)

pip install seaborn

Préparation du colis et préparation des données Seaborn est livré avec des données bien connues par défaut, je vais donc les utiliser pour l'analyse.

setup.py


import numpy as np
import pandas as pd
import seaborn as sns

x = np.random.normal(size=100) #Créer des données aléatoires sous forme de tableau numpy

titanic = sns.load_dataset("titanic") ##Données de vie et de mort du Titanic, célèbre pour Kaggle
tips = sns.load_dataset("tips")  ##Données sur la relation entre l'heure du repas du restaurant, le montant total comptable et les chips
iris = sns.load_dataset("iris")  ##Données statistiques d'Ayame familier avec R

histogramme

Dans Seaborn, les histogrammes peuvent être dessinés avec une méthode appelée "distplot".

kde est une option de dessin pour la fonction d'approximation de la densité, et bins est la spécification de l'encoche de l'axe x. Pour les tapis, essayez ce qui se passe lorsque vous le définissez sur True.

distplot.py


sns.distplot(x, kde=False, rug=False, bins=10) 

distplot.png

Nuage de points

Dans Seaborn, les diagrammes de dispersion peuvent être dessinés avec une méthode appelée "joint plot". Essayons avec les données d'iris lues ci-dessus.

jointplot.py


sns.jointplot('sepal_width', 'petal_length', data=iris)

Eh bien, la distribution de chacune des valeurs de l'axe des x et de l'axe des y peut être vue en même temps dans l'histogramme, ce qui est magnifique.

jointplot.png

Festival de cartes à dispersion

De plus, ce diagramme de dispersion est facilement visible pour toutes les variables numériques incluses dans les données. Utilisez une méthode appelée "diagramme de paires".

pairplot.py


sns.pairplot(iris)

Vous pouvez voir immédiatement quelles variables sont fortement corrélées.

pairplot.png

Il est également possible de coder en couleur les variables catégorielles. Utilisez l'option appelée teinte.

Selon weblio, http://ejje.weblio.jp/content/hue

[Nez indénombrable] [Plus précisément, [Nez indénombrable]] une ombre, de l'ombre. exemple un changement de teinte. b couleur. exemple une teinte froide [chaude] couleur froide [chaude].

Il semble que le mot «teinte» ait le sens. C'est le premier mot que j'ai entendu quand je suis né

pairplot2.py


sns.pairplot(iris, hue="species")

pairplot2.png

Continuer à la partie 2

La partie 2 couvrira le barplot, le boxplot, le strip-tlot, etc. http://qiita.com/hik0107/items/7233ca334b2a5e1ca924

Belle carte de chaleur à Seaborn http://qiita.com/hik0107/items/67ad4cfbc9e84032fc6b

Comment dessiner plusieurs graphiques à la fois avec Seaborn est super pratique http://qiita.com/hik0107/items/865b75ae486728cb0006

Autres articles

Si vous êtes intéressé par les data scientists, regardez d'abord ici, un résumé de la littérature et des vidéos http://qiita.com/hik0107/items/ef5e044d2f47940ba712

Il est temps de réfléchir sérieusement à la définition et à l'ensemble des compétences des data scientists http://qiita.com/hik0107/items/f9bf14a7575d5c885a16

Recommended Posts

Un beau dessin graphique avec Python -seaborn facilite l'analyse et la visualisation des données Partie 1
Un beau dessin graphique avec Python -seaborn facilite l'analyse et la visualisation des données Partie 2
Visualisez facilement vos données avec Python seaborn.
Analyse de données à partir de python (visualisation de données 1)
Analyse de données à partir de python (visualisation de données 2)
[Didacticiel d'analyse Python dans la base de données avec SQL Server 2017] Étape 3: Exploration et visualisation des données
Analyse de données avec python 2
Analyse de données avec Python
Vue d'ensemble et astuces de Seaborn avec visualisation de données statistiques
Analyse et partage faciles avec re: dash, un outil de visualisation de données open source Partie 2 ~ Graphique
Obtenez une grande quantité de données Twitter de Starba avec python et essayez l'analyse de données Partie 1
Analyse et partage faciles avec re: dash, un outil de visualisation de données open source Partie 1-Installation
Grattage avec Python et belle soupe
Application Python: visualisation de données partie 1: basique
Visualisation et analyse des informations de localisation des données Twitter Stava
Application de Python: visualisation de données Partie 3: divers graphiques
Outil de visualisation Python pour le travail d'analyse de données
Modulation et démodulation FM avec Python Partie 3
Traiter les données Pubmed .xml avec python [Partie 2]
Acquisition et visualisation des données de capteurs pour la croissance des plantes avec Intel Edison et Python
Représentez facilement des données graphiques dans le shell et Python
Analyse des tweets avec Python, Mecab et CaboCha
Modulation et démodulation FM avec Python Partie 2
Recommandation d'Altair! Visualisation des données avec Python
Analyse de données à partir de python (pré-traitement des données-apprentissage automatique)
Analyse et visualisation de graphes sur IPython Notebook à l'aide de Cytoscape / cyREST et py2cytoscape Partie 1
Dessinez un graphique avec PyQtGraph Part 1-Drawing
[Python] De l'analyse morphologique des données CSV à la sortie CSV et à l'affichage graphique [GiNZA]
Créez des données de test comme ça avec Python (partie 1)
Lire les données csv Python avec Pandas ⇒ Graphique avec Matplotlib
[Diverses analyses d'images avec plotly] Visualisation dynamique avec plotly [python, image]
Implémentez "Data Visualization Design # 3" avec pandas et matplotlib
Traitement et jugement de la collecte du plan d'analyse des données (partie 1)
Traitement et jugement de la collecte du plan d'analyse des données (partie 2)
Analyse de données python
J'ai créé un graphique à barres empilées avec matplotlib de Python et ajouté une étiquette de données
Créez rapidement un tableau de bord d'analyse de données Python avec Streamlit et déployez-le sur AWS
J'ai essayé différentes choses avec Python: le grattage (Beautiful Soup + Selenium + PhantomJS) et l'analyse morphologique
Analyse des données financières par pandas et leur visualisation (1)
[# 2] Créez Minecraft avec Python. ~ Dessin du modèle et implémentation du lecteur ~
Note de lecture: Introduction à l'analyse de données avec Python
Construction d'un environnement d'analyse de données avec Python (notebook IPython + Pandas)
Défiez l'analyse des composants principaux des données textuelles avec Python
Étudiez l'échange de données Java et Python avec Apache Arrow
Partage d'analyse facile avec re: dash, un outil de visualisation de données open source Partie 4 ~ tableau croisé dynamique
Créez un arbre de décision à partir de zéro avec Python et comprenez-le (3. Bibliothèque d'analyse de données édition Pandas)
J'ai essayé la même analyse de données avec kaggle notebook (python) et PowerBI en même temps ②
Analyse et partage faciles avec re: dash, un outil de visualisation de données open source Partie 3 - Feuilles de calcul Google
"Analyse des séries chronologiques de mesure des données économiques et financières" Résolution du problème de fin de chapitre avec Python
J'ai essayé la même analyse de données avec kaggle notebook (python) et PowerBI en même temps ①
[Bibliothèque de graphiques Python Seaborn] À propos de l'utilisateur Avertissement de axes.color_cycle est obsolète et remplacé par axes.prop_cycle
[Dessin graphique] J'ai essayé d'écrire un graphique à barres multi-séries avec matplotlib et seaborn
Bibliothèques de visualisation de données Python
Présentation de l'analyse de données python
Dessin graphique avec python
Analyse vocale par python
Visualisation des données avec les pandas
Modèle d'analyse de données Python
Dessiner avec Python Tinker
Analyse vocale par python