J'ai essayé la même analyse de données avec kaggle notebook (python) et PowerBI en même temps ②

Contexte

Dernier message [J'ai essayé la même analyse de données avec kaggle notebook (python) et PowerBI en même temps ①] Identique à (https://qiita.com/khigashimoto/items/80f0858b59379d461d97).

La dernière fois, j'ai essayé l'environnement suivant ①, mais cette fois je vais essayer l'environnement ②. --Environnement ① Analyse des données à l'aide de Python + Numpy + Pandas + α --Environnement (2) Analyse de données à l'aide d'outils BI (outils de Business Intelligence)

Configuration du système

Environnement commun

PC utilisé: Surface LTE Core i5-7300U, mémoire 8 Go Système d'exploitation PC utilisé: Microsoft Windows10 Pro 64 bits Navigateur utilisé: Microsoft Edge

Environnement ② "Analyse des données par l'outil BI" Environnement d'exploitation

-Environnement d'utilisation: Microsoft Power BI Desktop Ver 2.84.802.0 64 bits Vous pouvez obtenir PowerBI Desktop sur le Microsoft Store. La plupart des fonctions, y compris ce travail, peuvent être utilisées gratuitement. image.png

Ce que j'ai fait (résumé)

Comme la dernière fois, j'emprunterai une partie du cours de science des données d'Udemy ci-dessous. [180 000 personnes dans le monde] Science des données Python pratique

L'analyse suivante liée au fameux «naufrage du Titanic» comme première étape de l'analyse des données sera réalisée cette fois avec l'outil BI.

・ Quel genre de personnes étaient les passagers du Titanic? (Sexe, âge, etc.) ・ Relation causale entre les caractéristiques susmentionnées et leur relation complexe et leur taux de survie

Ce que j'ai fait (détails) * BI Tools (PowerBI)

  1. Obtenir des données localement (propre PC) Acquérir des données client au moment du naufrage du Titanic sous forme de données CSV auprès de kaggle. Je vais l'omettre car ce sera le même que l'article précédent, mais lorsque vous ouvrez les données client réelles dans Excel, cela ressemblera à ceci. image.png

  2. Apportez des données locales dans l'environnement et affichez un résumé Démarrez PowerBI Desktop et importez le fichier CSV enregistré.

-Depuis l'écran principal après le démarrage, sélectionnez "Icône Obtenir les données" ⇒ "Texte / CSV" image.png

・ L'écran d'aperçu ressemble à ceci. Appuyez sur le bouton "Charger" image.png

・ Lorsque vous revenez à l'écran principal, rien ne s'affiche, appuyez donc sur "l'icône de l'écran de données". image.png

・ Vous pouvez voir les données lues image.png

Puisque PowerBI Desktop est une application basée sur l'interface graphique (bien sûr ...), contrairement aux environnements basés sur CUI tels que Python, vous pouvez immédiatement obtenir une vue d'ensemble de l'état des données sur l'écran lui-même.

    1. Vérifiez le ratio hommes / femmes ・ Appuyez sur «l'icône de l'écran de rapport» pour accéder à l'écran de rapport image.png

・ "Essayez d'utiliser un graphique à barres défini. Lorsque vous appuyez sur l'icône, le graphique s'affiche sur l'écran supérieur gauche. image.png

-Faites glisser et déposez l'élément appelé Sex sur le côté droit de l'écran sur l'axe central et la valeur. image.png

C'est bien de pouvoir travailler graphiquement avec ce type de convivialité comme Excel. En passant, je me suis senti un peu léger en faisant ce travail, et quand je l'ai vérifié avec le gestionnaire de tâches, c'était comme suit. Puisqu'il s'agira d'une application de bureau, j'ai pensé qu'il serait plus confortable d'avoir environ 16 Go de mémoire pour un PC Win10. image.png

Quatre. Vérifiez le ratio hommes / femmes pour chaque classe de chambre La classe d'item P indique le grade de la salle. Je pourrais facilement faire la même chose avec PowerBI ici.

・ De même, sélectionnez le graphique à barres défini. Glissez et déposez l'item "Sex" vers "Axis" et "Value" et l'item Pclass vers "Legend". image.png

Il est également possible d'inverser facilement l'axe. ・ De même, sélectionnez le graphique à barres défini. Faites glisser et déposez l'item "Sexe" vers "Légende" et "Valeur" et l'item Pclass vers "Axe". image.png

Cinq. Créez des éléments (Personne) tels que "homme", "femme" et "enfant (moins de 16 ans)" en utilisant les éléments d'âge (âge) et de sexe (sexe). Commencez par créer une colonne Personne. J'ai essayé avec enthousiasme, mais pour le moment je n'ai pas réussi à bien générer des colonnes ... Nous pensons qu'il existe deux types d'insertion de colonnes. ・ Éditeur de requêtes Il s'agit d'une fonction dédiée au traitement des données d'origine selon le but de l'analyse sans modifier les données d'origine. Je viens de mentionner que je voudrais ajouter une colonne personnalisée à partir de cette fonction comme indiqué ci-dessous, mais le résultat sera une erreur. image.png image.png

・ Ajout de colonne pure Dans ce cas, la prochaine fois, j'ai essayé d'ajouter une colonne directement sur l'écran de données, mais malheureusement, cela entraîne également une erreur. image.png

Hmm. .. .. Pour le moment, c'est la fin de la vérification. ..

En outre, les résultats d'une série d'essais d'analyse utilisant PowerBI sont joints ci-dessous. Je pense que c'est un bon point de PowerBI de pouvoir lister les résultats et obtenir une vue à vol d'oiseau côte à côte de cette manière.

image.png

Résumé (impression)

Voici mes impressions de PowerBI Desktop que j'ai ressenties en faisant le travail ci-dessus.


Avantages
・ La méthode d'affichage est riche (belle) -Comme il s'agit d'une application basée sur l'interface graphique, même les personnes qui n'écrivent pas de programmes peuvent facilement l'utiliser. ・ Plusieurs résultats peuvent être visualisés côte à côte.


Inconvénients
-Pour le traitement tel que le traitement des valeurs manquantes et la génération de données, cela peut être déroutant lorsque vous essayez d'effectuer un travail compliqué. -Comme il n'y a pas tellement de références pour PowerBI lui-même, vous ne pouvez pas vous sentir libre de google lorsque vous avez des problèmes. -Comme c'est une application qui utilise un vrai PC, ressent-elle un peu de lumière selon les spécifications du PC?

CaseA) Python qui peut être utilisé avec de nombreuses références et des flux détaillés pour des analyses complexes telles que le prétraitement et la génération de données supplémentaires. CaseB) PowerBI est un mécanisme d'affichage pour les travailleurs réels utilisant l'analyse de la lumière et les résultats après analyse en Python. Je pense qu'il vaut mieux vivre séparément et l'utiliser. Je pense à ce stade.

Recommended Posts

J'ai essayé la même analyse de données avec kaggle notebook (python) et PowerBI en même temps ②
J'ai essayé la même analyse de données avec kaggle notebook (python) et PowerBI en même temps ①
Tracez plusieurs cartes et données en même temps avec matplotlib de Python
Visualisez les données et saisissez la corrélation en même temps
J'ai essayé de publier automatiquement sur ChatWork au moment du déploiement avec Fabric et ChatWork Api
J'ai essayé l'analyse factorielle avec des données Titanic!
J'ai essayé l'analyse de données IRMf avec python (Introduction au décodage des informations cérébrales)
J'ai essayé d'obtenir et d'analyser les données statistiques de la nouvelle Corona avec Python: données de l'Université John's Hopkins
J'ai essayé de "lisser" l'image avec Python + OpenCV
J'ai essayé de "différencier" l'image avec Python + OpenCV
J'ai essayé de sauvegarder les données avec discorde
J'ai essayé d'analyser les principaux composants avec les données du Titanic!
J'ai essayé la différenciation jacobienne et partielle avec python
J'ai essayé d'obtenir des données CloudWatch avec Python
J'ai essayé la programmation python pour la première fois.
J'ai essayé la synthèse de fonctions et le curry avec python
J'ai essayé de "binariser" l'image avec Python + OpenCV
Je veux créer un lecteur de musique et enregistrer de la musique en même temps
Transformez plusieurs listes avec l'instruction for en même temps en Python
[Python] J'ai essayé le même calcul que la prédiction de LSTM à partir de zéro [Keras]
Analyse de données avec python 2
Analyse de données avec Python
J'ai essayé de toucher un fichier CSV avec Python
J'ai essayé de prédire le match de la J League (analyse des données)
[OpenCV / Python] J'ai essayé l'analyse d'image de cellules avec OpenCV
J'ai essayé de résoudre Soma Cube avec python
J'ai essayé python pour la première fois avec heroku
Cette fois, j'ai appris Python I et II à Progate.
Construction d'un environnement d'analyse de données avec Python (notebook IPython + Pandas)
J'ai essayé de résoudre le problème avec Python Vol.1
J'ai essayé de frapper l'API avec le client python d'echonest
J'ai essayé d'automatiser la mise à jour de l'article du blog Livedoor avec Python et sélénium.
[New Corona] Le prochain pic est-il en décembre? J'ai essayé l'analyse des tendances avec Python!
[Challenger à la recherche] Le chargement et l'augmentation des données les plus rapides (bloc-notes Kaggle) je pense
J'ai essayé différentes choses avec Python: le grattage (Beautiful Soup + Selenium + PhantomJS) et l'analyse morphologique
Je voulais juste extraire les données de la date et de l'heure souhaitées avec Django
J'ai essayé de comparer la vitesse de traitement avec dplyr de R et pandas de Python
J'ai essayé de prédire et de soumettre les survivants du Titanic avec Kaggle
J'ai essayé de trouver l'entropie de l'image avec python
J'ai essayé fp-growth avec python
J'ai essayé de gratter avec Python
J'ai essayé de simuler la propagation de l'infection avec Python
J'ai essayé d'utiliser la bibliothèque Python de Ruby avec PyCall
J'ai essayé de créer diverses "données factices" avec Python faker
wxPython: dessin simultané d'animation et de dessin graphique
J'ai essayé de résoudre le problème de F02 comment écrire en temps réel hors ligne avec Python
"Analyse des séries chronologiques de mesure des données économiques et financières" Résolution du problème de fin de chapitre avec Python
J'ai essayé la gestion du suivi avec l'API Twitter et Python (facile)
[Comprendre au plus court] Principes de base de Python pour l'analyse des données
Résolvez le livre en spirale (algorithme et structure de données) avec python!
J'ai essayé d'illustrer le temps et le temps du langage C
J'ai essayé de programmer le test du chi carré en Python et Java.
J'ai essayé d'afficher l'heure et la météo d'aujourd'hui w
J'ai aussi essayé d'imiter la fonction monade et la monade d'état avec le générateur en Python
[Python] J'ai essayé de collecter des données en utilisant l'API de wikipedia
J'ai essayé d'énumérer les différences entre java et python