Ich habe die gleiche Datenanalyse mit kaggle notebook (python) und PowerBI gleichzeitig versucht ②

Hintergrund

Letzter Beitrag [Ich habe die gleiche Datenanalyse mit kaggle notebook (python) und PowerBI gleichzeitig versucht ①] Gleich wie (https://qiita.com/khigashimoto/items/80f0858b59379d461d97).

Das letzte Mal habe ich die folgende Umgebung ausprobiert ①, aber dieses Mal werde ich die Umgebung ② ausprobieren. --Umgebung ① Datenanalyse mit Python + Numpy + Pandas + α --Umwelt (2) Datenanalyse mit BI-Tools (Business Intelligence-Tools)

Systemkonfiguration

Gemeinsame Umgebung

Verwendeter PC: Surface LTE Core i5-7300U, Speicher 8 GB Verwendetes PC-Betriebssystem: Microsoft Windows10 Pro 64bit Verwendeter Browser: Microsoft Edge

Umgebung ② "Datenanalyse mit BI-Tool" Betriebsumgebung

-Verwendungsumgebung: Microsoft Power BI Desktop Version 2.84.802.0 64-Bit Sie können PowerBI Desktop aus dem Microsoft Store herunterladen. Die meisten Funktionen einschließlich dieser Arbeit können kostenlos genutzt werden. image.png

Was ich getan habe (Zusammenfassung)

Wie beim letzten Mal werde ich unten einen Teil von Udemys Data Science-Kurs ausleihen. [180.000 Menschen auf der Welt] Praktische Python-Datenwissenschaft

Die folgende Analyse, die sich auf den berühmten "Titanic-Untergang" als ersten Schritt der Datenanalyse bezieht, wird dieses Mal mit dem BI-Tool durchgeführt.

・ Was für Leute waren die Passagiere der Titanic? (Geschlecht, Alter usw.) ・ Kausaler Zusammenhang zwischen den oben genannten Merkmalen und ihrem komplexen Zusammenhang und ihrer Überlebensrate

Was ich getan habe (Details) * BI Tools (PowerBI)

    1. Daten lokal abrufen (eigener PC) Erfassen Sie Kundendaten zum Zeitpunkt des Untergangs der Titanic als CSV-Daten von kaggle. Ich werde es weglassen, da es mit dem vorherigen Artikel identisch ist, aber wenn Sie die tatsächlichen Kundendaten in Excel öffnen, sieht es so aus. image.png
  1. Bringen Sie lokale Daten in die Umgebung und zeigen Sie eine Zusammenfassung an Starten Sie PowerBI Desktop und importieren Sie die gespeicherte CSV-Datei.

・ Der Vorschaubildschirm sieht folgendermaßen aus. Drücken Sie die Taste "Laden" image.png

-Wenn Sie zum Hauptbildschirm zurückkehren, wird nichts angezeigt. Drücken Sie daher auf das "Datenbildschirmsymbol". image.png

・ Sie können die gelesenen Daten sehen image.png

Da PowerBI Desktop (natürlich ...) eine GUI-basierte Anwendung ist, können Sie im Gegensatz zu CUI-basierten Umgebungen wie Python den Datenstatus sofort aus der Vogelperspektive auf dem Bildschirm selbst anzeigen.

    1. Überprüfen Sie das Verhältnis von Männern und Frauen ・ Drücken Sie auf das Symbol "Berichtsbildschirm", um zum Berichtsbildschirm zu gelangen image.png

・ "Versuchen Sie, ein festgelegtes Balkendiagramm zu verwenden. Wenn Sie auf das Symbol drücken, wird das Diagramm oben links angezeigt. image.png

Es ist schön, mit dieser Art von Benutzerfreundlichkeit wie Excel grafisch arbeiten zu können. Abgesehen davon fühlte ich mich bei dieser Arbeit ein wenig leicht, und als ich sie mit dem Task-Manager überprüfte, war es wie folgt. Da es sich um eine Desktop-Anwendung handelt, war es für mich bequemer, etwa 16 GB Speicher für einen Win10-PC zu haben. image.png

Vier. Überprüfen Sie das Verhältnis von Männern und Frauen für jede Raumklasse Die Klasse P gibt die Note des Raumes an. Ich könnte das auch mit PowerBI machen.

・ Wählen Sie auf ähnliche Weise das eingestellte Balkendiagramm aus. Ziehen Sie den Gegenstand "Geschlecht" auf "Achse" und "Wert" und den Gegenstand "Klasse" auf "Legende". image.png

Es ist auch möglich, die Achse leicht umzukehren. ・ Wählen Sie auf ähnliche Weise das eingestellte Balkendiagramm aus. Ziehen Sie den Gegenstand "Geschlecht" auf "Legende" und "Wert" und den Gegenstand "Klasse" auf "Achse". image.png

Fünf. Erstellen Sie Elemente (Person) wie "männlich", "weiblich" und "Kind (unter 16 Jahren)" mit den Elementen Alter (Alter) und Geschlecht (Geschlecht). Erstellen Sie zunächst eine Personenspalte. Ich habe es mit Begeisterung versucht, aber im Moment konnte ich keine Spalten gut generieren ... Wir glauben, dass es zwei Arten der Spalteneinfügung gibt. ・ Abfrageeditor Dies ist eine spezielle Funktion zum Verarbeiten der Originaldaten gemäß dem Zweck der Analyse, ohne die Originaldaten zu ändern. Ich habe gerade erwähnt, dass ich eine benutzerdefinierte Spalte aus dieser Funktion hinzufügen möchte, wie unten gezeigt, aber das Ergebnis wird ein Fehler sein. image.png image.png

・ Reine Säulenzugabe In diesem Fall habe ich das nächste Mal versucht, eine Spalte direkt auf dem Datenbildschirm hinzuzufügen, aber dies führt leider auch zu einem Fehler. image.png

Hmm. .. .. Im Moment ist dies das Ende der Überprüfung. ..

Darüber hinaus sind die Ergebnisse einer Reihe von Analyseversuchen mit PowerBI unten aufgeführt. Ich halte es für einen guten Punkt von PowerBI, die Ergebnisse auf diese Weise auflisten zu können und eine Vogelperspektive nebeneinander zu erhalten.

image.png

Zusammenfassung (Eindruck)

Hier sind meine Eindrücke von PowerBI Desktop, die ich während der obigen Arbeit empfunden habe.


Vorteile
・ Die Anzeigemethode ist reichhaltig (schön)


Nachteile
-Für die Verarbeitung wie die Verarbeitung fehlender Werte und die Datengenerierung kann es verwirrend sein, wenn Sie versuchen, komplizierte Arbeiten auszuführen.

Fall A) Python, das mit vielen Referenzen und detaillierten Abläufen für komplizierte Analysen wie Vorverarbeitung und Generierung zusätzlicher Daten verwendet werden kann. Fall B) PowerBI ist ein Anzeigemechanismus für tatsächliche Mitarbeiter, der die Lichtanalyse und die Ergebnisse nach der Analyse in Python verwendet. Ich denke, es ist besser, getrennt zu leben und es zu benutzen. Ich denke an dieser Stelle.

Recommended Posts

Ich habe die gleiche Datenanalyse mit kaggle notebook (python) und PowerBI gleichzeitig versucht ②
Ich habe die gleiche Datenanalyse mit kaggle notebook (python) und PowerBI gleichzeitig versucht ①
Zeichnen Sie mit Pythons Matplotlib mehrere Karten und Daten gleichzeitig
Visualisieren Sie Daten und erfassen Sie gleichzeitig die Korrelation
Ich habe versucht, zum Zeitpunkt der Bereitstellung mit Fabric und ChatWork Api automatisch in ChatWork zu posten
Ich habe versucht, Faktoren mit Titanic-Daten zu analysieren!
Ich habe versucht, fMRI-Daten mit Python zu analysieren (Einführung in die Dekodierung von Gehirninformationen)
Ich habe versucht, die statistischen Daten der neuen Corona mit Python abzurufen und zu analysieren: Daten der Johns Hopkins University
Ich habe versucht, das Bild mit Python + OpenCV zu "glätten"
Ich habe versucht, das Bild mit Python + OpenCV zu "differenzieren"
Ich habe versucht, die Daten mit Zwietracht zu speichern
Ich habe versucht, die Hauptkomponenten mit Titanic-Daten zu analysieren!
Ich habe Jacobian und teilweise Differenzierung mit Python versucht
Ich habe versucht, CloudWatch-Daten mit Python abzurufen
Ich habe zum ersten Mal versucht, Python zu programmieren.
Ich habe Funktionssynthese und Curry mit Python versucht
Ich habe versucht, das Bild mit Python + OpenCV zu "binarisieren"
Ich möchte gleichzeitig einen Musik-Player erstellen und Musik ablegen
Drehen Sie in Python mehrere Listen mit for-Anweisung gleichzeitig
[Python] Ich habe die gleiche Berechnung versucht wie die Vorhersage von LSTM von Grund auf [Keras]
Datenanalyse mit Python 2
Datenanalyse mit Python
Ich habe versucht, eine CSV-Datei mit Python zu berühren
Ich habe versucht, das Spiel in der J League vorherzusagen (Datenanalyse)
[OpenCV / Python] Ich habe versucht, Bilder mit OpenCV zu analysieren
Ich habe versucht, Soma Cube mit Python zu lösen
Ich habe Python zum ersten Mal mit Heroku ausprobiert
Diesmal habe ich Python I und II bei Progate gelernt.
Aufbau einer Datenanalyseumgebung mit Python (IPython Notebook + Pandas)
Ich habe versucht, das Problem mit Python Vol.1 zu lösen
Ich habe versucht, die API mit dem Python-Client von echonest zu erreichen
Ich habe versucht, das Artikel-Update des Livedoor-Blogs mit Python und Selen zu automatisieren.
[New Corona] Ist der nächste Höhepunkt im Dezember? Ich habe die Trendanalyse mit Python versucht!
[Herausforderer suchen] Das schnellste Laden und Erweitern von Daten (Kaggle-Notizbuch), denke ich
Ich habe mit Python verschiedene Dinge ausprobiert: Schaben (Beautiful Soup + Selenium + PhantomJS) und morphologische Analyse
Ich wollte nur die Daten des gewünschten Datums und der gewünschten Uhrzeit mit Django extrahieren
Ich habe versucht, die Verarbeitungsgeschwindigkeit mit dplyr von R und pandas von Python zu vergleichen
Ich habe versucht, Überlebende der Titanic mit Kaggle vorherzusagen und einzureichen
Ich habe versucht, die Entropie des Bildes mit Python zu finden
Ich habe fp-Wachstum mit Python versucht
Ich habe versucht, mit Python zu kratzen
Ich habe versucht zu simulieren, wie sich die Infektion mit Python ausbreitet
Ich habe versucht, die Python-Bibliothek von Ruby mit PyCall zu verwenden
Ich habe versucht, mit Python faker verschiedene "Dummy-Daten" zu erstellen
wxPython: Gleichzeitiges Zeichnen von Animationen und Grafiken
Ich habe versucht, das Problem von F02 zu lösen, wie man mit Python offline in Echtzeit schreibt
"Zeitreihenanalyse von Wirtschafts- und Finanzdaten messen" Das Problem am Ende des Kapitels mit Python lösen
Ich habe versucht, Follow Management mit Twitter API und Python (einfach)
[In kürzester Zeit verstehen] Python-Grundlagen für die Datenanalyse
Löse das Spiralbuch (Algorithmus und Datenstruktur) mit Python!
Ich habe versucht, die Zeit und die Zeit der C-Sprache zu veranschaulichen
Ich habe versucht, den Chi-Quadrat-Test in Python und Java zu programmieren.
Ich habe versucht, die Uhrzeit und das heutige Wetter anzuzeigen
Ich habe auch versucht, die Funktionsmonade und die Zustandsmonade mit dem Generator in Python nachzuahmen
[Python] Ich habe versucht, Daten mit der API von Wikipedia zu sammeln
Ich habe versucht, die Unterschiede zwischen Java und Python aufzuzählen