[PYTHON] Lernrekord Nr. 20 (24. Tag)

Lernaufzeichnung (24. Tag)

Beginn des Studiums: Samstag, 7. Dezember

Unterrichtsmaterialien usw.: ・ Miyuki Oshige "Details! Python3 Introductory Note ”(Sotech, 2017): 19.12. (Donnerstag) Abgeschlossen ・ Progate Python-Kurs (insgesamt 5 Kurse): Endet am Samstag, den 21. Dezember ・ Andreas C. Müller, Sarah Guido "(japanischer Titel) Maschinelles Lernen ab Python" (O'Reilly Japan, 2017): Abschluss am Samstag, 23. Dezember ・ Kaggle: Real or Not? NLP mit Katastrophen-Tweets: Veröffentlicht am Samstag, 28. Dezember, bis Freitag, 3. Januar Einstellung ・ ** Wes Mckinney "(japanischer Titel) Einführung in die Datenanalyse von Python" (O'Reilly Japan, 2018) **: 4. Januar (Sa) ~

"Einführung in die Datenanalyse mit Python"

S.346 Kapitel 10 Datenaggregation und Gruppenberechnung sind abgeschlossen.

Kapitel 9 Darstellung und Visualisierung

・ Erläuterung von Datenvisualisierungsbibliotheken wie Matplotlib und Seaborn Einstellungselemente wie Linientypen finden Sie in ** DocString (Funktionsname + '?') **. (Wenn Sie matplotlib mit als plt importieren, verwenden Sie es wie ** plt.plot? **.)

Handlungsvorbereitung


import matplotlib.pyplot as plt
fig = plt.figure() #Ein Objekt, das eine Plotfunktion enthält.
ax1 = fig.add_subplot(1, 1, 1) #Fügen Sie dem Plot eine oder mehrere Unterzeichnungen hinzu.

#Das Format der Abbildung und die Eingabedaten werden nachfolgend beschrieben.

・ Übersicht über Ihre Möglichkeiten Randanpassung, Achsenfreigabe, Titel-, Legenden- und Anzeigepositionsanpassung (optimale Position mit loc = 'best'), Beschriftungsrotation (Rotation), Annotieren (Annotieren), Hinzufügen von Figuren (add_patch), Standardwerteinstellung von matplotlib (rc-Methode)

Achsenklasse (AxesSubplot)Batch-Einstellung von Attributen mit der Set-Methode von


props = {'title': 'namae no ikkatsu settei', 'xlabel': 'aiueo'}
ax.set(**props)

-DataFrame hat auch eine Plotmethode. Kann unverändert für Datenrahmen verwendet werden.

Visualisierung der Werthäufigkeit


s.value_counts().plot.bar() #Horizontaler Balken bei barh

Das Seaborn-Paket erleichtert die Visualisierung von Daten, die vor dem Plotten aggregiert oder zusammengefasst werden müssen. Geben Sie die Daten in den Argumentdaten an und geben Sie die Zeilen- und Spaltennamen des Datenrahmens in x und y an.

・ Histogramm: Eine Art Balkendiagramm, das die Häufigkeit von Werten als diskrete Daten anzeigt

-Dichtediagramm: Erstellt aus einer kontinuierlichen Wahrscheinlichkeitsverteilung, von der angenommen wird, dass sie die beobachteten Daten erzeugt hat. Normalerweise wird diese Verteilung als einfache Summe angenähert, beispielsweise als Normalverteilung, die als Kernel bezeichnet wird. Daher wird das Dichtediagramm auch als "Kernel Density Estimation (KDE) -Diagramm" bezeichnet. (Plot.kde)

・ Eine Methode, die anscheinend sehr häufig angewendet wird seaborn.distplot (kann gleichzeitig Histogramm- und Dichteschätzungsdiagramme erstellen) seaborn.regplot (Erstellen Sie ein Streudiagramm und wenden Sie eine Regressionslinie durch lineare Regression an.) seaborn.pairplot (Eine Streudiagrammmatrix, die jedes Element vergleicht, kann sofort visualisiert werden.)

Kapitel 10 Datenaggregation und Gruppenberechnung

・ Pandas gruppieren nach Methode Eine beliebige Verarbeitung kann ausgeführt werden, indem Elemente von Datensätzen kombiniert werden (verstanden)

-Der Gruppenberechnungsprozess ist ein Fluss von Split-Apply-Combine.

-Es kann auch mithilfe von Zuordnungsinformationen mithilfe eines Wörterbuchs klassifiziert werden.

・ Funktionen der Groupby-Methode (Anzahl, Summe, Mittelwert, Median ...) Lassen Sie uns grundlegende arithmetische Berechnungen behandeln.

-Der Name, der beim Aggregieren von Daten mit groupby angegeben wird, kann durch Übergeben eines Taples geändert werden. Sie können auch keinen Index mit as_index = False angeben.

-Apply trennt die Objekte, ** wendet die an jedes Stück übergebene Funktion an und ** verbindet sich dann. Die zum Anwenden übergebene Funktion erfordert Vorstellungskraft, da der Programmierer sie selbst implementieren muss.

-Pivot-Tabelle und Kreuztabelle. Es kann sowohl in Datenrahmenfunktionen als auch in Gruppen nach implementiert werden. Die Möglichkeit, diese zu verarbeiten, ist nützlich für die Datenbereinigung, Modellierung und statistische Analyse.

Recommended Posts

Lernrekord Nr. 21 (25. Tag)
Lernrekord Nr. 10 (14. Tag)
Lernrekord Nr. 24 (28. Tag)
Lernrekord Nr. 23 (27. Tag)
Lernrekord Nr. 25 (29. Tag)
Lernrekord Nr. 26 (30. Tag)
Lernrekord Nr. 20 (24. Tag)
Lernrekord Nr. 14 (18. Tag) Kaggle4
Lernrekord Nr. 15 (19. Tag) Kaggle5
Lernrekord 4 (8. Tag)
Lernrekord 9 (13. Tag)
Lernrekord 5 (9. Tag)
Lernrekord 6 (10. Tag)
Lernrekord 8 (12. Tag)
Lernrekord 16 (20. Tag)
Lernrekord 22 (26. Tag)
Lernrekord 13 (17. Tag) Kaggle3
Lernrekord 12 (16. Tag) Kaggle2
Lernrekord Nr. 18 (22. Tag)
Lernrekord Nr. 19 (23. Tag)
Lernrekord Nr. 29 (33. Tag)
Lernrekord Nr. 28 (32. Tag)
Lernrekord Nr. 27 (31. Tag)
Lernrekord 11 (15. Tag) Kaggle-Teilnahme
Programmieren des Lernprotokolls 2. Tag
Lernaufzeichnung
Lernrekord Nr. 3
Lernrekord Nr. 2
Python-Lerntag 4
Lernaufzeichnung (2. Tag) Scraping von #BeautifulSoup
Lernaufzeichnung (4. Tag) #Wie man den absoluten Pfad vom relativen Pfad erhält
Bisherige Lernbilanz
Linux-Lernprotokoll ① Planen
<Kurs> Tiefes Lernen: Day2 CNN
Lernaufzeichnung (3. Tag) # CSS-Selektorbeschreibungsmethode #Scraping with BeautifulSoup
<Kurs> Tiefes Lernen: Tag 1 NN
Lerndatensatz (6. Tag) #Set-Typ #Dictionary-Typ #Mutuelle Konvertierung des Listen-Taple-Sets #ndarray-Typ #Pandas (DataFrame-Typ)
Themen> Deep Learning: Tag 3 RNN
Studiere gründlich Deep Learning [DW Tag 0]