[PYTHON] Zeichnen auf Jupyter mit der Plot-Funktion von Pandas

Umgebung

OS X El Capitan 10.11.6 python: 2.7.11 pandas: 0.18.0 matplotlib: 1.5.1 numpy: 1.10.4 IPython: 4.1.2

zunaechst

Empfohlene Zeichnung von Python 10 In Python gibt es verschiedene Zeichenmethoden, und es ist grundlegend, eine Bibliothek namens matplotlib zu verwenden. Es gibt jedoch einen Rapper namens Seaborn, der es einfach macht, modisch zu zeichnen, weil er etwas unmodern ist. Wenn Sie damit nicht zufrieden sind, ist Bokeh vielleicht eine gute Wahl. Wenn Sie ggplot in R verwenden, sind Sie möglicherweise damit vertraut.

In jedem Fall haben Pandas, die für die Datenformatierung erforderlich sind, auch eine Plotfunktion als Wrapper für matplotlib, sodass ich sie verwenden werde. Ich habe die folgenden Websites besucht und studiert, war aber etwas verwirrt, da es einen geringfügigen Unterschied in der Notation gab, wahrscheinlich aufgrund des Unterschieds in der Version. http://sinhrks.hatenablog.com/entry/2015/11/15/222543 http://qiita.com/hik0107/items/de5785f680096df93efa http://qiita.com/y__sama/items/9676f148a66c16d8f47c http://qiita.com/TomokIshii/items/d786d25c69f20a0fc3c8

Der wichtigste Punkt für mich war;

DataFrame.plot() Ist die einfachste Zeichnung, aber wenn es sich um ein Streudiagramm handelt DataFrame.plot(kind='scatter') Oder DataFrame.plot.scatter() Ich habe mich gefragt, welches besser (richtig) ist, aber pandas original "Visualization" Ich war überzeugt, dass es die folgende Beschreibung in "Other Plots" von gab.

You can also create these other plots using the methods DataFrame.plot.kind instead of providing the kind keyword argument. This makes it easier to discover plot methods and the specific arguments they use:

Also sind beide richtig DataFrame.plot.scatter() Der Punkt war, dass es leichter zu verstehen sein würde.

Unten finden Sie eine kurze Zusammenfassung des Zeichenprozesses und der Punkte, die mir aufgefallen sind. Wie Sie sehen können, lesen Sie matplotlib Honke und pandas Honke.

Ablauf der Zeichnung

Bibliothek laden

import numpy as np import pandas as pd import matplotlib.pyplot as plt

Befehl zum Zeichnen eines Diagramms im Jupyter-Notizbuch

%matplotlib inline

Datenerfassung

Angeben des Dateipfads file_path="/Users/username/Documents/file_name.csv"

Commer getrennte Datei

data_frame=pd.read_csv(file_path)

Tabulatorgetrennte Datei

data_frame=pd.read_table(file_path)

Andere als die oben genannten Dateien

Wenn data_frame = pd.read_table (file_path, sep = '.') # "." sep = '' # Separator

Andere Einstellungen header = '' # Anzahl der Zeilen, die Sie überspringen möchten

Bestätigung der gelesenen Daten

data_frame.head () #Überprüfen Sie die ersten Zeilen des Datenrahmens data_frame.tail () #Überprüfen Sie die letzten Zeilen des Datenrahmens

Datenextraktion

Säulenextraktion

data_frame ['column_name'] # Als Serie extrahiert data_frame.column_name # Wie oben data_frame [['column_name1', 'column_name2']] # 2 Spaltenextraktion

Zeilenextraktion

data_frame.ix ['index_name'] #ix ist ein Feld als Indexreferenz data_frame [: n] # Extrahiere alle Zeilen bis n data_frame [data_frame ['column_name']> x] #column_name Extrahiert Zeilen mit Spaltenwerten größer als x data_frame.query ('column_name == x & column_name == y') # Wenn Sie zwei oder mehr Bedingungen festlegen möchten, ist dies die richtige. data_frame.query ('column_name == x | column_name == y') For #or

Handlung

Teilen Sie den Bildschirm (2X2 usw.) und geben Sie die Ränder an

fig, axes = plt.subplots(2,2,figsize=(19,19)) plt.subplots_adjust(left=None, bottom=None, right=None, top=None, wspace=0.1, hspace=0.1)

Streudiagramm

Beim Zeichnen mehrerer Blätter im for-Satz. "i" ist die Anzahl der Zähler. data_frame.plot(x='column1',y='column2',xlim=(x1,x2),linestyle='',marker='.',ax=axes.flatten()[i],color='k',title=title_list[i])

data_frame.plot.scatter(x='column1',y='column2',xlim=(x1,x2),ax=axes.flatten()[i],color='k',s=15,title=title_list[i])

In beiden Fällen ist das in Ordnung, aber (wahrscheinlich) plot.scatter () soll eine Eins-zu-Eins-Entsprechung haben, daher gibt es keine Legende. Sie können "x =" weglassen, wenn Sie im Fall von "plot ()" einen Index auf der x-Achse verwenden möchten. Da es sich bei dem Standard um ein Diagramm mit unterbrochenen Linien handelt, wird es in ein Streudiagramm umgewandelt, indem der Linienstil entfernt und eine Markierung angegeben wird. Selbst wenn eine Spalte NaN enthält, wird diese ignoriert und geplottet. Wenn Sie jedoch gleichzeitig aus zwei Spalten plotten, tritt ein Fehler auf. Der Zeichenbereich muss jedes Mal geändert werden.

Inhalt von .plot ()

xlim = (x1, x2) # x Bereich ylim = (y1, y2) #y Bereich color = 'k' # Farbspezifikation k schwarz, r rot, b blau, g grün, c cyan, m magenta, w weiß, y gelb linestyle = '-' # ls. -: fest, -: gestrichelt, '': nichts Linienbreite = 1 # lw. marker='.' #.:point, o:circle, v:triangle,s:square,+:plus, '':nothing Markierungsgröße = 12 # ms. markeredgecolor = '' # mec. markeredgewidth = 1 # mew. markerfacecolor = '' # mfc. label = 'name' # legend ax = axes.flatten () [i] #Ziehe an i-ter Stelle yerr = '' # y-Achsen-Fehlerleiste

Inhalt von .plot.scatter ()

s = 20 # Markergröße

Befehl zum Setzen einer Legende

axes.flatten( )[i].legend(loc='best') # 'upper right','center left','lower center','center'

Weitere Hinweise

http://yagays.github.io/blog/2014/08/15/ipython-notebook-matplotlib-inline/ http://qiita.com/HirofumiYashima/items/51d8dac9a784de356c5b import numpy as np import matplotlib.pyplot as plt Sollte numpy bzw. pyplot lesen. Pylab kann aufgrund eines groben Imports einen Namen tragen.

Websites, die oft gepflegt werden

Pandas im Allgemeinen. Eines der Entwicklermitglieder ist gut organisiert. http://sinhrks.hatenablog.com/entry/2015/04/28/235430

matplotlib wiki http://seesaawiki.jp/met-python/d/matplotlib

Um zwischen Standard-Python, Numpy, Pandas hin und her zu gehen http://qiita.com/richi40/items/6b3af6f4b00d62dbe8e1

der Begriff

--Paket Ein Verzeichnis mit Moduldateien. NumPy, Pandas usw.

pandas is a Python package providing fast, flexible, and expressive data structures designed to make working with “relational” or “labeled” data both easy and intuitive. It aims to be the fundamental high-level building block for doing practical, real world data analysis in Python. Additionally, it has the broader goal of becoming the most powerful and flexible open source data analysis / manipulation tool available in any language. It is already well on its way toward this goal.

The Jupyter Notebook is a web application that allows you to create and share documents that contain live code, equations, visualizations and explanatory text. Uses include: data cleaning and transformation, numerical simulation, statistical modeling, machine learning and much more.

Serpentin

Aus den verschiedenen Plots (Andere Plots) in pandas Honke Visualization

In addition to these kind s, there are the DataFrame.hist(), and DataFrame.boxplot() methods, which use a separate interface.

Neben der Verwendung von kind existieren DataFrame.hist () und DataFrame.boxplot () als separate Schnittstellen. Daher, wie man ein Histogramm schreibt DataFrame.plot(kind='hist') DataFrame.plot.hist() DataFrame.hist() Es gibt drei Arten.

Recommended Posts

Zeichnen auf Jupyter mit der Plot-Funktion von Pandas
Zeigen Sie das Diagramm von tensorBoard auf jupyter an
Versuchen Sie, die Umweltkonzentration organischer Fluorverbindungen mit offenen Daten auf einer Karte darzustellen
Die Geschichte vom Starten des Jupyter-Notizbuchs von python2.x mit Docker (am Samstag und Sonntag zerquetscht)
Ändern Sie das Thema von Jupyter
Die Kraft der Pandas: Python
Formatieren Sie die Zeitachse des Pandas-Zeitreihendiagramms mit matplotlib neu
Machen Sie die Funktion zum Zeichnen japanischer Schriftarten in OpenCV allgemein
Einfach auf dem Mac! Darstellung der Einheitsschrittantwort mit Python
Verstehen Sie die Funktion der Faltung am Beispiel der Bildverarbeitung
Ich habe versucht, den Index der Liste mithilfe der Aufzählungsfunktion abzurufen
[Python] Ich habe die Route des Taifuns mit Folium auf die Karte geschrieben
Vorsichtsmaßnahmen bei der Überlagerung der Wahrscheinlichkeitsdichtefunktion und des Histogramms in matplotlib
Vorsichtsmaßnahmen bei Verwendung der Funktion urllib.parse.quote
Ich habe die Grundoperation von Pandas im Jupyter Lab geschrieben (Teil 1)
Verwendung von Jupyter am Frontend von Spacon ITO
Finden Sie den optimalen Wert der Funktion mit einem genetischen Algorithmus (Teil 1)
Fall mit Pandas-Plot, Fall mit (reinem) Matplotlib-Plot
Hinweise zur Verwendung von matplotlib auf dem Server
Ich habe die grundlegende Operation von Pandas im Jupyter Lab geschrieben (Teil 2).
100 Sprachverarbeitung Knock-93 (unter Verwendung von Pandas): Berechnung der Genauigkeitsrate der Analogie-Aufgabe
Stellen Sie die Änderung der Anzahl der Keyword-Auftritte pro Monat mithilfe von Pandas grafisch dar
Zeichnen Sie den Nikkei Average Stock Index mit Pandas
Untersuchen Sie die Auswirkung von Ausreißern auf die Korrelation
Hinweis zur Verwendung der Python-Eingabefunktion
[Python3] Schreiben Sie das Codeobjekt der Funktion neu
Veröffentlichen Sie das Thema Google Mail auf Twitter
Erstellen Sie eine Ausführungsumgebung für Jupyter Lab
Klonen Sie das Github-Repository auf dem Jupyter-Notizbuch
PC-GPU-Prüfung am Jupyter-Notebook
Über die Argumente der Setup-Funktion von PyCaret
Histogramm / Streudiagramm auf Jupyter Notebook anzeigen
Pandas des Anfängers, vom Anfänger, für den Anfänger [Python]
Studie über die Miete in Tokio mit Python (3-1 von 3)
Ändern Sie die Reihenfolge von PostgreSQL in Heroku
[Linux] Unterschied in den Zeitinformationen in Abhängigkeit von der Uhr-ID der Funktion clock_gettime ()
[Circuit x Python] So ermitteln Sie die Übertragungsfunktion eines Schaltkreises mit Lcapy
Legen Sie die Obergrenze für die Anzahl der Wiederholungen rekursiver Funktionen in Python fest
Beschriften Sie jeden Punkt im Streudiagramm des Meeresgeborenen
Verkürzung der Analysezeit von Openpose mithilfe von Sound
Abschätzung der Wirkung von Maßnahmen anhand von Neigungswerten
Ausführungsumgebung im Web von "Project Jupyter"
Überprüfen Sie den Typ der von Ihnen verwendeten Variablen
Zeichentipps mit matplotlib auf der Serverseite
Besiege die Wahrscheinlichkeitsdichtefunktion der Normalverteilung
Holen Sie sich den Aufrufer einer Funktion in Python
Exklusive Veröffentlichung der Django App mit ngrok
Python: Versuchen Sie, die Benutzeroberfläche von Pythonista 3 auf dem iPad zu verwenden
[2020Juli] Überprüfen Sie die UDID des iPad unter Linux
Verwenden Sie die neueste Version von PyCharm unter Ubuntu
Ich habe die Liste der Tastenkombinationen von Jupyter überprüft
[Pandas] Grundlagen der Verarbeitung von Datumsdaten mit dt
100 Sprachverarbeitung Knock-32 (mit Pandas): Prototyp des Verbs
[Pythonocc] Ich habe versucht, CAD auf einem Jupyter-Notebook zu verwenden
Füllen Sie die Breite des Jupyter-Notizbuchs, um den Browser zu füllen
Syntaxhervorhebung in der Befehlszeile mithilfe von Pylements
Korrigieren Sie die Argumente der in map verwendeten Funktion
Berechnen Sie die Wahrscheinlichkeit von Ausreißern auf den Box-Whiskern
Lassen Sie den Summer mit Python auf Raspberry Pi 3 erklingen!
Versuchen Sie es mit dem Sammlungsmodul (ChainMap) von python3