OS X El Capitan 10.11.6 python: 2.7.11 pandas: 0.18.0 matplotlib: 1.5.1 numpy: 1.10.4 IPython: 4.1.2
Empfohlene Zeichnung von Python 10 In Python gibt es verschiedene Zeichenmethoden, und es ist grundlegend, eine Bibliothek namens matplotlib zu verwenden. Es gibt jedoch einen Rapper namens Seaborn, der es einfach macht, modisch zu zeichnen, weil er etwas unmodern ist. Wenn Sie damit nicht zufrieden sind, ist Bokeh vielleicht eine gute Wahl. Wenn Sie ggplot in R verwenden, sind Sie möglicherweise damit vertraut.
In jedem Fall haben Pandas, die für die Datenformatierung erforderlich sind, auch eine Plotfunktion als Wrapper für matplotlib, sodass ich sie verwenden werde. Ich habe die folgenden Websites besucht und studiert, war aber etwas verwirrt, da es einen geringfügigen Unterschied in der Notation gab, wahrscheinlich aufgrund des Unterschieds in der Version. http://sinhrks.hatenablog.com/entry/2015/11/15/222543 http://qiita.com/hik0107/items/de5785f680096df93efa http://qiita.com/y__sama/items/9676f148a66c16d8f47c http://qiita.com/TomokIshii/items/d786d25c69f20a0fc3c8
Der wichtigste Punkt für mich war;
DataFrame.plot()
Ist die einfachste Zeichnung, aber wenn es sich um ein Streudiagramm handelt
DataFrame.plot(kind='scatter')
Oder
DataFrame.plot.scatter()
Ich habe mich gefragt, welches besser (richtig) ist, aber pandas original "Visualization" Ich war überzeugt, dass es die folgende Beschreibung in "Other Plots" von gab.
You can also create these other plots using the methods DataFrame.plot.kind instead of providing the kind keyword argument. This makes it easier to discover plot methods and the specific arguments they use:
Also sind beide richtig
DataFrame.plot.scatter()
Der Punkt war, dass es leichter zu verstehen sein würde.
Unten finden Sie eine kurze Zusammenfassung des Zeichenprozesses und der Punkte, die mir aufgefallen sind. Wie Sie sehen können, lesen Sie matplotlib Honke und pandas Honke.
import numpy as np import pandas as pd import matplotlib.pyplot as plt
%matplotlib inline
Angeben des Dateipfads
file_path="/Users/username/Documents/file_name.csv"
data_frame=pd.read_csv(file_path)
data_frame=pd.read_table(file_path)
Wenn data_frame = pd.read_table (file_path, sep = '.')
# "."
sep = '' # Separator
Andere Einstellungen header = '' # Anzahl der Zeilen, die Sie überspringen möchten
data_frame.head ()
#Überprüfen Sie die ersten Zeilen des Datenrahmens
data_frame.tail ()
#Überprüfen Sie die letzten Zeilen des Datenrahmens
data_frame ['column_name']
# Als Serie extrahiert
data_frame.column_name
# Wie oben
data_frame [['column_name1', 'column_name2']]
# 2 Spaltenextraktion
data_frame.ix ['index_name']
#ix ist ein Feld als Indexreferenz
data_frame [: n]
# Extrahiere alle Zeilen bis n
data_frame [data_frame ['column_name']> x]
#column_name Extrahiert Zeilen mit Spaltenwerten größer als x
data_frame.query ('column_name == x & column_name == y')
# Wenn Sie zwei oder mehr Bedingungen festlegen möchten, ist dies die richtige.
data_frame.query ('column_name == x | column_name == y')
For #or
fig, axes = plt.subplots(2,2,figsize=(19,19)) plt.subplots_adjust(left=None, bottom=None, right=None, top=None, wspace=0.1, hspace=0.1)
Beim Zeichnen mehrerer Blätter im for-Satz. "i" ist die Anzahl der Zähler.
data_frame.plot(x='column1',y='column2',xlim=(x1,x2),linestyle='',marker='.',ax=axes.flatten()[i],color='k',title=title_list[i])
data_frame.plot.scatter(x='column1',y='column2',xlim=(x1,x2),ax=axes.flatten()[i],color='k',s=15,title=title_list[i])
In beiden Fällen ist das in Ordnung, aber (wahrscheinlich) plot.scatter ()
soll eine Eins-zu-Eins-Entsprechung haben, daher gibt es keine Legende. Sie können "x =" weglassen, wenn Sie im Fall von "plot ()" einen Index auf der x-Achse verwenden möchten. Da es sich bei dem Standard um ein Diagramm mit unterbrochenen Linien handelt, wird es in ein Streudiagramm umgewandelt, indem der Linienstil entfernt und eine Markierung angegeben wird.
Selbst wenn eine Spalte NaN enthält, wird diese ignoriert und geplottet. Wenn Sie jedoch gleichzeitig aus zwei Spalten plotten, tritt ein Fehler auf. Der Zeichenbereich muss jedes Mal geändert werden.
xlim = (x1, x2) # x Bereich ylim = (y1, y2) #y Bereich color = 'k' # Farbspezifikation k schwarz, r rot, b blau, g grün, c cyan, m magenta, w weiß, y gelb linestyle = '-' # ls. -: fest, -: gestrichelt, '': nichts Linienbreite = 1 # lw. marker='.' #.:point, o:circle, v:triangle,s:square,+:plus, '':nothing Markierungsgröße = 12 # ms. markeredgecolor = '' # mec. markeredgewidth = 1 # mew. markerfacecolor = '' # mfc. label = 'name' # legend ax = axes.flatten () [i] #Ziehe an i-ter Stelle yerr = '' # y-Achsen-Fehlerleiste
s = 20 # Markergröße
axes.flatten( )[i].legend(loc='best') # 'upper right','center left','lower center','center'
http://yagays.github.io/blog/2014/08/15/ipython-notebook-matplotlib-inline/
http://qiita.com/HirofumiYashima/items/51d8dac9a784de356c5b
import numpy as np import matplotlib.pyplot as plt
Sollte numpy bzw. pyplot lesen. Pylab kann aufgrund eines groben Imports einen Namen tragen.
Pandas im Allgemeinen. Eines der Entwicklermitglieder ist gut organisiert. http://sinhrks.hatenablog.com/entry/2015/04/28/235430
matplotlib wiki http://seesaawiki.jp/met-python/d/matplotlib
Um zwischen Standard-Python, Numpy, Pandas hin und her zu gehen http://qiita.com/richi40/items/6b3af6f4b00d62dbe8e1
Python (2.7) Skriptsprache. Es kann klarer geschrieben werden als Perl (es kann nur geschrieben werden). Beliebter als Ruby in Übersee. Es wird häufig für wissenschaftliche Berechnungen verwendet, und es gibt viele verwandte Bibliotheken.
Bibliothek Eine Sammlung vielseitiger Programme in wiederverwendbarer Form. Eine Sammlung von Code, die anderen Programmen einige Funktionen bietet. Die folgenden Module und Pakete, die standardmäßig enthalten sind, werden als Standardbibliotheken bezeichnet.
Modul Eine Sammlung von Teilen wie Funktionen für jeden Verwendungszweck. Mathe, System usw.
--Paket Ein Verzeichnis mit Moduldateien. NumPy, Pandas usw.
pandas is a Python package providing fast, flexible, and expressive data structures designed to make working with “relational” or “labeled” data both easy and intuitive. It aims to be the fundamental high-level building block for doing practical, real world data analysis in Python. Additionally, it has the broader goal of becoming the most powerful and flexible open source data analysis / manipulation tool available in any language. It is already well on its way toward this goal.
Numpy Basispaket für wissenschaftliche Berechnungen in Python
matplotlib Die am häufigsten verwendeten Pakete für die Datenvisualisierung
Jupyter Eine Webanwendung, mit der Sie Codes, Formeln, dort gezeichnete Diagramme und deren Erklärungen erstellen und freigeben können. Sie können Daten organisieren und formatieren, numerische Berechnungen, statistische Analysen, maschinelles Lernen und mehr durchführen. Sie können während der Erkundung problemlos Analysearbeiten durchführen und die Ergebnisse freigeben und speichern.
The Jupyter Notebook is a web application that allows you to create and share documents that contain live code, equations, visualizations and explanatory text. Uses include: data cleaning and transformation, numerical simulation, statistical modeling, machine learning and much more.
Aus den verschiedenen Plots (Andere Plots) in pandas Honke Visualization
In addition to these kind s, there are the DataFrame.hist(), and DataFrame.boxplot() methods, which use a separate interface.
Neben der Verwendung von kind existieren DataFrame.hist () und DataFrame.boxplot () als separate Schnittstellen.
Daher, wie man ein Histogramm schreibt
DataFrame.plot(kind='hist')
DataFrame.plot.hist()
DataFrame.hist()
Es gibt drei Arten.