Dieser Blog ist der dritte Tageseintrag von jupyter notebook Adventskalender 2016.
Es gibt einen Online-Lerndienst namens Udemy und "Practical Python Data Science" betrug 2.300 Yen. Also habe ich es versucht. Im 17,5-stündigen Kurs erklärte Shingo Tsuji, der Autor von "Python Start Book", auf Japanisch. Es ist ein sehr leicht verständlicher Kurs. Ich habe noch nicht alle Abschnitte angehört, möchte Ihnen aber diesen Kurs vorstellen.
In diesem Kurs werden im Wesentlichen fast alle Abschnitte mit dem Jupyter-Notizbuch erläutert. Welche Funktionen bietet das in diesem Kurs vorgestellte Jupyter-Notizbuch? Ich werde Sie beim Austausch vorstellen.
In der ersten Hälfte wird erklärt, wie die Datenanalysebibliothek von Python verwendet wird. Danach werden die Datenanalyse und -visualisierung erläutert, und in der zweiten Hälfte wird die praktischere Datenanalyse anhand der tatsächlichen Daten erläutert.
Anaconda Dies ist ein Paket von Bibliotheken, die von Continuum Analytics für die Datenanalyse bereitgestellt werden. Jupyter Notebook ist ebenfalls in diesem Paket enthalten. Wenn Sie Anaconda installieren, ist eine Python-Paketverwaltungssoftware namens pip enthalten, mit der Sie auch die erforderlichen Bibliotheken installieren können. Ich denke, dass ein Super-Anfänger wie ich zuerst diese Anaconda installieren sollte, um die Datenanalyseumgebung für Python vorzubereiten.
Starten Sie Anaconda nach der Installation einfach wie unten gezeigt im Arbeitsverzeichnis, um den Browser zu starten.
$ ipython notebook
<img src="lec28.png ">
%matplotlib inline
In den Abschnitten 3 und darüber hinaus wird Jupyter verwendet, um die Grundlagen der Datenwissenschaft zu erklären. Es wird in Form der Einführung der Bibliothek fließen.
NumPy
NumPy-Arrays spielen eine zentrale Rolle bei der Datenanalyse
Pandas
Eine Datenbibliothek, die sehr häufig bei der Analyse von Daten mit Python verwendet wird --Series ist eine sehr beliebte Bibliothek --DataFrame ist ein sehr beliebter Datentyp
Auf diese Weise können Sie auch Daten aus der Zwischenablage lesen.
from pandas import Series, DataFrame
import pandas as pd
#Fügen Sie die Daten, die Sie lesen möchten, in die Zwischenablage ein
nfl_frame = pd.read_clipboard()
nfl_frame
Kaggle ist eine Plattform für prädiktive Modellierungs- und Analysemethoden und deren Betriebsgesellschaft, auf der Unternehmen und Forscher Daten veröffentlichen und Statistiker und Datenanalysten auf der ganzen Welt um das optimale Modell konkurrieren. Siehe auch: https://ja.wikipedia.org/wiki/Kaggle
from pandas.io.data import DataReader
from datetime import datetime
tech_list = ['AAPL','GOOG','MSFT','AMZN']
end = datetime.now()
start = datetime(end.year - 1,end.month,end.day)
for stock in tech_list:
globals()[stock] = DataReader(stock,'yahoo',start,end)
AAPL.describe()
Wie oben erwähnt, unterscheidet sich der Inhalt ein wenig von dem Inhalt, der sich auf Jupyter Notebook bezieht, aber ich hoffe, dass er hilfreich sein wird. Ich denke, "Practical Python Data Science" ist mehr als 2.300 Yen wert. Der Inhalt ist für einen Super-Anfänger wie mich sehr leicht zu verstehen, daher empfehle ich Ihnen, ihn zu nehmen.
Recommended Posts