Ich beschloss, maschinelles Lernen mit Python zu lernen. Zunächst schrieb ich es als persönliches Memorandum, als ich das Buch "Maschinelles Lernen beginnend mit Python" las.
Ich gehöre keinem IT-Unternehmen an, werde aber mein Bestes geben, um von nun an zu lernen und zu arbeiten. Ich hinterlasse ein Protokoll in der Hoffnung, dass es Anfängern so viel wie möglich hilft.
Es wird als Scikit-Learn gelesen. Unter dem folgenden Link finden Sie eine Bedienungsanleitung. Vielleicht nur einige Leute, aber der Blick auf die verknüpfte Figur erinnert mich an Gnuplot.
Ich habe mich gefragt, ob ich Jupyter Notebook installieren soll, aber da es das erste Mal war, habe ich beschlossen, dem Buch zu folgen. Es könnte bequem sein, es zu verwenden. Installieren Sie Anaconda, um Jupyter Notebook zu installieren. ・ Download-Seite der offiziellen Anaconda-Website
Wenn Sie Anaconda installieren, können Sie alle in diesem Buch verwendeten Pakete verwenden. Wenn Sie Python bereits verwenden, gehen Sie zu Terminal
pip install numpy scipy matplotlib ipython scikit-learn pandas pillow
Sie können die in diesem Buch verwendete Bibliothek durch Eingabe installieren.
Die Verwendung von Jupyter Notebook wird unter dem folgenden Link beschrieben. [Jupyter Notebook] Erfahren Sie, wie Sie es effektiv einsetzen können [Python / Maschinelles Lernen]
NumPy (Nampai oder Nampai) und SciPy (SaiPy). SciPy ist eine Reihe verschiedener Software, und alle Funktionen von NumPy können mit SciPy verwendet werden. ・ Unterschiede und Beziehungen zwischen SciPy und seinen Freunden (NumPy, IPython usw.) ・ Numpy and Scipy Für Anfänger wie mich weiß ich noch nicht viel über den Unterschied, deshalb ist es mir egal.
CSR CSR ist eine Abkürzung für Compressed Sparse Row, eine komprimierte Form einer Sparse-Matrix. Da sich die Matrixberechnung häufig mit einer Matrix befasst, deren Komponente 0 ist, Ich denke, dass es in einer bequemen Form ist, damit die Daten nicht unnötig zunehmen.
Das COO-Format ist eine Abkürzung für Coordinate Format und eine Methode zur normalen Angabe der Matrixnummer.
pandas Im Buch
from IPython import display
Ist geschrieben, aber danach
display(data_pandas)
An der Stelle von
TypeError: 'module' object is not callable
Ich bekomme eine Fehlermeldung. In meiner Umgebung
from IPython.display import display
Dann hat es funktioniert. Wahrscheinlich, weil die Version anders ist.
Im Buch bei Verwendung der Scatter_matrix-Funktion
grr = pd.scatter_matrix(iris_dataframe, c=y_train, figsize=(15,15), marker='o', hist_kwds={'bins': 20}, s=60, alpha=.8, cmap=mglearn.cm3)
Es gibt eine Beschreibung, aber in meiner Version
grr = pd.plotting.scatter_matrix(iris_dataframe, c=y_train, figsize=(15,15), marker='o', hist_kwds={'bins': 20}, s=60, alpha=.8, cmap=mglearn.cm3)
Es hat funktioniert mit.
Dieses Mal schrieb ich, was ich nach dem Lesen von Kapitel 1 Einführung nicht verstand. Der größte Teil der Umgebung wurde verbessert, aber am Ende habe ich ein wenig auf maschinelles Lernen eingegangen. k-Die Iris wurde nach der nächstgelegenen Methode klassifiziert, die Details des Modells werden jedoch nicht erwähnt. Es gibt verschiedene Parameter, aber es wurde angegeben, dass die zu ändernden Parameter in einem späteren Kapitel vorgestellt werden. Im Moment bin ich mir nicht sicher, weil es voller Parameter ist, aber ich würde gerne weitermachen.
Ab dem nächsten Mal werden wir ernsthaft über die Inhalte des maschinellen Lernens und des überwachten Lernens lernen.
Recommended Posts