Google-Übersetzung von http://scikit-learn.org/0.18/tutorial/statistical_inference/settings.html scikit-learn 0.18 Tutorial Inhaltsverzeichnis Tutorial-Tabelle zum statistischen Lernen für die wissenschaftliche Datenverarbeitung
scikit-learn befasst sich mit dem Lernen der Informationen eines oder mehrerer Datensätze, die als zweidimensionales Array dargestellt werden. Sie können als Liste mehrdimensionaler Beobachtungen verstanden werden. Die erste Achse dieser Sequenzen ist die Probenachse und die zweite Achse ist die Elementachse.
** scikit: Ein einfaches Beispiel, das mit dem Iris-Datensatz geliefert wird **
>>> from sklearn import datasets
>>> iris = datasets.load_iris()
>>> data = iris.data
>>> data.shape
(150, 4)
Es besteht aus Beobachtungen von 150 Iris. Jedes Merkmal ist die Länge und Breite seiner Blätter und Blütenblätter, wie in "iris.DESCR" beschrieben.
Wenn die Daten nicht in der Form "(n_samples, n_features)" vorliegen, müssen sie für die Verwendung mit scicit-learn vorverarbeitet werden.
** Ein Beispiel für die Reformierung von Daten ist der Ziffern-Datensatz **
Der Ziffern-Datensatz besteht aus 1797 8x8-Bildern handgeschriebener Zahlen.
>>> digits = datasets.load_digits()
>>> digits.images.shape
(1797, 8, 8)
>>> import matplotlib.pyplot as plt
>>> plt.imshow(digits.images[-1], cmap=plt.cm.gray_r)
<matplotlib.image.AxesImage object at ...>
Konvertieren Sie jedes 8x8-Bild in einen Feature-Vektor der Länge 64 zur Verwendung mit diesem Datensatz in Scikit
>>> data = digits.images.reshape((digits.images.shape[0], -1))
** Anpassungsdaten: ** Die von scikit-learn implementierte Haupt-API ist die Schätzer-API. Ein Schätzer ist ein Objekt, das aus Daten lernt. Es kann sich um einen Klassifikator, einen Regressions- oder Clustering-Algorithmus oder einen Konverter handeln, der nützliche Funktionen aus Rohdaten extrahiert / filtert. Alle Schätzerobjekte legen eine Anpassungsmethode offen, die einen Datensatz (normalerweise ein zweidimensionales Array) als Argument verwendet.
>>> estimator.fit(data)
** Schätzerparameter: ** Alle Schätzparameter können beim Instanziieren oder durch Ändern der entsprechenden Attribute eingestellt werden.
>>> estimator = Estimator(param1=1, param2=2)
>>> estimator.param1
1
** Geschätzte Parameter: ** Wenn der Schätzer so eingestellt wird, dass er zu den Daten passt, werden die Parameter aus den vorliegenden Daten geschätzt. Alle Schätzparameter sind Attribute des Schätzobjekts, die mit einem Unterstrich enden.
>>> estimator.estimated_param_
Tutorial-Tabelle zum statistischen Lernen für die wissenschaftliche Datenverarbeitung
© 2010 - 2016, Entwickler von Scikit-Learn (BSD-Lizenz).
Recommended Posts