[PYTHON] [Übersetzung] scikit-learn 0.18 Tutorial Statistisches Lernen Tutorial für die wissenschaftliche Datenverarbeitung Statistisches Lernen: Einstellungen und Schätzobjekte in scikit-learn

Google-Übersetzung von http://scikit-learn.org/0.18/tutorial/statistical_inference/settings.html scikit-learn 0.18 Tutorial Inhaltsverzeichnis Tutorial-Tabelle zum statistischen Lernen für die wissenschaftliche Datenverarbeitung


Statistisches Lernen: Einstellungen und Schätzobjekte in Scikit-Learn

Datensatz

scikit-learn befasst sich mit dem Lernen der Informationen eines oder mehrerer Datensätze, die als zweidimensionales Array dargestellt werden. Sie können als Liste mehrdimensionaler Beobachtungen verstanden werden. Die erste Achse dieser Sequenzen ist die Probenachse und die zweite Achse ist die Elementachse.

** scikit: Ein einfaches Beispiel, das mit dem Iris-Datensatz geliefert wird **

>>> from sklearn import datasets
>>> iris = datasets.load_iris()
>>> data = iris.data
>>> data.shape
(150, 4)

Es besteht aus Beobachtungen von 150 Iris. Jedes Merkmal ist die Länge und Breite seiner Blätter und Blütenblätter, wie in "iris.DESCR" beschrieben.

Wenn die Daten nicht in der Form "(n_samples, n_features)" vorliegen, müssen sie für die Verwendung mit scicit-learn vorverarbeitet werden.

** Ein Beispiel für die Reformierung von Daten ist der Ziffern-Datensatz **

Der Ziffern-Datensatz besteht aus 1797 8x8-Bildern handgeschriebener Zahlen.

>>> digits = datasets.load_digits()
>>> digits.images.shape
(1797, 8, 8)
>>> import matplotlib.pyplot as plt 
>>> plt.imshow(digits.images[-1], cmap=plt.cm.gray_r) 
<matplotlib.image.AxesImage object at ...>

Konvertieren Sie jedes 8x8-Bild in einen Feature-Vektor der Länge 64 zur Verwendung mit diesem Datensatz in Scikit

>>> data = digits.images.reshape((digits.images.shape[0], -1))

Schätzobjekt

** Anpassungsdaten: ** Die von scikit-learn implementierte Haupt-API ist die Schätzer-API. Ein Schätzer ist ein Objekt, das aus Daten lernt. Es kann sich um einen Klassifikator, einen Regressions- oder Clustering-Algorithmus oder einen Konverter handeln, der nützliche Funktionen aus Rohdaten extrahiert / filtert. Alle Schätzerobjekte legen eine Anpassungsmethode offen, die einen Datensatz (normalerweise ein zweidimensionales Array) als Argument verwendet.

>>> estimator.fit(data)

** Schätzerparameter: ** Alle Schätzparameter können beim Instanziieren oder durch Ändern der entsprechenden Attribute eingestellt werden.

>>> estimator = Estimator(param1=1, param2=2)
>>> estimator.param1
1

** Geschätzte Parameter: ** Wenn der Schätzer so eingestellt wird, dass er zu den Daten passt, werden die Parameter aus den vorliegenden Daten geschätzt. Alle Schätzparameter sind Attribute des Schätzobjekts, die mit einem Unterstrich enden.

>>> estimator.estimated_pa​​ram_

Nächste Tutorial-Seite

Tutorial-Tabelle zum statistischen Lernen für die wissenschaftliche Datenverarbeitung

© 2010 - 2016, Entwickler von Scikit-Learn (BSD-Lizenz).

Recommended Posts

[Übersetzung] scikit-learn 0.18 Tutorial Statistisches Lernen Tutorial für die wissenschaftliche Datenverarbeitung Statistisches Lernen: Einstellungen und Schätzobjekte in scikit-learn
[Übersetzung] scikit-learn 0.18 Tutorial Statistisches Lern-Tutorial für die wissenschaftliche Datenverarbeitung
[Übersetzung] scikit-learn 0.18 Tutorial Statistisches Lernen Tutorial für die wissenschaftliche Datenverarbeitung Modellauswahl: Auswahl des Schätzers und seiner Parameter
[Übersetzung] scikit-learn 0.18 Tutorial Statistisches Lern-Tutorial für die wissenschaftliche Datenverarbeitung Alles zusammen
[Übersetzung] scikit-learn 0.18 Tutorial Suchen Sie nach Hilfe zum statistischen Lernen für die wissenschaftliche Datenverarbeitung
[Übersetzung] scikit-learn 0.18 Tutorial Statistisches Lernen Tutorial für die wissenschaftliche Datenverarbeitung Unbeaufsichtigtes Lernen: Suche nach Datendarstellung
[Übersetzung] scikit-learn 0.18 Tutorial Statistisches Lernen Tutorial für die wissenschaftliche Datenverarbeitung Überwachtes Lernen: Vorhersage von Ausgabevariablen aus hochdimensionalen Beobachtungen
Organisation grundlegender Verfahren zur Datenanalyse und statistischen Verarbeitung (4)
Organisation grundlegender Verfahren zur Datenanalyse und statistischen Verarbeitung (2)
Informationen zur Datenerweiterungsverarbeitung für tiefes Lernen
[Übersetzung] scikit-learn 0.18 Einführung in maschinelles Lernen durch Tutorial scikit-learn
Verarbeitung von CSV-Daten in voller und halber Breite in Python
Ungefähr 200 Breiten- und Längengraddaten für Krankenhäuser in Tokio
Datenverarbeitungsmethoden für Maschinenbauingenieure und Nicht-Computeringenieure (Einführung 2)
Datenverarbeitungsmethoden für Maschinenbauingenieure und Nicht-Computeringenieure (Einführung 1)
Lesen von Notizen (in Python und Stan) zur Einführung in die statistische Modellierung für die Datenanalyse (Midorimoto)