[PYTHON] Ich habe versucht, das Modell mit der Low-Code-Bibliothek für maschinelles Lernen "PyCaret" zu visualisieren.

Überblick

Dinge die zu tun sind

Die Liste ist wie folgt, kann jedoch durch Automatisierung von Pycaret in wenigen Zeilen ausgeführt werden.

Probieren Sie es aus (⑤ Visualisierung des Modells)

⑤ Modellvisualisierung

evaluate_model(tuned_model)

AUC (ROC-Kurve)

Confusion Matrix

Error

Dicision Boundary

# Logistic
Regression
K Nearest
Neighbour
Gaussian
Process
Grenze lr.png knn.png GP.png
Charakteristisch Wegen des linearen Algorithmus
Die Entscheidungsgrenze ist ebenfalls gerade
Gruppieren von Punkten in der Nähe
Grenze
Achten Sie auf die Glockenkurve
Glatte gekrümmte Oberfläche

Threshold

Precision Recall

Learning Curve

Validation Curve

Algorithmus Horizontale Achse Algorithmus Horizontale Achse
Decision Tree
Random Forest
Gradient Boosting
Extra Trees Classifier
Extreme Gradient Boosting
Light Gradient Boosting
CatBoost Classifier
max_depth Logistic Regression
SVM (Linear)
SVM (RBF)
C
Multi Level Perceptron (MLP)
Ridge Classifier
alpha AdaBoost n_estimators
K Nearest Neighbour(knn) n_neighbors Gaussian Process(GP) max_iter_predict
Quadratic Disc. Analysis (QDA) reg_param Naives Bayes var_smoothing

Feature Importance

Manifold Learning

download.png

Dimensions

Probieren Sie es aus ((1) Daten laden - (4) Tuning)

① Daten laden

from pycaret.datasets import get_data
#Laden Sie den Kreditdatensatz.
#Wenn Sie die Profiloption True angeben, Pandas-EDA durch Profiling läuft.
data = get_data('credit',profile=False)

② Vorbehandlung

from pycaret.classification import *
exp1 = setup(data, target = 'default')

③ Modellvergleich

compare_models(sort="AUC")

④ Parametereinstellung

tuned_model = tune_model(estimator='lightgbm')

tune_model_v1.gif

*Folgende Algorithmen können angegeben werden.docstringAber du kannst es überprüfen.

Algorithmus Spezifikation des Schätzers Algorithmus Spezifikation des Schätzers
Logistic Regression 'lr' Random Forest 'rf'
K Nearest Neighbour 'knn' Quadratic Disc. Analysis 'qda'
Naives Bayes 'nb' AdaBoost 'ada'
Decision Tree 'dt' Gradient Boosting 'gbc'
SVM (Linear) 'svm' Linear Disc. Analysis 'lda'
SVM (RBF) 'rbfsvm' Extra Trees Classifier 'et'
Gaussian Process 'gpc' Extreme Gradient Boosting 'xgboost'
Multi Level Perceptron 'mlp' Light Gradient Boosting 'lightgbm'
Ridge Classifier 'ridge' CatBoost Classifier 'catboost'

#Zusammenfassung *Ich habe die Methode zur Visualisierung des Modells separat geschrieben, daher möchte ich die Organisation nach Anwendung am Ende abschließen. *Unter der Annahme von Eingabedaten-> Modellierungs-> Ergebnissen möchte ich sie für die folgenden 5 Zwecke gruppieren. * A)Verstehen Sie die Eingabedaten und die Funktionsmenge selbst. * B)Verstehen Sie die Funktionen, die das Modell betrachtet. * C)Beurteilen Sie den Lernstatus des Modells (unzureichendes Lernen, Überlernen). * D)Berücksichtigen Sie die Vorhersageeigenschaften des Modells und die Schwellenwerte, bei denen die Ziele erreicht werden können. * E)Verstehen Sie die Vorhersageleistung und die Vorhersageergebnisse des Modells.

Verwenden Perspektive Visualisierung bedeutet
A)Verstehen Sie die Eingabedaten und die Funktionsmenge selbst. Sind positive / negative Daten trennbar? Manifold Learning download.png
Das gleiche wie oben Dimensions download.png
B)Verstehen Sie die Funktionen, die das Modell betrachtet. Welche Funktion ist wichtig? Feature Importance download.png
C)Beurteilen Sie den Lernstatus des Modells (unzureichendes Lernen, Überlernen). Ist es möglich, die Vorhersageleistung zu verbessern, indem die Anzahl der Lernvorgänge erhöht wird? Learning Curve income_lc.png
Wird Überlernen durch Regularisierung unterdrückt? Validation Curve income_vc.png
D)Berücksichtigen Sie die Vorhersageeigenschaften des Modells und die Schwellenwerte, bei denen die Ziele erreicht werden können. Welcher Schwellenwert entspricht der gewünschten Vorhersageeigenschaft? Threshold download.png
Welche Beziehung besteht zwischen Präzision und Rückruf? Precision Recall download.png
E)Verstehen Sie die Vorhersageleistung und die Vorhersageergebnisse des Modells. Was ist AUC (Prediction Performance)? AUC download.png
Verstehen Sie die Grenzen der Ergebnisse Decision Boundary mc_db.png
Verstehe, wie man Fehler macht Confusion Matrix mc_conf.png
Das gleiche wie oben Error mc_err.png

#Schließlich *Vielen Dank für Ihren Aufenthalt bei uns. *Wenn es dir nichts ausmachtWie teilenIch würde mich freuen, wenn Sie könnten. *Wenn es zu einem gewissen Grad eine Antwort gibt, werde ich versuchen, eine Mastery Edition (Parametererklärung usw.) zu schreiben.

Recommended Posts

Ich habe versucht, das Modell mit der Low-Code-Bibliothek für maschinelles Lernen "PyCaret" zu visualisieren.
Ich habe versucht, maschinelles Lernen (Objekterkennung) mit TouchDesigner zu verschieben
Ich habe versucht, das Bild mithilfe von maschinellem Lernen zu komprimieren
Ich habe versucht, die beim maschinellen Lernen verwendeten Bewertungsindizes zu organisieren (Regressionsmodell).
Ich habe maschinelles Lernen mit liblinear versucht
[TF] Ich habe versucht, das Lernergebnis mit Tensorboard zu visualisieren
[Maschinelles Lernen] Ich habe versucht, die Theorie von Adaboost zusammenzufassen
Ich habe versucht, in einem tief erlernten Sprachmodell zu schreiben
Management von Modellen für maschinelles Lernen, um Streitigkeiten mit der Unternehmensseite zu vermeiden
[Python] Ich habe versucht, die Nacht der Galaxienbahn mit WordCloud zu visualisieren!
Ich habe versucht, die Vorhersage-API des maschinellen Lernmodells von WordPress aus aufzurufen
Ich habe versucht, Othello AI mit Tensorflow zu machen, ohne die Theorie des maschinellen Lernens zu verstehen ~ Einführung ~
Ich habe versucht, die Daten mit Zwietracht zu speichern
(Maschinelles Lernen) Ich habe versucht, die Bayes'sche lineare Regression bei der Implementierung sorgfältig zu verstehen
Ich habe versucht, das Überleben der Titanic mit PyCaret vorherzusagen
Ich habe versucht, das Verhalten des neuen Koronavirus mit dem SEIR-Modell vorherzusagen.
Ich habe versucht, Othello AI mit Tensorflow zu erstellen, ohne die Theorie des maschinellen Lernens zu verstehen ~ Implementierung ~
Ich habe versucht, die Lernfunktion im neuronalen Netzwerk sorgfältig zu verstehen, ohne die Bibliothek für maschinelles Lernen zu verwenden (zweite Hälfte).
Ich habe versucht, Othello AI mit Tensorflow zu erstellen, ohne die Theorie des maschinellen Lernens zu verstehen ~ Battle Edition ~
Ich habe versucht, mit der Bibliothek GiNZA zur Verarbeitung natürlicher Sprache eindeutige Ausdrücke zu extrahieren
Ein Anfänger des maschinellen Lernens versuchte, mit Python ein Vorhersagemodell für Pferderennen zu erstellen
Ich habe versucht, die Tweets von JAWS DAYS 2017 mit Python + ELK einfach zu visualisieren
Ich wollte die 3D-Partikelsimulation mit der Python-Visualisierungsbibliothek Matplotlib visualisieren.
Ich habe versucht, das Vorhandensein oder Nichtvorhandensein von Schnee durch maschinelles Lernen vorherzusagen.
Ich habe versucht, die Veränderung der Schneemenge für 2 Jahre durch maschinelles Lernen vorherzusagen
Ich habe versucht, verschiedene Methoden für maschinelles Lernen (Vorhersagemodell) mithilfe von Scicit-Learn zu implementieren
Ich habe versucht, das Bild zu verarbeiten und zu transformieren und die Daten für maschinelles Lernen zu erweitern
Ich habe versucht, Cifar10 mit der SONY Deep Learning Library NNabla [Nippon Hurra] zu implementieren.
Ich habe versucht, ein Modell mit dem Beispiel von Amazon SageMaker Autopilot zu erstellen
Ich habe versucht, die Sündenfunktion mit Chainer zu trainieren
Ich habe versucht, eine CSV-Datei mit Python zu berühren
Ich habe versucht, Soma Cube mit Python zu lösen
Ich habe versucht, das Problem mit Python Vol.1 zu lösen
Ich habe versucht, mit PyCaret zu clustern
Ich habe die Changefinder-Bibliothek ausprobiert!
Kalibrieren Sie das Modell mit PyCaret
Ich habe versucht, die Lernfunktion im neuronalen Netzwerk sorgfältig zu verstehen, ohne die Bibliothek für maschinelles Lernen zu verwenden (erste Hälfte).
Ich habe versucht, mit dem Seq2Seq-Modell von TensorFlow so etwas wie einen Chatbot zu erstellen
Ich habe versucht, mit Python Machine Learning ein Echtzeit-Modell zur Trennung von Tonquellen zu erstellen
Ich habe versucht, das Problem der Optimierung der Platzierung virtueller Maschinen (einfache Version) mit blueqat zu lösen
Ich habe "Lobe" ausprobiert, mit dem das von Microsoft veröffentlichte Modell des maschinellen Lernens problemlos trainiert werden kann.
Ich habe versucht, die Eigenschaften der neuen Informationen über mit dem Corona-Virus infizierte Personen mit Wordcloud zu visualisieren
Ich habe versucht, die Laufdaten des Rennspiels (Assetto Corsa) mit Plotly zu visualisieren
Ich habe versucht, mit Python (Mac OS X) eine Umgebung für maschinelles Lernen zu erstellen.
Ich habe versucht, die Entropie des Bildes mit Python zu finden
Ich habe versucht zu simulieren, wie sich die Infektion mit Python ausbreitet
Ich habe versucht, die Emotionen des gesamten Romans "Wetterkind" zu analysieren
Onkel SE mit verhärtetem Gehirn versuchte, maschinelles Lernen zu studieren
Versuchen Sie, die Leistung des Modells für maschinelles Lernen / Regression zu bewerten
Ich habe versucht, die Python-Bibliothek von Ruby mit PyCall zu verwenden
Ich habe versucht, die Zugverspätungsinformationen mit LINE Notify zu benachrichtigen
Ich habe die automatische maschinelle Lernbibliothek auto-sklearn auf centos7 installiert
Versuchen Sie, die Leistung des Modells für maschinelles Lernen / Klassifizierung zu bewerten
Ich habe versucht, durch maschinelles Lernen Sätze in den XX-Stil umzuwandeln
[Python] Ich habe versucht, Tweets über Corona mit WordCloud zu visualisieren
[Python] Ich habe versucht, die folgende Beziehung von Twitter zu visualisieren
Ich habe versucht, ListNet of Rank Learning mit Chainer zu implementieren
Ich habe versucht, den Immobilienpreis in Boston mit PyCaret vorherzusagen
Ich habe das Toho-Projekt mit Deep Learning aufgenommen ... ich wollte.