[PYTHON] J'ai essayé de visualiser le modèle avec la bibliothèque d'apprentissage automatique low-code "PyCaret"

Aperçu

Choses à faire

La liste est la suivante, mais elle peut être exécutée en quelques lignes en automatisant pycaret.

Essayez-le (⑤ Visualisation du modèle)

⑤ Visualisation du modèle

evaluate_model(tuned_model)

AUC (courbe ROC)

Confusion Matrix

Error

Dicision Boundary

# Logistic
Regression
K Nearest
Neighbour
Gaussian
Process
frontière lr.png knn.png GP.png
Fonctionnalité En raison de l'algorithme linéaire
La frontière de décision est également droite
Regroupement des points à proximité
Frontière
Soyez conscient de la courbe en cloche
Surface incurvée lisse

Threshold

Precision Recall

Learning Curve

Validation Curve

algorithme Axe horizontal algorithme Axe horizontal
Decision Tree
Random Forest
Gradient Boosting
Extra Trees Classifier
Extreme Gradient Boosting
Light Gradient Boosting
CatBoost Classifier
max_depth Logistic Regression
SVM (Linear)
SVM (RBF)
C
Multi Level Perceptron (MLP)
Ridge Classifier
alpha AdaBoost n_estimators
K Nearest Neighbour(knn) n_neighbors Gaussian Process(GP) max_iter_predict
Quadratic Disc. Analysis (QDA) reg_param Naives Bayes var_smoothing

Feature Importance

Manifold Learning

download.png

Dimensions

Essayez-le ((1) Chargement des données- (4) Réglage)

① Chargement des données

from pycaret.datasets import get_data
#Chargez l'ensemble de données de crédit.
#Si vous spécifiez True pour l'option de profil, pandas-EDA en profilant les exécutions.
data = get_data('credit',profile=False)

② Prétraitement

from pycaret.classification import *
exp1 = setup(data, target = 'default')

③ Comparaison de modèles

compare_models(sort="AUC")

④ Réglage des paramètres

tuned_model = tune_model(estimator='lightgbm')

tune_model_v1.gif

*Les algorithmes qui peuvent être spécifiés sont les suivants.docstringMais vous pouvez le vérifier.

algorithme spécification de l'estimateur algorithme spécification de l'estimateur
Logistic Regression 'lr' Random Forest 'rf'
K Nearest Neighbour 'knn' Quadratic Disc. Analysis 'qda'
Naives Bayes 'nb' AdaBoost 'ada'
Decision Tree 'dt' Gradient Boosting 'gbc'
SVM (Linear) 'svm' Linear Disc. Analysis 'lda'
SVM (RBF) 'rbfsvm' Extra Trees Classifier 'et'
Gaussian Process 'gpc' Extreme Gradient Boosting 'xgboost'
Multi Level Perceptron 'mlp' Light Gradient Boosting 'lightgbm'
Ridge Classifier 'ridge' CatBoost Classifier 'catboost'

#Résumé *J'ai écrit la méthode de visualisation du modèle séparément, je voudrais donc finir de l'organiser par application à la fin. *En supposant que les données d'entrée-> modélisation-> résultats, je voudrais les regrouper pour les 5 objectifs suivants. * A)Comprenez les données d'entrée et la quantité de fonctionnalités elle-même. * B)Comprenez les fonctionnalités que le modèle examine. * C)Juger le statut d'apprentissage du modèle (apprentissage insuffisant, surapprentissage). * D)Tenez compte des caractéristiques prédictives du modèle et des seuils auxquels les objectifs peuvent être atteints. * E)Comprendre les performances de prédiction et les résultats de prédiction du modèle.

Utilisation Perspective Visualisation signifie
A)Comprenez les données d'entrée et la quantité de fonctionnalités elle-même. Les données positives / négatives sont-elles séparables? Manifold Learning download.png
Comme ci-dessus Dimensions download.png
B)Comprenez les fonctionnalités que le modèle examine. Quelle caractéristique est importante Feature Importance download.png
C)Juger le statut d'apprentissage du modèle (apprentissage insuffisant, surapprentissage). Est-il possible d'améliorer les performances de prédiction en augmentant le nombre d'apprentissage? Learning Curve income_lc.png
Le surapprentissage est-il supprimé par la régularisation? Validation Curve income_vc.png
D)Tenez compte des caractéristiques prédictives du modèle et des seuils auxquels les objectifs peuvent être atteints. Quelle valeur seuil correspond à la caractéristique de prédiction souhaitée? Threshold download.png
Quelle est la relation entre Precision et Recall? Precision Recall download.png
E)Comprendre les performances de prédiction et les résultats de prédiction du modèle. Qu'est-ce que l'AUC (Prediction Performance)? AUC download.png
Comprendre les limites des résultats Decision Boundary mc_db.png
Comprendre comment faire des erreurs Confusion Matrix mc_conf.png
Comme ci-dessus Error mc_err.png

#finalement *Merci de rester avec nous. *Si ça ne te dérange pasAime partageJe serais heureux si vous le pouviez. *S'il y a une réponse dans une certaine mesure, j'écrirai un chef-d'œuvre (explication des paramètres, etc.).

Recommended Posts

J'ai essayé de visualiser le modèle avec la bibliothèque d'apprentissage automatique low-code "PyCaret"
J'ai essayé de déplacer l'apprentissage automatique (détection d'objet) avec TouchDesigner
J'ai essayé de compresser l'image en utilisant l'apprentissage automatique
J'ai essayé d'organiser les index d'évaluation utilisés en machine learning (modèle de régression)
J'ai essayé l'apprentissage automatique avec liblinear
[TF] J'ai essayé de visualiser le résultat de l'apprentissage en utilisant Tensorboard
[Apprentissage automatique] J'ai essayé de résumer la théorie d'Adaboost
J'ai essayé d'écrire dans un modèle de langage profondément appris
Gestion des modèles d'apprentissage automatique pour éviter de se quereller avec le côté commercial
[Python] J'ai essayé de visualiser la nuit du chemin de fer de la galaxie avec WordCloud!
J'ai essayé d'appeler l'API de prédiction du modèle d'apprentissage automatique de WordPress
J'ai essayé de créer Othello AI avec tensorflow sans comprendre la théorie de l'apprentissage automatique ~ Introduction ~
J'ai essayé de sauvegarder les données avec discorde
(Apprentissage automatique) J'ai essayé de comprendre attentivement la régression linéaire bayésienne avec l'implémentation
J'ai essayé de prédire la survie du Titanic avec PyCaret
J'ai essayé de prédire le comportement du nouveau virus corona avec le modèle SEIR.
J'ai essayé de créer Othello AI avec tensorflow sans comprendre la théorie de l'apprentissage automatique ~ Implémentation ~
J'ai essayé de comprendre attentivement la fonction d'apprentissage dans le réseau de neurones sans utiliser la bibliothèque d'apprentissage automatique (deuxième moitié)
J'ai essayé de créer Othello AI avec tensorflow sans comprendre la théorie de l'apprentissage automatique ~ Battle Edition ~
J'ai essayé d'extraire des expressions uniques avec la bibliothèque de traitement du langage naturel GiNZA
Un débutant en apprentissage automatique a essayé de créer un modèle de prédiction de courses de chevaux avec python
J'ai essayé de visualiser facilement les tweets de JAWS DAYS 2017 avec Python + ELK
Je voulais visualiser la simulation de particules 3D avec la bibliothèque de visualisation Python Matplotlib.
J'ai essayé de prédire la présence ou l'absence de neige par apprentissage automatique.
J'ai essayé de prédire l'évolution de la quantité de neige pendant 2 ans par apprentissage automatique
J'ai essayé d'implémenter diverses méthodes d'apprentissage automatique (modèle de prédiction) en utilisant scicit-learn
J'ai essayé de traiter et de transformer l'image et d'élargir les données pour l'apprentissage automatique
J'ai essayé d'implémenter Cifar10 avec la bibliothèque SONY Deep Learning NNabla [Nippon Hurray]
J'ai essayé de créer un modèle avec l'exemple d'Amazon SageMaker Autopilot
J'ai essayé d'entraîner la fonction péché avec chainer
J'ai essayé de toucher un fichier CSV avec Python
J'ai essayé de résoudre Soma Cube avec python
J'ai essayé de résoudre le problème avec Python Vol.1
J'ai essayé le clustering avec PyCaret
J'ai essayé la bibliothèque changefinder!
Calibrer le modèle avec PyCaret
J'ai essayé de comprendre attentivement la fonction d'apprentissage dans le réseau de neurones sans utiliser la bibliothèque d'apprentissage automatique (première moitié)
J'ai essayé de faire quelque chose comme un chatbot avec le modèle Seq2Seq de TensorFlow
J'ai essayé de faire une simulation de séparation de source sonore en temps réel avec l'apprentissage automatique Python
J'ai essayé de résoudre le problème d'optimisation du placement de la machine virtuelle (version simple) avec blueqat
J'ai essayé "Lobe" qui peut facilement entraîner le modèle d'apprentissage automatique publié par Microsoft.
J'ai essayé de visualiser les caractéristiques des nouvelles informations sur les personnes infectées par le virus corona avec wordcloud
J'ai essayé de visualiser les données de course du jeu de course (Assetto Corsa) avec Plotly
J'ai essayé de créer un environnement d'apprentissage automatique avec Python (Mac OS X)
J'ai essayé de trouver l'entropie de l'image avec python
J'ai essayé de simuler la propagation de l'infection avec Python
J'ai essayé d'analyser les émotions de tout le roman "Weather Child" ☔️
Oncle SE avec un cerveau endurci a essayé d'étudier l'apprentissage automatique
Essayez d'évaluer les performances du modèle d'apprentissage automatique / de régression
J'ai essayé d'utiliser la bibliothèque Python de Ruby avec PyCall
J'ai essayé de notifier les informations de retard de train avec LINE Notify
J'ai installé la bibliothèque de machine learning automatique auto-sklearn sur centos7
Essayez d'évaluer les performances du modèle d'apprentissage automatique / de classification
J'ai essayé l'apprentissage automatique pour convertir des phrases en style XX
[Python] J'ai essayé de visualiser des tweets sur Corona avec WordCloud
[Python] J'ai essayé de visualiser la relation de suivi de Twitter
J'ai essayé d'implémenter ListNet d'apprentissage de rang avec Chainer
J'ai essayé de prédire le prix de l'immobilier à Boston avec PyCaret
J'ai capturé le projet Toho avec Deep Learning ... je le voulais.