[PYTHON] Version gratuite de DataRobot! ?? Introduction à «PyCaret», une bibliothèque qui automatise l'apprentissage automatique

Qu'est-ce que PyCaret

Je viens de lire l'article Announcing PyCaret 1.0.0. .. Puisqu'il s'agissait d'une bibliothèque intéressante, cet article expliquera comment utiliser réellement PyCaret. ** PyCaret est une bibliothèque Python qui vous permet d'effectuer le prétraitement, la visualisation et le développement de modèles de données dans le développement de modèles d'apprentissage automatique avec seulement quelques lignes de code. ** **

PyCaret est un wrapper Python pour certaines des principales bibliothèques d'apprentissage automatique (scikit-learn, XGBoost, LightGBM, etc.). Il peut gérer la classification, la régression, le clustering, la détection d'anomalies et le traitement du langage naturel. Pour ainsi dire, PyCaret est comme une version gratuite de DataRobot.

Fondamentalement, il semble que vous puissiez tout faire, du prétraitement à la modélisation, en passant par l'évaluation des performances, le réglage et la visualisation. De plus, l'empilage peut être fait. (Certains indices d'évaluation tels que l'analyse des séries chronologiques et la perte de journal ne sont pas disponibles.) PyCaret/Github

En outre, le public cible a déjà introduit une série d'apprentissage automatique utilisant scicit-learn! C'est celui qui dit. (Si vous êtes un débutant en apprentissage automatique, vous ne comprenez peut-être pas le contenu. Passons un peu de temps pour le moment. Je pense que cela se termine par le sentiment. Je suis désolé pour le service interne, mais [AI Academy](https: // aiacademy. Essayez de démarrer avec la programmation d'apprentissage automatique en utilisant jp /) etc.)

Il existe également une vidéo expliquant comment utiliser PyCaret pour travailler sur la [Détection de fraude par carte de crédit] de kaggle (https://www.kaggle.com/mlg-ulb/creditcardfraud), alors jetez un œil.

Essayons PyCaret!

Tout d'abord, installez PyCaret.

Lors de l'installation à partir d'un terminal ou d'une invite de commande, vous pouvez effectuer l'installation avec la commande suivante.

pip install pycaret

Dans Jupyter Notebook et Google Colab, vous pouvez l'installer avec la commande suivante avec un! Au début.

!pip install pycaret

Chargez les modules nécessaires et préparez les données

Cette fois, je vais essayer la classification multi-classes en utilisant le jeu de données iris. Commencez par charger le code requis.

import warnings
#J'effacerai les avertissements inutiles
warnings.filterwarnings("ignore")
#Le rôle principal cette fois! Chargez PyCaret.
from pycaret.classification import *
#Chargez le jeu de données Iris.
from sklearn.datasets import load_iris
#Puisqu'il gère les trames de données, il lit également les Pandas.
import pandas as pd

Ensuite, préparez les données.

iris = load_iris()
X = pd.DataFrame(iris.data, columns=iris.feature_names)
y = pd.DataFrame(iris.target, columns=["target"])
df = pd.concat([X,y], axis=1)

Les 5 premiers éléments s'affichent.

df.head()

Prétraitement

Maintenant! Prétraitement.

Si vous utilisez ** setup () **, il gérera les valeurs manquantes, divisera les données, etc.

Passez la variable objectif à la cible.

exp1 = setup(df, target = 'target')

Comparons les modèles

Pour comparer des modèles, utilisez simplement ** compare_models () **.

compare_models()
スクリーンショット 2020-04-21 0.14.17.png

la modélisation

Entrez le nom de l'algorithme utilisé pour l'entraînement en vous référant à https://pycaret.org/create-model/. Cette fois, nous utiliserons l '«analyse discriminante quadratique» et l'arbre de décision, qui ont le taux de précision le plus élevé. Pour l'analyse discriminante quadratique, vous pouvez entrer «qda», alors entrez qda cette fois.

qda = create_model('qda')
スクリーンショット 2020-04-21 0.14.38.png

Essayons également l'arbre de décision.

tree = create_model('dt')
スクリーンショット 2020-04-21 0.14.44.png

réglage

Affinons l'arbre de décision.

tuned_tree = tune_model('dt')
スクリーンショット 2020-04-21 0.14.44.png

Obtenir les paramètres

tuned_tree.get_params

Visualisation du modèle

plot_model(tuned_qda)

download.png

plot_model(tuned_tree)

download-1.png

Apprentissage d'ensemble

lgbm = create_model('lightgbm')
xgboost = create_model('xgboost')

ensemble = blend_models([lgbm, xgboost])
スクリーンショット 2020-04-21 0.15.43.png

Empilement

stack = stack_models(estimator_list = [xgboost], meta_model = lgbm)
スクリーンショット 2020-04-21 0.15.48.png

Prévoir

pred = predict_model(qda)

Oui, c'est pratique.

finalement

En quelques lignes, j'ai pu le terminer. .. Je pense que je vais l'utiliser petit à petit à partir de maintenant.

Site de référence

C'est un article que j'ai utilisé comme référence. Veuillez vous y référer en plus de cet article.

Article de référence 1 Article de référence 2 [Article de référence 3](https://techtech-sorae.com/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%81%AE%E8%87 % AA% E5% 8B% 95% E5% 8C% 96% E3% 83% A9% E3% 82% A4% E3% 83% 96% E3% 83% A9% E3% 83% AA% E3% 80% 8Cpycaret % E3% 80% 8D% E3% 82% 92% E4% BD% BF% E3% 81% A3% E3% 81% A6% E3% 81% BF% E3% 81% 9F /)

La personne qui a écrit cet article

Cyber Brain Co., Ltd. Directeur représentatif et PDG Kazunori Tani Nous nous réjouissons de votre suivi! Twitter Facebook Nous gérons également une communauté d'IA avec plus de 5000 participants. Nous fournissons des informations sur l'IA tous les jours, nous nous réjouissons donc de votre participation! Communauté de recherche sur l'intelligence artificielle AI Academy

Recommended Posts

Version gratuite de DataRobot! ?? Introduction à «PyCaret», une bibliothèque qui automatise l'apprentissage automatique
Présentation de la bibliothèque d'apprentissage automatique SHOGUN
Mémo d'étude Python & Machine Learning ②: Introduction de la bibliothèque
Introduction à l'apprentissage automatique
Une introduction approximative à la bibliothèque de traduction automatique neuronale
Installation de TensorFlow, une bibliothèque d'apprentissage automatique de Google
Introduction à l'apprentissage automatique à partir de Simple Perceptron
Une introduction à l'apprentissage automatique
Super introduction à l'apprentissage automatique
Introduction à la rédaction de notes d'apprentissage automatique
Une histoire coincée avec l'installation de la bibliothèque de machine learning JAX
Introduction aux bases de Python de l'apprentissage automatique (apprentissage non supervisé / analyse principale)
[Introduction au style GAN] Apprentissage unique de l'animation avec votre propre machine ♬
Une introduction à OpenCV pour l'apprentissage automatique
Introduction de "scikit-mobility", une bibliothèque qui vous permet d'analyser facilement les données de flux humain avec Python (Partie 1)
Prenons la version gratuite "Introduction à Python pour l'apprentissage automatique" en ligne jusqu'au 27/04
J'ai essayé de visualiser le modèle avec la bibliothèque d'apprentissage automatique low-code "PyCaret"
Une introduction à Python pour l'apprentissage automatique
J'ai essayé de comprendre attentivement la fonction d'apprentissage dans le réseau de neurones sans utiliser la bibliothèque d'apprentissage automatique (première moitié)
9 étapes pour devenir un expert en apprentissage automatique dans les plus brefs délais [Entièrement gratuit]
[Super Introduction] Apprentissage automatique utilisant Python - De la construction d'environnement à l'implémentation de perceptron simple-
Mise en place d'un modèle de prédiction des taux de change (taux dollar-yen) par machine learning
[Python] Introduction facile à l'apprentissage automatique avec python (SVM)
Mémo d'apprentissage automatique d'un ingénieur débutant Partie 1
[Super introduction à l'apprentissage automatique] Découvrez les didacticiels Pytorch
Une introduction à l'apprentissage automatique pour les développeurs de robots
Liste des liens que les débutants en apprentissage automatique apprennent
[Super introduction à l'apprentissage automatique] Découvrez les didacticiels Pytorch
[Français] scikit-learn 0.18 Introduction de l'apprentissage automatique par le didacticiel scikit-learn
Mémo d'apprentissage automatique d'un ingénieur débutant Partie 2
Touchons une partie de l'apprentissage automatique avec Python
[Pour les débutants] Introduction à la vectorisation dans l'apprentissage automatique
Disposition des éléments auto-mentionnés liés à l'apprentissage automatique
Introduction du package de collecte automatique d'images "icrawler" (0.6.3) qui peut être utilisé pendant l'apprentissage automatique
[Introduction à Python] Utilisation basique de la bibliothèque scipy que vous devez absolument connaître
Code simple qui donne un score de 0,81339 dans Kaggle's Titanic: Machine Learning from Disaster
(Remarque) Application Web qui utilise TensorFlow pour déduire les noms de morceaux recommandés [Apprentissage automatique]
Introduction à l'apprentissage automatique ~ Montrons le tableau de la méthode du K plus proche voisin ~ (+ gestion des erreurs)
À propos du prétraitement des données des systèmes utilisant l'apprentissage automatique
Les débutants en apprentissage automatique essaient de créer un arbre de décision
[Python] Une bibliothèque pratique qui convertit les kanji en hiragana
[Introduction à Python] Utilisation basique de la bibliothèque matplotlib
PROGRAMMATION PROFONDE PROBABILISTE --- Bibliothèque "Deep Learning + Bayes" --- Présentation d'Edward
MALSS (introduction), un outil qui prend en charge l'apprentissage automatique en Python
J'ai essayé de comparer la précision des modèles d'apprentissage automatique en utilisant kaggle comme thème.
Application correspondante, j'ai essayé de prendre des statistiques de personnes fortes et j'ai essayé de créer un modèle d'apprentissage automatique
Un exemple de mécanisme qui renvoie une prédiction par HTTP à partir du résultat de l'apprentissage automatique
Une histoire qui contribue à une nouvelle analyse corona à l'aide d'un essai gratuit de Google Cloud Platform
Une version simple des statistiques gouvernementales (contrôle de l'immigration) facile à gérer avec jupyter
Création d'un outil qui facilite la définition des paramètres des modèles d'apprentissage automatique
Bibliothèque d'apprentissage automatique dlib
Bibliothèque d'apprentissage automatique Shogun
Essayez d'évaluer les performances du modèle d'apprentissage automatique / de régression
Introduction à l'apprentissage automatique avec scikit-learn - De l'acquisition de données à l'optimisation des paramètres
Essayez d'évaluer les performances du modèle d'apprentissage automatique / de classification
[Introduction à AWS] Mémorandum de création d'un serveur Web sur AWS
Comment augmenter le nombre d'images de jeux de données d'apprentissage automatique
[Apprentissage automatique] J'ai essayé de résumer la théorie d'Adaboost