pip install pycaret
Du laboratoire Jupyter
!pip install pycaret
Veuillez noter que vous obtiendrez une erreur si la version scikit-learn n'est pas 0.22.
Cette fois, nous utiliserons les données existantes sur le diabète. Peut être obtenu directement à partir de get_data de PyCaret dans une trame de données.
from pycaret.datasets import get_data
df = get_data("diabetes")
Pour les problèmes de régression
from pycaret.regression import *
Pour les problèmes de classification
from pycaret.classification import *
setup () effectue le codage des données de catégorie, le traitement des valeurs manquantes et le fractionnement des données (train_test_split). Spécifiez la cible avec target =.
experiment = setup(df, target="Class variable")
Vous pouvez comparer des modèles simplement en procédant comme suit: C'est pratique. k-fold vaut 10 par défaut. Vous pouvez spécifier le nombre de plis.
compare_models()
Il met en évidence les meilleurs résultats en jaune.
Ceci est également facile et peut être modélisé en une ligne ci-dessous.
model = create_model("ada")
Cette fois, j'ai choisi Ada Boost Classifier.
Le réglage est aussi une ligne! C'est trop facile.
tuned_model = tune_model("ada")
Vous pouvez également obtenir les paramètres.
tuned_model.get_params
Il peut être évalué, visualisé et interprété dans l'ordre du haut. Vous pouvez obtenir un autre graphique en mettant plot = "boundary" etc. dans plot et interpréter.
evaluate_model(tuned_model)
plot_model(tuned_model)
interpret_model(tuned_model)
model_pred = predict_model(tuned_model)
Il renvoie la valeur prévue pour les données fractionnées.
predictions = predict_model(tuned_model,data=df)
Vous pouvez faire une prédiction avec de nouvelles données avec data =.
J'ai essayé d'utiliser PyCaret à la vitesse la plus rapide
Recommended Posts