[PYTHON] Un mémorandum de méthode souvent utilisé dans l'apprentissage automatique utilisant scikit-learn (pour les débutants)

introduction

Nous avons résumé les méthodes souvent utilisées lors de l'apprentissage automatique. Nous apporterons des corrections au besoin.

Prétraitement

Standardisation

StandardScaler


from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()  #Création d'instance
scaler.fit(pd_sample)      #Calcul des paramètres (moyenne, écart type, etc.)
pd_sample_sc = scaler.transform(pd_sample)  #Conversion de données

#pd_sample_sc = scaler.fit_transform(pd_sample)Peut être exécuté collectivement avec

Variable muette

get_dummies


#pandas.get_dummies()une fonction
pd_sample = pd.get_dummies(pd_sample)

Division des données de formation / des données d'évaluation

train_test_split


from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y)

Apprendre sans professeur

Clustering

KMeans


from skleran.cluster import KMeans

kmeans = KMeans(n_clusters=4, random_state=0)  #K-signifie la définition du modèle
clusters = kmeans.fit(pd_sample)               #Exécution de clustering
pd_sample['cluster'] = clusters.labels_        #Obtenez des résultats de clustering

Réduction de dimension

PCA


from sklearn.decomposition import PCA

pca = PCA(n_components=2)         #Définition du modèle PCA
pca.fit(pd_sample)                #Analyse des composants principaux
x_pca = pca.transform(pd_sample)  #Conversion de données (la valeur de retour est un objet de type tableau)
x_pca = pd.DataFrame(x_pca)       #Restaurer dans le type DataFrame

#x_pca = pca.fit_transform(pd_sample)Peut être exécuté collectivement avec

Apprendre avec un enseignant

Modèle de régression

LinearRegression


from sklearn.linear_model import LinearRegression()

model = LinearRegreession()  #Initialisation du modèle
model.fit(X_train, y_train)  #La modélisation

#Vérification de l'exactitude des données d'entraînement et des données d'évaluation
print(model.score(X_train, y_train))
print(model.score(X_test, y_test))

#Produit un coefficient représentant le degré de contribution pour chaque variable explicative
coef = pd.DataFrame({"feature_names":X.columns, "coefficient":model.coef_})
print(coef)

#Prédire la valeur de régression pour les données inconnues
print(model.predict(x_pred))

Modèle de classification

DecisionTreeClassifier


from sklearn.tree import DecisionTreeClassifier

model = DecisionTreeClassifier(random_state=0)  #Initialisation du modèle
model.fit(X_train, y_train)                     #La modélisation

#Vérification de l'exactitude des données d'entraînement et des données d'évaluation
print(model.score(X_train, y_train))
print(model.score(X_test, y_test))

#Produit un coefficient représentant le degré de contribution pour chaque variable explicative
importance = pd.DataFrame({"feature_names":X.columns, "coefficient":model.feature_importances_})
print(importance)

#Prédire la valeur de classification pour les données inconnues
print(model.predict(x_pred))

#0/Probabilité de prédiction de sortie de 1
print(model.predict_proba(x_pred))

Vérification du modèle de classification

#Taux de réponse correct= (TP+TN)/(TP+FN+FP+TN)
model.score(X_test, y_test)

#Matrice mixte
from skleran.metrics import confusion_matrix
matrix = confusion_matrix(X_test, y_test)

#Carte thermique de la matrice mixte
import seaborn as sns
sns.heatmap(matrix, annot=True, cmap='Blues')
plt.xlabel('Prediction')
plt.ylabel('Target')
plt.show()

#Taux d'adaptation= TP/(TP+FP)
from sklearn.metrics import precision_score
precision_score(X_test, y_test)

#Rappel= TP/(TP+FN)
from sklearn.metrics import recall_score
recall_score(X_test, y_test)

#Valeur F= 2*(Precision*Recall)/(Precision+Recall)
from sklearn.metrics import f1_score
f1_score(X_test, y_test)

Recommended Posts

Un mémorandum de méthode souvent utilisé dans l'apprentissage automatique utilisant scikit-learn (pour les débutants)
[Apprentissage automatique Python] Recommandation d'utilisation de Spyder pour les débutants (à partir d'août 2020)
Divulgation complète des méthodes utilisées dans l'apprentissage automatique
Résumé des fonctions d'évaluation utilisées dans l'apprentissage automatique
[Pour les débutants] Introduction à la vectorisation dans l'apprentissage automatique
Une collection de code souvent utilisée dans Python personnel
Un mémorandum d'utilisation de eigen3
Un résumé de l'apprentissage automatique Python pour débutant est très concis.
<Pour les débutants> bibliothèque python <Pour l'apprentissage automatique>
Que diriez-vous d'Anaconda pour créer un environnement d'apprentissage automatique avec Python?
Mémorandum of scraping & machine learning [technique de développement] par Python (chapitre 4)
Mémorandum of scraping & machine learning [technique de développement] par Python (chapitre 5)
Prévision du cours des actions à l'aide de l'apprentissage automatique (scikit-learn)
Résumé des méthodes fréquemment utilisées chez les pandas
[Apprentissage automatique] Classification des sujets LDA à l'aide de scikit-learn
Un mémorandum sur l'utilisation de la fonction d'entrée de Python
Premiers pas pour les débutants en apprentissage automatique (IA)
[python] Techniques souvent utilisées dans l'apprentissage automatique
Impressions d'utilisation de Flask pendant un mois
Méthode d'encodage à chaud "utilisable" pour l'apprentissage automatique
[Apprentissage automatique] Liste des packages fréquemment utilisés
Traitement des mémos souvent utilisés dans les pandas (débutants)
Créer un environnement de développement pour l'apprentissage automatique
Collection de conseils Numpy, Pandas souvent utilisés sur le terrain
[Pour les débutants en intelligence artificielle] Parcours d'apprentissage et de référence en apprentissage automatique / programmation en profondeur
Liste des principales distributions de probabilité utilisées en apprentissage automatique et statistiques et code en python
J'ai essayé d'implémenter diverses méthodes d'apprentissage automatique (modèle de prédiction) en utilisant scicit-learn
Création d'un modèle d'estimation de position pour la compétition d'intelligence humaine de loup à l'aide de l'apprentissage automatique
Opérations de base sur les blocs de données écrites par des débutants au cours d'une semaine d'apprentissage de Python
Mémo d'apprentissage automatique d'un ingénieur débutant Partie 1
Une histoire sur l'apprentissage automatique simple avec TensorFlow
Astuces de fourniture de données utilisant deque dans l'apprentissage automatique
Un mémorandum d'étude et de mise en œuvre du Deep Learning
Liste des liens que les débutants en apprentissage automatique apprennent
Vue d'ensemble des techniques d'apprentissage automatique apprises grâce à scikit-learn
[Français] scikit-learn 0.18 Introduction de l'apprentissage automatique par le didacticiel scikit-learn
Mémo d'apprentissage automatique d'un ingénieur débutant Partie 2
Conseils pour utiliser Elastic Search de manière efficace
[Commande Linux] Un mémorandum des commandes fréquemment utilisées
Essayez d'utiliser le bloc-notes Jupyter à partir d'Azure Machine Learning
Histoire de base de l'héritage en Python (pour les débutants)
Raisonnement causal utilisant l'apprentissage automatique (organisation des méthodes de raisonnement causal)
Comment créer un ensemble de données d'image de visage utilisé dans l'apprentissage automatique (2: Analyse d'image de la vidéo pour obtenir des images candidates)
Présentation et fonctionnalités utiles de scikit-learn qui peuvent également être utilisées pour l'apprentissage en profondeur
Code simple qui donne un score de 0,81339 dans Kaggle's Titanic: Machine Learning from Disaster
Mémorandum des commandes, packages, termes, etc. utilisés sous Linux (mis à jour de temps en temps)
[Pour les débutants en apprentissage profond] Implémentation d'une classification binaire simple par couplage complet à l'aide de Keras
Créer un ensemble de données d'images à utiliser pour la formation
[Balisage recommandé dans le machine learning # 2] Extension du script de scraping
[Balisage recommandé dans le machine learning # 2.5] Modification du script de scraping
Mémorandum de méthodes utiles pour organiser les colonnes dans DataFrame
Installation de TensorFlow, une bibliothèque d'apprentissage automatique de Google
À propos des tests dans la mise en œuvre de modèles d'apprentissage automatique
Une collection de commandes fréquemment utilisées dans la gestion des serveurs
[Python] J'ai créé un classificateur pour les iris [Machine learning]
Les débutants en apprentissage automatique essaient de créer un arbre de décision
Méthode d'étude pour apprendre le machine learning à partir de zéro (version mars 2020)
xgboost: modèle d'apprentissage automatique efficace pour les données de table
Tout pour que les débutants puissent faire du machine learning