[PYTHON] Introduction de scikit-Optimize

Cet article est l'article du 17e jour du Calendrier de l'Avent de l'apprentissage automatique 2016.

Cette fois, je voudrais présenter une bibliothèque appelée scikit-Optimize qui peut estimer les paramètres qui minimisent la fonction de boîte noire.

page officielle scikit-Optimize (https://scikit-optimize.github.io/)
page github (https://github.com/scikit-optimize/scikit-optimize)

Installation

L'environnement testé cette fois est le suivant.

Environnement d'exécution: MacOS Sierra
Python 3.5.2

L'installation est facile à partir de pip.

pip install scikit-optimize

Example

Démarrer dans README.md sur github est une fonction avec du bruit ajouté. Ce serait bien de connaître la fonction, mais en réalité, la fonction peut être inconnue. Si la fonction ne connaît pas la fonction mais peut évaluer le point de données x dans un tel cas, le x à minimiser peut être obtenu en utilisant une méthode appelée optimisation bayésienne.

import numpy as np
from skopt import gp_minimize

def f(x):
    return (np.sin(5 * x[0]) * (1 - np.tanh(x[0] ** 2)) * np.random.randn() * 0.1)

res = gp_minimize(f, [(-2.0, 2.0)])

Ce res a les variables suivantes.

fun: valeur minimale de f (x)
func_vals: La valeur de f (x) obtenue à chaque essai

fun = min(func_vals)

modèles: modèles utilisés dans chaque essai
random_state: seed
espace: plage recherchée (espace)
spécifications: Liste des paramètres
x: la valeur minimale de x
x_iters: la valeur de x évaluée dans chaque essai

For Machine Learning

En parlant d'apprentissage automatique (en particulier d'apprentissage supervisé), le but est de construire un modèle à partir d'un ensemble de données et d'améliorer les performances de prédiction pour des données inconnues. À ce moment-là, l'apprentissage automatique évalue le modèle à l'aide du test croisé et de divers index d'évaluation. De plus, si vous souhaitez créer un modèle plus performant, le réglage des hyper paramètres est indispensable. Cette fois, je vais essayer de régler cet hyper paramètre en utilisant skopt.

Préparation

Déterminez le modèle de données et d'apprentissage automatique. Cette page a également un exemple, mais comme c'est un gros problème, je vais essayer un modèle légèrement différent.

Données: breast_cancer
Modèle: GradientBoostedTreeClassifier (scikit-learn)
Évaluation: AUC

procédure

Préparez les données et le modèle.

from sklearn.datasets import load_breast_cancer
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.model_selection import cross_val_score

data = load_breast_cancer()
X, y = data.data, data.target
n_features = len(X)
model = GradientBoostingClassifier

Définissez une fonction de boîte noire.

def objective(params):
    max_depth, lr, max_features, min_samples_split, min_samples_leaf = params
    
    model.set_params(max_depth=max_depth,
                     max_features=max_features,
                     learning_rate=lr,
                     min_samples_split=min_samples_split,
                     min_samples_leaf=min_samples_leaf)
    
    # gp_Étant donné que minimiser ne peut être minimisé, il est nécessaire d'utiliser une valeur négative pour un index qui indique que plus les performances sont élevées, plus les performances sont élevées.
    return -np.mean(cross_val_score(model, X, y, cv=5, scoring='roc_auc'))

Déterminez la plage de recherche (espace) du paramètre.

space  = [(1, 5), (10**-5, 10**-1, "log-uniform"), (1, n_features), (2, 30), (1, 30)]

Déterminez la valeur initiale de la recherche.

x0 = [3, 0.01, 6, 2, 1]

Utilisez gp_minimize pour estimer les hyperparamètres à minimiser.

res = gp_minimize(objective, space, x0=x0, n_calls=50)

print(res.fun) # -0.993707074488
print(res.x)   # [5, 0.096319962593215167, 1, 30, 22]

De cette façon, nous avons pu trouver les hyper paramètres optimaux. Au fait, avec cet ensemble de données, le temps requis pour gp_minimize était de 17 [s].

Others

Le site officiel a quelques échantillons autres que ceux décrits ci-dessus.

Bayesian optimization
Hyperparameter optimization
Store and load results
Strategy comparison
Visualizing results