Dieser Artikel erläutert die Interaktionsfunktionen. Dieser Artikel basiert hauptsächlich auf "Feature Quantity Engineering für maschinelles Lernen". Bitte probieren Sie es aus, wenn Sie werden.
Es ist eine Methode zum Erstellen einer neuen Merkmalsmenge durch Multiplizieren mehrerer Merkmalsmengen. Von diesen wird die Kombination der beiden Merkmale als ** paarweise Interaktionsmerkmale ** bezeichnet. Wenn die Merkmalsmenge binär ist, handelt es sich um ein logisches Produkt. Wenn es beispielsweise Regionen und Altersgruppen als Merkmalsgrößen gibt, können durch Multiplikation der Regionen und Altersgruppen Informationen erhalten werden, die die objektive Variable "20 Jahre in Tokio leben" besser aus den Informationen "20 Jahre" und "in Tokio lebend" ausdrücken können. Sie können es erstellen.
Die Nachteile sind jedoch, dass die Lernkosten steigen und unnötige Funktionen erstellt werden. Dieser Anstieg der Lernkosten und das Problem unnötiger Merkmalsmengen können durch Ausführen einer Merkmalsmengenauswahl gelöst werden.
Angenommen, Sie haben die folgenden Feature-Daten.
Wenn die Menge der Interaktionsmerkmale für diese Daten erstellt wurde, wurde der folgende Datensatz erstellt.
Unten finden Sie Beispielcode, der die Interaktionsfunktionen tatsächlich implementiert.
import numpy as np
import pandas as pd
import sklearn.preprocessing as preproc
##Feste Zufallszahl
np.random.seed(100)
data_array1 = []
for i in range(1, 100):
s = np.random.randint(0, i * 10, 10)
data_array1.extend(s)
##Feste Zufallszahl
np.random.seed(20)
data_array2 = []
for i in range(1, 100):
s = np.random.randint(0, i * 10, 10)
data_array2.extend(s)
data = pd.DataFrame({'A': data_array1, 'B': data_array2})
##Menge der Interaktionsfunktionen
data2 = pd.DataFrame(preproc.PolynomialFeatures(include_bias=False).fit_transform(data))
## interaction_only=Wenn Sie den Wert auf True setzen, können Sie das Quadrat Ihres eigenen Werts ausschließen.
# data2 = preproc.PolynomialFeatures(include_bias=False, interaction_only=True).fit_transform(data)
Ich denke darüber nach, ein Video über IT auf YouTube zu veröffentlichen. Bitte abonnieren Sie den Kanal und geben Sie uns eine hohe Bewertung, da dies Sie motivieren wird, Youtube und Qiita zu aktualisieren. YouTube: https://www.youtube.com/channel/UCywlrxt0nEdJGYtDBPW-peg Twitter: https://twitter.com/tatelabo
Recommended Posts