Visualisieren Sie den Entscheidungsbaum mit einem Jupyter-Notizbuch
import numpy as np
import pydotplus
from sklearn.feature_extraction.text import TfidfVectorizer
from IPython import display
from sklearn import tree
from io import StringIO
from operator import itemgetter
%matplotlib inline
%load_ext autoreload
%autoreload 2
input_text=np.array([
'Physik Mathematik Japanisch', #Dokument 1
'Pan Reisschokolade', #Dokument 2
'Gebäude Wohnung Wohnung', #Dokument 3
'Hokkaido Fukuoka Kanagawa' #Dokument 4
])
#Dokument 1 ist 1
#Dokument 2 ist 2
#Dokument 3 ist 3
#Dokument 4 ist 4
target_data = np.array([
1,2,3,4
])
#Dokument tf-In IDF-Vektor konvertieren
vectorizer=TfidfVectorizer()
input_data=vectorizer.fit_transform(input_text)
np.set_printoptions(precision=2) #Ändern Sie die Anzahl der gültigen Anzeigestellen in 2 Ziffern
print(input_data.toarray())
#Generieren Sie ein Entscheidungsbaummodell
model = tree.DecisionTreeClassifier(max_depth=5)
model = model.fit(input_data, target_data)
model.predict(input_data)
feature_names = list(map(itemgetter(0),
sorted(vectorizer.vocabulary_.items(), key=itemgetter(1))))
data = StringIO()
tree.export_graphviz(model, out_file=data, feature_names=feature_names)
graph = pydotplus.graph_from_dot_data(data.getvalue())
display.display(display.Image(graph.create_png()))
Es sieht aus wie das. Es fühlt sich gut an, die Gini zählen zu sehen!
Recommended Posts