――Erstellen Sie Word Cloud mit so wenigen Schritten wie möglich. (Bitte, wenn es ausreicht, um es einmal zu machen)
Library setup Wenn Sie Anaconda haben, ist es an einem solchen Ort in Ordnung?
pip install janome
pip install wordcloud
import pandas as pd
from janome.tokenizer import Tokenizer
import matplotlib.pyplot as plt
from wordcloud import WordCloud
sample.csv
). Obwohl ich csv sage, verwende ich keine Kommas, aber ...sample.csv
Löwe kann ein Panda sein
Nein, das ist nicht der Fall
:
##Daten gelesen
df = pd.read_csv('sample.csv', header=None)
##Gib einen Titel
df.colums = ['sentences']
##Funktionsgruppendefinition
def get_nouns(sentence, noun_list):
for token in t.tokenize(sentence):
split_token = token.part_of_speech.split(',')
##Allgemeine Nomenklatur extrahieren
if split_token[0] == 'Substantiv' and split_token[1] == 'Allgemeines':
noun_list.append(token.surface)
def depict_word_cloud(noun_list):
##Trennen Sie die Elemente der Nasenliste durch Leerzeichen(word_Cloud-Spezifikationen)
noun_space = ' '.join(map(str, noun_list))
##Wortwolkeneinstellungen(Schriftarteinstellungen)
wc = WordCloud(background_color="white", font_path=r"C:/WINDOWS/Fonts/msgothic.ttc", width=300,height=300)
wc.generate(noun_space)
##Festlegen der Größe des Ausgabebilds
plt.figure(figsize=(5,5))
##Skala löschen
plt.tick_params(labelbottom=False,
labelleft=False,
labelright=False,
labeltop=False,
length=0)
##Anzeige der Wortwolke
plt.imshow(wc)
plt.show()
##Vorbereitung für die morphologische Analyse
t = Tokenizer()
noun_list = []
for sentence in list(df['sentences']):
get_nouns(sentence, noun_list)
depict_word_cloud(noun_list)
Erfolg, wenn dies passiert: