[PYTHON] Ich habe mit Wordcloud gespielt!

Einführung

Ich habe mich für Wordcloud entschieden und es als Memorandum veröffentlicht

Wenn Sie "Was ist Mecab?" Fragen, klicken Sie bitte [hier] 1, da Mecab verwendet wird.

Ich habe versucht, von der Installation von Wordcloud bis zur Bildausgabe zusammenzufassen

Die Artikelbeschreibung lautet wie folgt

Welche Geschichte ist das?

Da es eine große Sache ist, werde ich das Problem ausgeben, das von wordcloud ausgegeben wird (lacht)

wordcloud.png

Ich werde die Antwort in ** Fazit ** schreiben!

Was ist Wortwolke?

Eine Methode zum Auswählen mehrerer Wörter, die häufig in einem Satz vorkommen, und Anzeigen in einer Größe entsprechend der Häufigkeit.

Der Beamte ist [hier] 2

Die Installation kann sofort durch Installation mit Pip usw. verwendet werden.

pip install wordcloud

Ich habe es tatsächlich bewegt

Ich denke, es ist schneller, Bilder zu erklären, deshalb habe ich versucht, sie sofort zu verschieben Die hier verwendete Geschichte ist "Rotkäppchen"

Programm

import MeCab

from wordcloud import WordCloud

FILE_NAME = "sample.txt"

with open(FILE_NAME, "r", encoding="utf-8") as f:
    CONTENT = f.read()

tagger = MeCab.Tagger("-Owakati")
parse = tagger.parse(CONTENT)

wordcloud = WordCloud()
wordcloud.generate(CONTENT)
wordcloud.to_file("wordcloud.png ")

wordcloud = WordCloud()

Wortwolkenobjekt zum Erzeugen und Zeichnen

wordcloud.generate ("string")

Erstellen Sie eine Wortwolke aus Text (Zeichenfolge)

wordcloud.to_file ("Fotoname")

In Bilddatei exportieren

Mit den obigen Schritten wird ein Wordcloud-Bild erstellt

Bild

wordcloud.png

In der Wortwolke werden häufig verwendete Wörter in großer Größe angezeigt

Beachten Sie jedoch, dass ** Ein-Buchstaben-Wörter ** wie A und ich nicht angezeigt werden!

Es ist zu sehen, dass Großmutter, Rotkäppchen und Rotreiten häufig in "Rotreiten" verwendet werden.

Verschiedene Einstellungen

Sie können in WordCloud Einstellungen hinzufügen, z. B. Hintergründe und Zeichenbeschränkungen

Hier sind einige der Einstellungen, die Sie am häufigsten verwenden.

parameter Standard Erläuterung
width 400 Breite
height 200 Vertikale Breite
background_color "black" Hintergrundfarbe
colormap None Buchstabenfarbe
collocations True Gemeinsame Sprache
stopwords None Auszuschließende Wörter (Liste)
max_words 200 Maximale Anzahl der anzuzeigenden Wörter
regexp r"\w[\w']+" Regulärer Ausdruck des angezeigten Zeichens

Ich möchte die Größe des Bildes ändern

Das vorherige Bild ist etwas klein (weil es für Qiita ist)

Wenn Sie versuchen, 1080 vertikal und 1920 horizontal festzulegen, was auch der Größe des Desktops entspricht, sieht es wie folgt aus

wordcloud = WordCloud(width=1920, height=1080)

Ich möchte die Farbe ändern

Der Hintergrund und die Textfarbe sind schwer zu erkennen ...

Deklarieren Sie die Hintergrundfarbe, die Sie angeben möchten Da es mehrere Bildfarben von Zeichen gibt, deklarieren Sie diese.

Diesmal ist die Hintergrundfarbe weiß und die Bildfarbe der Zeichen ist Sommer.

wordcloud = WordCloud(background_color="white", colormap="summer")

wordcloud.png

Ich möchte ein Wort wie Red Riding auflösen

Auf dem Bildschirm wird häufig "Rot" angezeigt, z. B. "Reiten" und "Rot".

Versuchen Sie also, die Einstellungen wie folgt vorzunehmen Sehr praktisch, da Sie eine Kombination von Wörtern als separate Wörter beurteilen können

wordcloud = WordCloud(background_color="white", colormap="summer", collocations=False)

wordcloud.png

Ich möchte keinen bestimmten Charakter anzeigen

Es macht nicht viel Sinn, Wörter wie "the, and, to" auf wordcloud zu setzen

Wenn Sie diese Wörter nicht anzeigen möchten, können Sie sie mithilfe eines Arrays wie folgt deklarieren. (Versuchen Sie diesmal aus Gründen der Klarheit, ["Little", "Großmutter"] nicht anzuzeigen.)

wordcloud = WordCloud(background_color="white", colormap="summer", collocations=False, stopwords=["Little", "grandmother"])

wordcloud.png

Ich möchte die Anzahl der Zeichen begrenzen, die angezeigt werden können

wordcloud ist standardmäßig auf 200 Zeichen eingestellt Sie können festlegen, wie viele Zeichen ausgegeben werden sollen, indem Sie die folgenden Einstellungen vornehmen.

wordcloud = WordCloud(background_color="white", colormap="summer", collocations=False, stopwords=["Little", "grandmother"], max_words=10])

wordcloud.png

Wenn Sie dies betrachten, scheint es, dass Sie Daten erhalten können, die gut zu sein scheinen, wenn Sie um [das, und, bis] löschen? ??

Ich möchte auch Wörter mit einem Buchstaben anzeigen

Wie oben erwähnt, kann wordcloud keine Wörter mit einem Buchstaben ausgeben. Durch die Einschränkung mit regulärem Ausdruck können sogar Wörter mit einem oder mehreren Zeichen unterstützt werden.

wordcloud = WordCloud(background_color="white", colormap="summmer", collocations=False, stopwords=["the", "and", "to"], max_words=20, regexp=r"[\w']+")

wordcloud.png

Es ist verständlich, dass ** a ** am häufigsten vorkommt ...

Erzähl mir mehr! Aus [Offiziell] 2

Häufige Fehler auf Japanisch

Wenn Sie mit dem obigen Programm einen japanischen Satz spielen, sehen Sie das folgende Bild ...

wordcloud.png

Dies liegt daran, dass die in Wordcloud verwendete Schriftart kein Japanisch unterstützt.

So können Sie die Schriftart einstellen

Die Schriftarteinstellungen sind wie folgt

FONT_FILE = "C:\Windows\Fonts\MSGOTHIC.TTC" wordcloud = WordCloud(font_path=FONT_FILE, background_color="white", colormap="summer", collocations=False, regexp=r"[\w']+")

e? Warum MS Gothic? ** Ehemaliger Coboler ** Deshalb! (Diejenigen, die verstehen ... denke ich)

Deshalb war die Ausgabe so

wordcloud.png

abschließend

Ich habe die Wortwolke grob zusammengefasst

Die Antwort auf die vorherige Frage lautet übrigens ...

wordcloud.png

** Drei Ferkel **!

Wortwolke ist ein Wort, das oft große Buchstaben hat Das Bild betrachten

little pig house

Die obigen drei sind die Wörter, die oft vorkommen!

Indem Sie es zu einer solchen Wortwolke machen, Es kann auch als Index verwendet werden, z. B. was die Zeichenfolge darstellt (˘ω˘).

Recommended Posts

Ich habe mit Wordcloud gespielt!
Ich habe Wordcloud mit Python gemacht.
Ich habe mit PyQt5 und Python3 gespielt
Ich habe mit Mecab gespielt (morphologische Analyse)!
Ich habe mit DragonRuby GTK (Game Toolkit) gespielt.
[Scikit-learn] Ich habe mit der ROC-Kurve gespielt
[Einführung in Pytorch] Ich habe mit sinGAN ♬ gespielt
[Python] Ich habe mit der Verarbeitung natürlicher Sprache ~ Transformatoren ~ gespielt
Visualisieren Sie 2019 nem mit WordCloud
Ich habe vorerst mit Floydhub gespielt
Ich habe mit Diamond gespielt, einem Tool zum Sammeln von Metriken
Ich habe versucht, mit Python zu kratzen
Ich habe GP mit Numpy geschrieben
Ich habe einen Blackjack mit Python gemacht!
Ich habe versucht, mit PyCaret zu clustern
Ich habe versucht, VQE mit Blueqat zu implementieren
Ich kann nicht mit # google-map suchen. ..
Ich habe den BMI mit tkinter gemessen
Ich habe gRPC mit Python ausprobiert
Ich habe COVID19_simulator mit JupyterLab erstellt
Ich habe versucht, mit Python zu kratzen
Ich habe Word2Vec mit Pytorch gemacht
Ich habe mit Python einen Blackjack gemacht.
[Python] Ich habe versucht, Tweets über Corona mit WordCloud zu visualisieren
pyenv-vertualenv installiert die Python3-Serie nicht gut
Ich habe maschinelles Lernen mit liblinear versucht
Ich habe versucht, WebScraping mit Python.
Ich habe versucht, Essen mit SinGAN zu bewegen
[Einführung in StyleGAN] Ich habe mit "The Life of a Man" ♬ gespielt
Bilder können mit Google_images_download nicht heruntergeladen werden
Aktion, dass MySQL-Connector-Python nicht mit Anaconda installiert werden kann
Ich habe mit Python eine Lotterie gemacht.
Ich habe versucht, Attention Seq2Seq mit PyTorch zu implementieren
Ich habe eine SMS mit Python gesendet
Ich habe versucht, DeepPose mit PyTorch zu implementieren
[Einführung in sinGAN-Tensorflow] Ich habe mit der hochauflösenden "Challenge Big Imayuyu" ♬ gespielt
Ich mochte den Tweet mit Python. ..
Ich habe versucht, das Gesicht mit MTCNN zu erkennen
[Einführung in Matplotlib] Achsen 3D-Animation: Ich habe mit 3D-Lisaju-Figuren gespielt ♬
Ich kann kein Japanisch mit Pyperclip verwenden
Ich habe versucht, alle Bemerkungen von Slack mit Wordcloud (Python) zusammenzufassen.
Ich möchte ○○ mit Pandas machen
Ich konnte Gunicorn mit Fabric nicht zu einem Dämon machen
[Einführung in RasPi4] Ich habe mit "Hiroko / Hiromis giftigem Zungengespräch" gespielt ♪
[Einführung in StyleGAN] Ich habe mit "Eine Frau verwandelt sich in Mayuyu" gespielt ♬
Ich möchte mit Python debuggen
Ich habe versucht, Prolog mit Python 3.8.2 auszuführen.
Ich habe mit Python einen Daemon erstellt
Ich habe die SMTP-Kommunikation mit Python versucht
Ich habe versucht, Sätze mit GPT-2 zu generieren
Ich habe versucht, LightGBM mit Yellowbrick zu lernen
Ich habe versucht, das Gesicht mit OpenCV zu erkennen
[Python] Ich habe versucht, die Nacht der Galaxienbahn mit WordCloud zu visualisieren!
[Einführung in AWS] Ich habe mit Polly und Transcribe male mit Männer- und Frauenstimmen gespielt
[Einführung in StyleGAN] Ich habe mit style_mixing "Frau, die die Brille abnimmt" ♬ gespielt
Ich habe versucht, den Text des Romans "Wetterkind" mit Word Cloud zu visualisieren
Ich erhalte eine Fehlermeldung beim Import von Pandas.
[Einführung in WordCloud] Spielen Sie mit Scraping ♬
Ich möchte Objekte mit OpenCV erkennen