Probieren Sie es mit Word Cloud Japanese Python JupyterLab.


#Probieren Sie es mit Word Cloud Japanese Python JupyterLab.

#Haupt-HP, die ich als Referenz verwendet habe
# https://github.com/amueller/word_cloud/blob/master/examples/masked.py
# https://note.nkmk.me/python-janome-tutorial/
# https://quest.signate.jp/quests/10031 "Dojo zur Datenvorverarbeitung"

from os import path
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import os
from wordcloud import WordCloud, STOPWORDS


#Installieren Sie "re", um den Ersatz zu verwenden
import re

# get data directory (using getcwd() is needed to support running example in generated IPython notebook)
d = path.dirname(__file__) if "__file__" in locals() else os.getcwd()


#----
#Verwenden Sie "janome", da es nur mit pip eingeführt werden kann. Wird verwendet, um nur die Nomenklatur aus Zeichenketten zu extrahieren
from janome.tokenizer import Tokenizer

text_wakati = open(path.join(d, 'chumonno_oi_ryoriten.txt'), encoding='shift_jis').read()
t = Tokenizer()

s = text_wakati

print(type(t.tokenize(s)))

text_wakati=[token.surface for token in t.tokenize(s)
       if token.part_of_speech.startswith('Substantiv')]

text_wakati =" ".join(map(str, text_wakati))

#Das Wort "Absenken" wird als Nomenklatur anerkannt. Schließen Sie es aus, da es als häufiges Zeichen erkannt wird.
text_wakati = re.sub("Charakter", ' ', text_wakati)
text_wakati = re.sub("Niedriger", ' ', text_wakati)
text_wakati = re.sub("Hier", ' ', text_wakati)

#Beschrieben, um die generierte Zeichenfolge zu bestätigen. Machen Sie abschließend einen Kommentar, um den Einfluss zu beseitigen.
#print(text_wakati)

# read the mask image
# taken from
alice_mask = np.array(Image.open(path.join(d, "alice_mask.png ")))

stopwords = set(STOPWORDS)
stopwords.add("said")
font_patha_a = 'gomarice_mukasi_mukasi.ttf'


#Wenn eine Schriftart, die Japanisch anzeigen kann, nicht verwendet werden kann, wird sie als □□□□ geschrieben.
#Da ich dieses Mal Python verwende, das von Docker installiert wurde, war es schwierig, die Schriftart in den Ordner zu legen. Platzieren Sie die Schriftartdatei also in derselben Hierarchie.
#「font_path=font_patha_"A" hinzugefügt.
wc = WordCloud(background_color="white", max_words=2000, mask=alice_mask,
               stopwords=stopwords, contour_width=3, contour_color='steelblue',font_path=font_patha_a)

# generate word cloud
wc.generate(text_wakati)

# store to file
wc.to_file(path.join(d, "alice.png "))

# show
plt.imshow(wc, interpolation='bilinear')
plt.axis("off")
plt.figure()
plt.imshow(alice_mask, cmap=plt.cm.gray, interpolation='bilinear')
plt.axis("off")
plt.show()



#Vorbereitungen
#Bereiten Sie "Textdatei", "Bilddatei" und "Schriftdatei" in derselben Ebene vor

#Hauptänderungen mit der Probe
#Textdatei: Verwendet Daten aus Restaurants mit vielen Bestellungen von "Aozora Bunko". Gespeicherter Name "chumonno"_oi_ryoriten.txt "In dieselbe Hierarchie gestellt.
#import re: Wird verwendet, um Zeichenfolgen zu ersetzen
#Zeichenklassifizierung: Verwenden Sie "janome", da es nur mit pip eingeführt werden kann. Wird verwendet, um nur die Nomenklatur aus der Zeichenfolge zu extrahieren

#<Font> (Ich dachte, es wurde von Docker verursacht, also habe ich mir nur Artikel angesehen, die Japanisch unterstützen ... Das Ergebnis scheint □□□ aufgrund der Schriftart zu sein.)(gomarice_mukasi_mukasi.Für ttf stehen kostenlose Schriftarten zur Verfügung.)

#Wenn eine Schriftart, die Japanisch anzeigen kann, nicht verwendet werden kann, wird sie als □□□□ geschrieben.
#Da ich dieses Mal Python verwende, das von Docker installiert wurde, war es schwierig, die Schriftart in den Ordner zu legen. Platzieren Sie die Schriftartdatei also in derselben Hierarchie.
#「font_path=font_patha_"A" hinzugefügt.

download.png

mozi.png

Recommended Posts

Probieren Sie es mit Word Cloud Japanese Python JupyterLab.
Versuchen Sie, Python mit Google Cloud-Funktionen zu verwenden
Text Mining mit Python ② Visualisierung mit Word Cloud
Versuchen Sie es mit Python.
WEB Scraping mit Python und versuchen, aus Bewertungen eine Wortwolke zu machen
Probieren Sie einfach Amazon EMR / Cloud Dataproc mit Python aus [mrjob]
Installieren Sie Selenium auf Ihrem Mac und probieren Sie es mit Python aus
Senden Sie japanische Post mit Python3
Web Scraping mit Python + JupyterLab
Probieren Sie die Python-Ausgabe mit Haxe 3.2 aus
Japanische morphologische Analyse mit Python
Versuchen Sie, Python mit Try Jupyter auszuführen
Versuchen Sie die Gesichtserkennung mit Python
Es ist Halloween, also werde ich versuchen, es mit Python zu verstecken
Versuchen Sie es mit Python + Beautiful Soup
[Paketwolke] Verwalten Sie Python-Pakete mit der Paketwolke
Versuchen Sie, Facebook mit Python zu betreiben
Versuchen Sie die Singularwertzerlegung mit Python
Führen Sie XGBoost mit Cloud Dataflow (Python) aus.
Versuchen Sie die Gesichtserkennung mit Python + OpenCV
Sprechen Sie japanischen Text mit OpenJTalk + Python
Versuchen Sie die Frequenzsteuerungssimulation mit Python
Visualisieren Sie die Häufigkeit von Wortvorkommen in Sätzen mit Word Cloud. [Python]
Versuchen Sie, Farbfilme mit Python zu reproduzieren
Versuchen Sie eine Formel mit Σ mit Python
Versuchen Sie, mit Binärdaten in Python zu arbeiten
Generieren Sie japanische Testdaten mit Python faker
Versuchen Sie Python
Laden Sie japanische Aktienkursdaten mit Python herunter
Hinweise zur japanischen OCR mit Python
3. Verarbeitung natürlicher Sprache durch Python 1-1. Word N-Gramm
So zeigen Sie Python-Japanisch mit Lolipop an
[GCP] Betreiben Sie Google Cloud Storage mit Python
[Python] Lassen Sie uns matplotlib mit Japanisch kompatibel machen
Erstellen Sie mit Python 3.4 einen Worthäufigkeitszähler
Versuchen Sie HTML-Scraping mit der Python-Bibliothek
Versuchen Sie, Python von Ruby aus mit Sparsamkeit aufzurufen
Wie man mit Python-Flüchen Japanisch eingibt
[Automatisierung] Lesen Sie Word-Dokumente mit Python
Erstellen Sie eine englische Wort-App mit Python
Versuchen Sie, eine Karte mit Python + Cartopy 0.18.0 zu zeichnen
[Fortsetzung] Versuchen Sie den Zugriff auf das SPS-Register mit Python
Versuchen Sie, Python: Lambda zuzuweisen oder zu wechseln
[Für Anfänger] Versuchen Sie Web Scraping mit Python
nginxparser: Versuchen Sie, die nginx-Konfigurationsdatei mit Python zu analysieren
Textextraktion mit GCP Cloud Vision API (Python3.6)
Versuchen Sie, Google Chrome mit Python und Selenium auszuführen
Wenn ich matplotlib in Python versuche, heißt es'cairo.Context '.
Versuchen Sie, das Mensch-Maschine-Diagramm mit Python zu lösen
Versuchen Sie, mit Python eine Lebenskurve zu zeichnen
Versuchen Sie, in Python einen "Entschlüsselungs" -Code zu erstellen
Versuchen Sie, Python-Dokumente automatisch mit Sphinx zu generieren
Behandeln Sie Zip-Dateien mit japanischen Dateinamen in Python 3
Erstellen Sie ein Bild mit Zeichen mit Python (Japanisch)
Versuchen Sie, mit Mongo in Python auf dem Mac zu arbeiten
[Python3] [Ubuntu16] [Docker] Versuchen Sie die Gesichtserkennung mit OpenFace
Versuchen Sie, mit Python eine Diedergruppe zu bilden
Zip mit Python extrahieren (unterstützt japanische Dateinamen)
[Python] Umgang mit japanischen Zeichen mit openCV
Verwenden Sie Python / Django mit dem Windows Azure Cloud Service!