Essayez-le avec JupyterLab en Python japonais Word Cloud.


#Essayez-le avec JupyterLab en Python japonais Word Cloud.

#HP principal que j'ai utilisé comme référence
# https://github.com/amueller/word_cloud/blob/master/examples/masked.py
# https://note.nkmk.me/python-janome-tutorial/
# https://quest.signate.jp/quests/10031 "Dojo de prétraitement des données"

from os import path
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import os
from wordcloud import WordCloud, STOPWORDS


#Installez "re" pour utiliser le remplacement
import re

# get data directory (using getcwd() is needed to support running example in generated IPython notebook)
d = path.dirname(__file__) if "__file__" in locals() else os.getcwd()


#----
#Utilisez "janome" car il ne peut être introduit qu'avec pip. Utilisé pour extraire uniquement la nomenclature des chaînes de caractères
from janome.tokenizer import Tokenizer

text_wakati = open(path.join(d, 'chumonno_oi_ryoriten.txt'), encoding='shift_jis').read()
t = Tokenizer()

s = text_wakati

print(type(t.tokenize(s)))

text_wakati=[token.surface for token in t.tokenize(s)
       if token.part_of_speech.startswith('nom')]

text_wakati =" ".join(map(str, text_wakati))

#Le mot «abaissement» est reconnu comme une nomenclature. Excluez-le car il est reconnu comme un caractère fréquent.
text_wakati = re.sub("Personnage", ' ', text_wakati)
text_wakati = re.sub("Inférieur", ' ', text_wakati)
text_wakati = re.sub("ici", ' ', text_wakati)

#Décrit pour confirmer la chaîne de caractères générée. Enfin, faites un commentaire pour éliminer l'influence.
#print(text_wakati)

# read the mask image
# taken from
alice_mask = np.array(Image.open(path.join(d, "alice_mask.png ")))

stopwords = set(STOPWORDS)
stopwords.add("said")
font_patha_a = 'gomarice_mukasi_mukasi.ttf'


#Si une police qui peut afficher le japonais ne peut pas être utilisée, elle sera écrite comme □□□□.
#Puisque j'utilise Python installé par docker cette fois, il était gênant de mettre la police dans le dossier, alors placez le fichier de police dans la même hiérarchie.
#「font_path=font_patha_Ajout de "a".
wc = WordCloud(background_color="white", max_words=2000, mask=alice_mask,
               stopwords=stopwords, contour_width=3, contour_color='steelblue',font_path=font_patha_a)

# generate word cloud
wc.generate(text_wakati)

# store to file
wc.to_file(path.join(d, "alice.png "))

# show
plt.imshow(wc, interpolation='bilinear')
plt.axis("off")
plt.figure()
plt.imshow(alice_mask, cmap=plt.cm.gray, interpolation='bilinear')
plt.axis("off")
plt.show()



#Préparation préalable
#Préparez «fichier texte», «fichier image» et «fichier de police» dans le même calque

#Principaux changements avec l'échantillon
#Fichier texte: Utilise les données des restaurants avec de nombreuses commandes de "Aozora Bunko" Nom enregistré "chumonno"_oi_ryoriten.txt "Placé dans la même hiérarchie.
#import re: Utilisé pour remplacer les chaînes de caractères
#Classification des caractères: utilisez "janome" car il ne peut être introduit qu'avec pip. Utilisé pour extraire uniquement la nomenclature de la chaîne de caractères

#<Police> (Je pensais que cela était dû à docker, donc je ne regardais que les articles prenant en charge le japonais ... Le résultat semble être □□□ à cause de la police.)(gomarice_mukasi_mukasi.Des polices gratuites sont disponibles pour ttf.)

#Si une police qui peut afficher le japonais ne peut pas être utilisée, elle sera écrite comme □□□□.
#Puisque j'utilise Python installé par docker cette fois, il était gênant de mettre la police dans le dossier, alors placez le fichier de police dans la même hiérarchie.
#「font_path=font_patha_Ajout de "a".

download.png

mozi.png

Recommended Posts

Essayez-le avec JupyterLab en Python japonais Word Cloud.
Essayez d'utiliser Python avec Google Cloud Functions
Text mining avec Python ② Visualisation avec Word Cloud
Essayez de gratter avec Python.
WEB grattage avec python et essayez de créer un nuage de mots à partir des critiques
Essayez facilement Amazon EMR / Cloud Dataproc avec Python [mrjob]
Installez le sélénium sur votre Mac et essayez-le avec python
Envoyer du courrier japonais avec Python3
Web scraping avec python + JupyterLab
Essayez la sortie Python avec Haxe 3.2
Analyse morphologique japonaise avec Python
Essayez d'exécuter Python avec Try Jupyter
Essayez la reconnaissance faciale avec Python
C'est Halloween donc je vais essayer de le cacher avec Python
Essayez de gratter avec Python + Beautiful Soup
[Package cloud] Gérez les packages python avec le package cloud
Essayez d'exploiter Facebook avec Python
Essayez la décomposition de valeurs singulières avec Python
Exécutez XGBoost avec Cloud Dataflow (Python)
Essayez la reconnaissance faciale avec python + OpenCV
Parlez du texte japonais avec OpenJTalk + python
Essayez la simulation de contrôle de fréquence avec Python
Visualisez la fréquence des occurrences de mots dans les phrases avec Word Cloud. [Python]
Essayez de reproduire un film couleur avec Python
Essayez une formule utilisant Σ avec python
Essayez de travailler avec des données binaires en Python
Générer des données de test japonais avec Python Faker
Essayez Python
Téléchargez les données de cours des actions japonaises avec Python
Remarques sur la réalisation de l'OCR japonais avec Python
3. Traitement du langage naturel par Python 1-1. Word N-gram
Comment afficher le japonais python avec lolipop
[GCP] Exploitez Google Cloud Storage avec Python
[Python] Rendons matplotlib compatible avec le japonais
Créer un compteur de fréquence de mots avec Python 3.4
Essayez le scraping HTML avec la bibliothèque Python
Essayez d'appeler Python depuis Ruby avec une économie
Comment entrer le japonais avec les malédictions Python
[Automation] Lire des documents Word avec Python
Créez une application de mots anglais avec python
Essayez de dessiner une carte avec python + cartopy 0.18.0
[Suite] Essayez l'accès au registre PLC avec Python
Essayez d'attribuer ou de changer avec Python: lambda
[Pour les débutants] Essayez le web scraping avec Python
nginxparser: essayez d'analyser le fichier de configuration nginx avec Python
Extraction de texte avec l'API GCP Cloud Vision (Python3.6)
Essayez d'exécuter Google Chrome avec Python et Selenium
Quand j'essaye matplotlib en Python, il dit 'cairo.Context'
Essayez de résoudre le diagramme homme-machine avec Python
Essayez de dessiner une courbe de vie avec python
Essayez de créer un code de "décryptage" en Python
Essayez de générer automatiquement des documents Python avec Sphinx
Gérer les fichiers zip avec des noms de fichiers japonais dans Python 3
Créer une image avec des caractères avec python (japonais)
Essayez de travailler avec Mongo en Python sur Mac
[Python3] [Ubuntu16] [Docker] Essayez la reconnaissance faciale avec OpenFace
Essayez de créer un groupe de dièdre avec Python
Extraire le zip avec Python (prend en charge les noms de fichiers japonais)
[Python] Comment gérer les caractères japonais avec openCV
Utilisez Python / Django avec Windows Azure Cloud Service!