Générez Word Cloud à partir de données de cas d'essai avec python3

--Télécharger les données de cas (PDF) - http://www.courts.go.jp/app/hanrei_jp/search1 --Convertir un PDF en texte à l'aide d'Automator - http://qiita.com/yuki_bg/items/2e6efe93992d83752312

(zsh)


brew install mecab mecab-ipadic
pip3.5 install mecab-python3

pip3.5 install wordcloud
pip3.5 install numpy Pillow matplotlib #Bibliothèques requises pour utiliser wordcloud
#brew install numpy # error
#brew install homebrew/python/numpy # smthngs wrong...
#sudo xcode-select --install # doesnt work...

###Dictionnaire MeCab avec de nouveaux mots ajoutés"mecab-ipadic-neologd"Avoir
cd /usr/local/lib/mecab/dic
git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
./bin/install-mecab-ipadic-neologd -n

wordcloud.py


import MeCab
from os import path
from wordcloud import WordCloud
import matplotlib.pyplot as plt

pos_list = [10, 11, 31, 32, 34]
pos_list.extend(list(range(36,50)))
pos_list.extend([59, 60, 62, 67])
def create_mecab_list(text):
	mecab_list = []
	mecab = MeCab.Tagger("-Ochasen -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd")
	mecab.parse("")
	# encoding = text.encode('utf-8')
	node = mecab.parseToNode(text)
	while node:
		if len(node.surface) > 1:
			if node.posid in pos_list:
				morpheme = node.surface
				mecab_list.append(morpheme)
		node = node.next
	return mecab_list

with open("./086064_hanrei_utf8.txt", "r") as file:
	hanrei = file.read()

string = " ".join(create_mecab_list(hanrei))#.decode("utf-8")


fpath = "/Library/Fonts/Hiragino Marugo ProN W4.ttc"
wordcloud = WordCloud(
	# background_color="white",
	max_font_size=40,
	relative_scaling=.5,
	# width=900,
	# height=500,
	font_path=fpath
	).generate(string)
plt.figure()
plt.imshow(wordcloud)
plt.axis("off")
plt.show()

(zsh)


python3 wordcloud.py

Screen Shot 2016-10-01 at 1.51.19 AM.png

Recommended Posts

Générez Word Cloud à partir de données de cas d'essai avec python3
Obtenir des données de Quandl en Python
Module pour générer le mot N-gramme en Python
Générer une classe à partir d'une chaîne en Python
Générer un langage C à partir d'une expression S avec Python
Obtenez des données de séries chronologiques de k-db.com avec Python
Séparer les chaînes de cas de chameau mot par mot en Python
classe de cas en python
Recevez des données de dictionnaire à partir de programmes Python avec AppleScript
Obtenez des données du module GPS à 10 Hz avec Python
Gérer les données ambiantes en Python
Générer une vignette arrondie en Python
Afficher les données UTM-30LX en Python
Générer du code QR en Python
Générez 8 * 8 (64) cubes avec Blender Python
Appuyez sur REST en Python pour obtenir des données de New Relic
Obtenez des données LeapMotion en Python.
Python: exclure les balises des données html
[Python] Générer un code QR en mémoire
Lire les données des tampons de protocole avec Python3
Frappez les données du trésor de Python Pandas
Publier un message d'IBM Cloud Functions sur Slack en Python
Gérez les données au format NetCDF avec Python
Extraire du texte d'images avec Python
Hashing de données en R et Python
Visualisez la fréquence des occurrences de mots dans les phrases avec Word Cloud. [Python]
Extraction d'éléments conditionnels à partir du bloc de données: R est% en%, Python est .isin ()
La loi des nombres en python
Extraire des chaînes de fichiers avec Python
Détectez les caractères japonais à partir d'images à l'aide de l'API Cloud Vision de Google avec Python
Copier des données d'Amazon S3 vers Google Cloud Storage avec Python (boto)
Exemple d'opération d'objet Cloud Pak for Data en Python (client WML, project_lib)
Générer une collection de première classe en Python
Obtenez des données supplémentaires vers LDAP avec python
Exécutez Cloud Dataflow (Python) depuis AppEngine
Recevoir des données textuelles de mysql avec python
Obtenez des taux de change à partir des taux de change ouverts en Python
[Note] Obtenir des données de PostgreSQL avec Python
Entrée / sortie de données en Python (CSV, JSON)
Générer une URL signée AWS-S3 (limitée dans le temps) en Python
Livre Ali en python: Sec.2-4, structure de données
Utiliser le type de données PostgreSQL (jsonb) à partir de Python
Python: lecture de données JSON à partir de l'API Web
Essayez de travailler avec des données binaires en Python
Relancé de "pas d'accès Internet" en Python
Empêcher le double lancement de cron en Python
Générer des données de test japonais avec Python Faker
Obtenez les données de l'API Google Fit en Python
Générer automatiquement un commentaire de chaîne de document Python avec Emacs
Utiliser l'API Google Cloud Vision de Python
[Python] Application Web à partir de 0! Pratique (4) - Mise en forme des données-
Télécharger des images à partir de la liste d'URL en Python
Obtenez le niveau de la batterie de SwitchBot avec Python
Représentez facilement des données graphiques dans le shell et Python
Comment changer de version de Python dans cloud9
Text mining avec Python ② Visualisation avec Word Cloud
Python: prétraitement dans l'apprentissage automatique: conversion de données
Convertir de Markdown en HTML en Python
Obtenez la probabilité de précipitation de XML avec Python
Obtenez Cloud Logging disponible en Python en 10 minutes