Generieren Sie Word Cloud aus Testfalldaten mit Python3

(zsh)


brew install mecab mecab-ipadic
pip3.5 install mecab-python3

pip3.5 install wordcloud
pip3.5 install numpy Pillow matplotlib #Für die Verwendung von wordcloud erforderliche Bibliotheken
#brew install numpy # error
#brew install homebrew/python/numpy # smthngs wrong...
#sudo xcode-select --install # doesnt work...

###MeCab-Wörterbuch mit neuen Wörtern hinzugefügt"mecab-ipadic-neologd"Erhalten
cd /usr/local/lib/mecab/dic
git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
./bin/install-mecab-ipadic-neologd -n

wordcloud.py


import MeCab
from os import path
from wordcloud import WordCloud
import matplotlib.pyplot as plt

pos_list = [10, 11, 31, 32, 34]
pos_list.extend(list(range(36,50)))
pos_list.extend([59, 60, 62, 67])
def create_mecab_list(text):
	mecab_list = []
	mecab = MeCab.Tagger("-Ochasen -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd")
	mecab.parse("")
	# encoding = text.encode('utf-8')
	node = mecab.parseToNode(text)
	while node:
		if len(node.surface) > 1:
			if node.posid in pos_list:
				morpheme = node.surface
				mecab_list.append(morpheme)
		node = node.next
	return mecab_list

with open("./086064_hanrei_utf8.txt", "r") as file:
	hanrei = file.read()

string = " ".join(create_mecab_list(hanrei))#.decode("utf-8")


fpath = "/Library/Fonts/Hiragino Marugo ProN W4.ttc"
wordcloud = WordCloud(
	# background_color="white",
	max_font_size=40,
	relative_scaling=.5,
	# width=900,
	# height=500,
	font_path=fpath
	).generate(string)
plt.figure()
plt.imshow(wordcloud)
plt.axis("off")
plt.show()

(zsh)


python3 wordcloud.py

Screen Shot 2016-10-01 at 1.51.19 AM.png

Recommended Posts

Generieren Sie Word Cloud aus Testfalldaten mit Python3
Modul zum Generieren des Wortes N-Gramm in Python
Generieren Sie eine Klasse aus einer Zeichenfolge in Python
Generieren Sie mit Python eine C-Sprache aus dem S-Ausdruck
Holen Sie sich mit Python Zeitreihendaten von k-db.com
Teilen Sie Kamelfallzeichenfolgen in Python Wort für Wort
Fallklasse in Python
Empfangen Sie Wörterbuchdaten von Python-Programmen mit AppleScript
Holen Sie sich mit Python Daten vom GPS-Modul mit 10 Hz
Behandeln Sie Umgebungsdaten in Python
Generieren Sie in Python ein abgerundetes Miniaturbild
Zeigen Sie UTM-30LX-Daten in Python an
Generieren Sie QR-Code in Python
Generieren Sie 8 * 8 (64) Cubes mit Blender Python
Drücken Sie in Python auf REST, um Daten von New Relic abzurufen
Holen Sie sich LeapMotion-Daten in Python.
Python: Tags von HTML-Daten ausschließen
[Python] Generiert QR-Code im Speicher
Lesen Sie die Protokollpufferdaten mit Python3
Hit Schatzdaten von Python Pandas
Senden Sie eine Nachricht von IBM Cloud Functions an Slack in Python
Behandeln Sie Daten im NetCDF-Format mit Python
Extrahieren Sie mit Python Text aus Bildern
Hashing von Daten in R und Python
Visualisieren Sie die Häufigkeit von Wortvorkommen in Sätzen mit Word Cloud. [Python]
Bedingte Elementextraktion aus dem Datenrahmen: R ist% in%, Python ist .isin ()
Das Gesetz der Zahlen in Python
Extrahieren Sie mit Python Zeichenfolgen aus Dateien
Erkennen Sie japanische Zeichen anhand von Bildern mithilfe der Cloud Vision-API von Google mit Python
Kopieren Sie Daten von Amazon S3 mit Python (boto) in Google Cloud Storage.
Beispiel für den Betrieb eines Cloud Pak for Data-Objekts in Python (WML-Client, project_lib)
Generieren Sie eine erstklassige Sammlung in Python
Holen Sie sich mit Python zusätzliche Daten zu LDAP
Führen Sie Cloud Dataflow (Python) über AppEngine aus
Empfangen Sie Textdaten von MySQL mit Python
Erhalten Sie Wechselkurse von offenen Wechselkursen in Python
[Hinweis] Mit Python Daten von PostgreSQL abrufen
Dateneingabe / -ausgabe in Python (CSV, JSON)
Generieren Sie eine AWS-S3-signierte (zeitlich begrenzte) URL in Python
Ali Buch in Python: Abschnitt 2-4, Datenstruktur
Verwenden Sie den PostgreSQL-Datentyp (jsonb) von Python
Python: Lesen von JSON-Daten von der Web-API
Versuchen Sie, mit Binärdaten in Python zu arbeiten
Wiederbelebt von "kein Internetzugang" in Python
Verhindern Sie den doppelten Start von cron in Python
Generieren Sie japanische Testdaten mit Python faker
Holen Sie sich Google Fit API-Daten in Python
Python Docstring-Kommentar automatisch mit Emacs generieren
Verwenden Sie die Google Cloud Vision-API von Python
[Python] Webanwendung von 0! Hands-on (4) -Datenformung-
Laden Sie Bilder von der URL-Liste in Python herunter
Holen Sie sich den Batteriestand von SwitchBot mit Python
Zeichnen Sie Daten einfach in Shell und Python
So wechseln Sie die Python-Version in Cloud9
Text Mining mit Python ② Visualisierung mit Word Cloud
Python: Vorverarbeitung beim maschinellen Lernen: Datenkonvertierung
In Python von Markdown in HTML konvertieren
Holen Sie sich mit Python die Niederschlagswahrscheinlichkeit aus XML
Holen Sie sich die Cloud-Protokollierung in Python in 10 Minuten