[PYTHON] Ich habe HaikuFinder berührt

Auslösen

Zunächst scheint es, dass ich aus dem Titel nicht verstehe, aber der Auslöser war, als ich nach dem Python-Modus von [Verarbeitung] suchte (https://www.processing.org/). Es gibt viele Leute, die den Python-Modus erstellen, aber ich schaue oft auf die Website der Person, die den Python-Modus erstellt hat in der Liste der offiziellen Verarbeitungsmodule. Es war. Dann machte er etwas namens Haiku Finder. Deshalb habe ich es berührt. Übrigens, selbst wenn Sie Haiku sagen, scheinen Sie die Anzahl der Silben auf Englisch zu zählen.

Ich versuchte mich zu bewegen

Installation

Es ist wie immer.

$ wget http://MrFeinberg.com/haikufinder-1.1.zip

$ unzip haikufinder-1.1.zip

$ cd haikufinder-1.1

$ python setup.py install

Danach können Sie ein Skript wie das in README schreiben. .. .. .. .. .. .. .. .. Es sollte sein, aber zuerst müssen wir ein Dokument finden, das eine Silbenfolge "5 7 5" enthält. Ich habe es geschafft, dies zu finden, indem ich herumgewandert bin. Das ist Aschenputtel (lacht)

Skript

So sieht es also aus.

haiku_test.py


from haikufinder import HaikuFinder

text = ''' Once there was a gentleman who married, for his
second wife, the proudest and most haughty woman that
was ever seen. She had, by a former husband, two
daughters of her own humor, who were, ..(Weggelassen, weil es lang ist)'''

haikus = HaikuFinder(text).find_haikus()
for haiku in haikus:
    print haiku[0]
    print "    %s" % haiku[1]
    print haiku[2]
    print

Bereiten Sie ein solches Skript vor, platzieren Sie es unter "haikufinder-1.1 /" und führen Sie es aus. Das Ergebnis ist so.

$ python haiku_test.py
Nothing was then heard
     but a confused noise of: "Ha!
how handsome she is!

ist. Nur das. Vorerst können Sie eine Phrase mit einem guten Rhythmus erhalten.

Auf Japanisch

  1. Zunächst mit Mecab usw. trennen.
  2. Lesen und schätzen Sie das Kanji im Text mit Mecab
  3. Japanisch in Phrasen schneiden (gibt es ein Werkzeug?)
  4. 5 7 5 Count

Ist es? Ich denke, es gibt ein Werkzeug, das durch Klauseln anstelle von Morphologie getrennt wird, aber ich habe es nicht im Detail untersucht. Ich denke, dass die morphologische Analyse von mecab die minimale Anzahl von Klauseln heuristisch zu verwenden scheint. Dann.

Recommended Posts

Ich habe HaikuFinder berührt
Ich berührte Flask
Ich habe das Tensorboard von TensorFlow berührt
Ich habe AWS Chalice berührt
Ich habe versucht, die Qiita-API zu berühren
Ich berührte Bachstelze (2). Einführung von Django-Erweiterungen.
Ich berührte Tensorflow und Keras
Ich berührte PyAutoIt für einen Moment
Ich habe etwas berührt, das sich Touch Designer nennt
Ich berührte "Orator" und machte mir eine Notiz
Ich habe das Datenaufbereitungstool Paxata berührt
Ich habe graph-rcnn berührt, das ein Szenendiagramm erzeugt
Ich habe einige der neuen Funktionen von Python 3.8 touched angesprochen