[PYTHON] J'ai touché HaikuFinder

Déclencheur

Tout d'abord, je ne comprends pas le titre, mais la raison en était lorsque je cherchais le mode python dans Processing. Il y a beaucoup de gens qui font du mode Python, mais je regarde souvent le Site Web de la personne qui a créé le mode Python dans la liste des modules officiels de Processing. C'était. Puis il faisait quelque chose qui s'appelait Haiku Finder. C'est pourquoi je l'ai touché. Au fait, même si vous dites haïku, il semble que vous comptez le nombre de syllabes en anglais.

J'ai essayé de bouger

Installation

C'est comme d'habitude.

$ wget http://MrFeinberg.com/haikufinder-1.1.zip

$ unzip haikufinder-1.1.zip

$ cd haikufinder-1.1

$ python setup.py install

Après cela, vous pouvez écrire un script comme celui de README. .. .. .. .. .. .. .. .. C'était censé l'être, mais nous devons d'abord trouver un document qui a une séquence de syllabes «5 7 5». J'ai réussi à trouver ceci en me promenant. C'est Cendrillon (rires)

scénario

Donc ça ressemble à ça.

haiku_test.py


from haikufinder import HaikuFinder

text = ''' Once there was a gentleman who married, for his
second wife, the proudest and most haughty woman that
was ever seen. She had, by a former husband, two
daughters of her own humor, who were, ..(Omis parce que c'est long)'''

haikus = HaikuFinder(text).find_haikus()
for haiku in haikus:
    print haiku[0]
    print "    %s" % haiku[1]
    print haiku[2]
    print

Préparez un tel script, placez-le sous haikufinder-1.1 / et exécutez-le. Le résultat est comme ça.

$ python haiku_test.py
Nothing was then heard
     but a confused noise of: "Ha!
how handsome she is!

est. Seulement ça. Pour le moment, vous pouvez obtenir une phrase avec un bon rythme.

En japonais

  1. Tout d'abord, séparez avec mecab etc.
  2. Lisez et évaluez les kanji dans le texte avec mecab
  3. Découpez le japonais en phrases (existe-t-il un outil?)
  4. Compte 5 7 5

C'est ça? Je pense qu'il existe un outil qui sépare par des clauses au lieu de la morphologie, mais je ne l'ai pas étudié en détail. Je pense que l'analyse morphologique de mecab semble utiliser le nombre minimum de clauses de manière heuristique. Puis.

Recommended Posts

J'ai touché HaikuFinder
J'ai touché Flask
J'ai touché le Tensorboard de TensorFlow
J'ai touché AWS Chalice
J'ai essayé de toucher l'API Qiita
J'ai touché Bergeronnette (2). Introduction des extensions django.
J'ai touché Tensorflow et keras
J'ai touché PyAuto pendant un moment
J'ai touché quelque chose qui s'appelle Touch Designer
J'ai touché "Orator" alors j'ai fait une note
J'ai touché à l'outil de préparation de données Paxata
J'ai touché graph-rcnn qui génère un graphe de scène
J'ai touché certaines des nouvelles fonctionnalités de Python 3.8 ①