Python: Vereinfachte morphologische Analyse mit regulären Ausdrücken

SAMPLE

ich|Ist|Katze|damit|Gibt es|。|Name|Ist|noch|Nichts|ich|。

REFERENCE

Morphologische Analyse der Abkürzung durch regulären Ausdruck

PYTHON Subtil modifiziert.

text_m = []
text = "Ich bin eine Katze. Es gibt noch keinen Namen."
p = re.compile(r"/|[A-Z]+|[a-z]+|[EIN-Hmm]+|[Ah-Hmm-]+|[EIN-Monat]+|[einer-Drachen]+|[。、]|/")
m = p.findall(text)
for row in m:
   if re.compile(r'^[Ah-Hmm]+$').fullmatch(row):
      if row[0] in 'Peeling':
         prefix = row[0]
         token = row[1:]
         text_m.append(prefix)
         if (len(token)>0):
            text_m.append(token)
      elif row[-2:] in 'Also von':
         token = row[0:-2]
         suffix = row[-2:]
         text_m.append(token)
         text_m.append(suffix)
      elif row[-1:] in 'Mohagade':
         token = row[0:-1]
         suffix = row[-1:]
         text_m.append(token)
         text_m.append(suffix)
      else:
         text_m.append(row)
   else:
      text_m.append(row)

## output
'|'.join(text_m)

Recommended Posts

Python: Vereinfachte morphologische Analyse mit regulären Ausdrücken
[Python] Morphologische Analyse mit MeCab
Japanische morphologische Analyse mit Python
Text Mining mit Python ① Morphologische Analyse
Umgang mit regulären Ausdrücken durch PHP / Python
[Python] Reguläre Ausdrücke Reguläre Ausdrücke
Datenanalyse mit Python 2
Sprachanalyse mit Python
Datenanalyse mit Python
[Python] Werden Sie die Datierung mit regulären Ausdrücken los
Text Mining mit Python ① Morphologische Analyse (re: Linux-Version)
[Analyse des gemeinsamen Auftretens] Einfache Analyse des gemeinsamen Auftretens mit Python! [Python]
Sammeln von Informationen von Twitter mit Python (morphologische Analyse mit MeCab)
Emotionsanalyse von Python (word2vec)
Planare Skelettanalyse mit Python
Manipulation regulärer Ausdrücke durch Python
Muskel-Ruck-Analyse mit Python
[PowerShell] Morphologische Analyse mit SudachiPy
Befreien Sie sich mit Python und regulären Ausdrücken von schmutzigen Daten
Morphologische Analyse mit Igo + mecab-ipadic-neologd in Python (mit Ruby-Bonus)
Dreidimensionale Skelettstrukturanalyse mit Python
Impedanzanalyse (EIS) mit Python [impedance.py]
Ich kann mich nicht an reguläre Python-Ausdrücke erinnern
Ich habe mit Mecab gespielt (morphologische Analyse)!
Datenanalyse beginnend mit Python (Datenvisualisierung 1)
Logistische Regressionsanalyse Selbst erstellt mit Python
Datenanalyse beginnend mit Python (Datenvisualisierung 2)
Bei Verwendung regulärer Ausdrücke in Python
Von der Einführung von JUMAN ++ bis zur morphologischen Analyse von Japanisch mit Python
Überlappende reguläre Ausdrücke in Python und Java
Zweidimensionale Analyse des gesättigten und ungesättigten Permeationsflusses mit Python
Maschinelles Lernen mit Python (2) Einfache Regressionsanalyse
2D FEM Stressanalyseprogramm von Python
Tweet-Analyse mit Python, Mecab und CaboCha
Datenanalyse beginnend mit Python (Datenvorverarbeitung - maschinelles Lernen)
Zweidimensionale instationäre Wärmeleitungsanalyse mit Python
Verwendung regulärer Ausdrücke in Python
Von der Vorbereitung der morphologischen Analyse mit Python unter Verwendung von Polyglot bis zur Teilwortmarkierung
[Lass uns mit Python spielen] Ziel ist die automatische Satzgenerierung ~ Morphologische Analyse durchführen ~
FizzBuzz in Python3
Scraping mit Python
Statistik mit Python
Scraping mit Python
Ein Forscher eines Pharmaunternehmens fasste die kanonischen Ausdrücke in Python zusammen
Python mit Go
Datenanalyse Python
[Verschiedene Bildanalysen mit Plotly] Dynamische Visualisierung mit Plotly [Python, Bild]
Klassifizieren Sie Qiita-Posts ohne morphologische Analyse mit Tweet2Vec
Python-Pandas: Suchen Sie mit regulären Ausdrücken nach DataFrame
Twilio mit Python
In Python integrieren
Spielen Sie mit 2016-Python
AES256 mit Python
Getestet mit Python
Python beginnt mit ()
Entfernen Sie zusätzliche Zeichenfolgen in der URL mit kanonischem Ausdruck
Gründlicher Vergleich von drei morphologischen Python-Analysebibliotheken
mit Syntax (Python)