[PYTHON] ■ [Google Colaboratory] Morphologische Analyse verwenden (janome)

Einführung in die Verwendung des japanischen morphologischen Analysetools ** janome **. Janome ist Pythons morphologische Analyse-Engine. Japanischer Text kann in morphologische Elemente unterteilt werden, um den Teil des Textes zu beurteilen oder um ihn zu trennen (in Wörter zu unterteilen).

  1. Install of "janome"

!pip install janome
  1. How to use

from janome.tokenizer import Tokenizer
s = Tokenizer() # <-Erstellen Sie eine Instanz von Tokenizer
t = 'Da ist ein Eichhörnchen'
tt = 'Es gibt zwei Hühner im Garten'
for _ in s.tokenize(t):
  print(_)
for __ in s.tokenize(tt):
  print(__)

[Output] =================================================== Ni ----- Auxiliary, Case Auxiliary, General, *, *, *, Ni, Ni, Ni Wani ----- Nomenklatur, Allgemein, *, *, *, *, Wani, Krokodil, Krokodil Wani ----- Nomenklatur, Allgemein, *, *, *, *, Wani, Krokodil, Krokodil Wa ----- Assistent, Endassistent, *, *, *, *, Wa, Wa, Wa Niwatori ----- Nomenklatur, Allgemein, *, *, *, *, Niwatori, Huhn, Huhn ----- Hilfskraft, Fallassistent, General, *, *, *, ga, ga, ga Ist ----- Verb, Unabhängigkeit, *, *, ein Schritt, Grundform, ist, il, il

Garten ----- Nomenklatur, Allgemein, *, *, *, *, Garten, Niwa, Niwa Ni ----- Auxiliary, Case Auxiliary, General, *, *, *, Ni, Ni, Ni ----- Auxiliary, Zugehörigkeit, *, *, *, *, ha, wa Zwei ----- Nomenklatur, Zahl, *, *, *, *, zwei, zwei, zwei Flügel ----- Nomenklatur, Endungen, Hilfswörter, *, *, *, Flügel, wa, wa Huhn ----- Nomenklatur, Allgemein, *, *, *, *, Huhn, Huhn, Huhn ----- Hilfskraft, Fallassistent, General, *, *, *, ga, ga, ga Ist ----- Verb, Unabhängigkeit, *, *, ein Schritt, Grundform, ist, il, il [end] ======================================================

Reference

Vergleich morphologischer Analysewerkzeuge (NLP2018)

Recommended Posts

■ [Google Colaboratory] Morphologische Analyse verwenden (janome)
■ [Google Colaboratory] Verwenden Sie die morphologische Analyse (MeCab)
■ [Google Colaboratory] Vorverarbeitung der Verarbeitung natürlicher Sprache & Janome
Japanische morphologische Analyse mit Janome
Verwenden Sie music21 in Google Colaboratory
So verwenden Sie Google Colaboratory
Google-Labor
Verwenden Sie den Metabolic Disassembler in Google Colaboratory
Verwenden Sie Cartopy mit Google Colaboratory, ohne an Fehlern zu leiden
Verwenden Sie TPU und Keras mit Google Colaboratory
Installation des Werkzeugs für die morphologische Analyse (MeCab, Human ++, Janome, GiNZA)
Zusammenfassung der Einrichtung von Google Colaboratory
Verwendung des japanischen Spacy-Modells mit Google Colaboratory
Ich kann den Darknet-Befehl in Google Colaboratory nicht verwenden!
Erstellen einer Umgebung für die Verwendung von CaboCha mit Google Colaboratory
Lassen Sie uns Python Janome einfach verwenden
[Anmerkung] WordCloud aus morphologischer Analyse
[Python] Morphologische Analyse mit MeCab
Python: Japanischer Text: Morphologische Analyse
Probieren Sie StyleGAN mit Google Colaboratory aus
Lernen Sie Python mit Google Colaboratory
Verarbeitung natürlicher Sprache 1 Morphologische Analyse
Japanische morphologische Analyse mit Python
Probieren Sie OpenCV mit Google Colaboratory aus
Tool-Organisation: Google Colaboratory (aktualisiert 2020.2.24)
[PowerShell] Morphologische Analyse mit SudachiPy
Pandas 100 klopft an Google Colaboratory
Verwendung von Google Colaboratory und Verwendungsbeispiel (PyTorch × DCGAN)