[PYTHON] Wie man Mecab, neologd-ipadic auf Colab verwendet

Einführung

Was ist ipadic-neologd? mecab-ipadic-NEologd : Neologism dictionary for MeCab Eines der Wörterbücher für Mecab. Es wird mehr als zweimal pro Woche aktualisiert, sodass Sie mit neuen Wörtern und eindeutigen Ausdrücken umgehen können.

Beispiel


#ipadic-neologd unbenutzt
m=MeCab.Tagger()
print(m.parse("COVID-19 verursachte ein Überschwingen."))
>COVID COVID COVID-Nomenklatur-Proprietäre Nomenklatur-Organisation
 -	-	-Substantiv-Verbindung ändern
19 19 19 Nomenklatur-Nummer
Durch Grinsen durch Hilfswörter-Fallassistent-Gemeinsame Sprache
Über über über Nomenklatur-Verbindung ändern
Shoot Shoot Shoot Nomen-Verbindung ändern
Gaga ist Assistentin-Fallassistent-Allgemeines
Wach auf ok wach auf Verb-Unabhängige fünfstufige / la-Leitung durchgehende Verbindung
Ta ta ta Hilfsverb spezielle ta ta Grundform
.. .. .. Symbol-Phrase
 EOS

#ipadic-mit neologd
m=MeCab.Tagger("-d {Wörterbuchpfad}")
print(m.parse("COVID-19 verursachte ein Überschwingen."))
>COVID-19 Nomenklatur,Proprietäre Nomenklatur,Allgemeines,*,*,*,COVID-19,Covid Neunzehn,Covid Neunzehn
Durch,Fallassistent,Gemeinsame Sprache,*,*,*,Durch,Grinsend,Grinsend
Überschwinger Nomen,Proprietäre Nomenklatur,Allgemeines,*,*,*,Überschwingen,Überschwingen,Überschwingen
Ist ein Assistent,Fallassistent,Allgemeines,*,*,*,Aber,Ga,Ga
Zufälliges Verb,Unabhängigkeit,*,*,Fünf Schritte, La Linie,Kontinuierliche Verbindung,Auftreten,Okot,Okot
Hilfsverb,*,*,*,Besondere,Grundform,Ta,Ta,Ta
.. Symbol,Phrase,*,*,*,*,。,。,。
 EOS

So installieren Sie auf Colab

Der folgende Artikel war sehr leicht zu verstehen. mecab ipadic-NEologd を Google Colaboratory で使う Wenn Sie eine Fehlermeldung erhalten, hat das Hinzufügen der folgenden Elemente einwandfrei funktioniert: !sudo cp /etc/mecabrc /usr/local/etc/

wie benutzt man


import MeCab
m=MeCab.Tagger("{Ausgabeformat(Siehe unten)} -d {ipadic-neologd Pfad}")
print(m.parse("Halte deine soziale Distanz"))

Ausgabeformat

1. Mecabrc: keine Argumente


Soziale Distanz Nomen,Proprietäre Nomenklatur,Allgemeines,*,*,*,Soziale Distanz,Soziale Distanz,Soziale Distanz
Hilfs,Fallassistent,Allgemeines,*,*,*,Zu,Wo,Wo
Tamotsu und Verb,Unabhängigkeit,*,*,Fünf Schritte / Ta-Linie,Verbindung,behalten,Tamoto,Tamoto
U Hilfsverb,*,*,*,Unveränderlicher Typ,Grundform,U.,C.,C.
EOS

Oberflächentyp: Bleibt durch Morphologie getrennt Teil: Nomenklatur, Verben, Assistenten, Hilfsverben usw. Teil Teil Unterkategorie 1: Nase → Eigenname, Verb → Unabhängigkeit, Assistent → Fall Teilwort Unterkategorie 2: Allgemein, Zitat Teiltexte Unterklassifikation 3: Verwendungsart: Verb → 5 Schritte / ta Zeile Nutzungsart: C-Verbindung Prototyp. Lesen, Aussprache:

2. -Ochasen: ChaSen-kompatibles Format


Soziale Distanz Soziale Distanz Soziale Distanz Nomenklatur-Proprietäre Nomenklatur-Allgemeines
Wo wo Auxiliary-Fallassistent-Allgemeines
Tamotsu und Tamoto behalten Verben-Unabhängigkeit 5 Schritte / Ta-Leitungsverbindung
Uuu Hilfsverb invariante Grundform
EOS

3. -Owakati: Nur Trennung


Halte deine soziale Distanz

4. -Oyomi: Nur Lesen

Soziale Distanz Otamoto

5. -Odump: Alle Informationen ausgeben

0 BOS BOS/EOS,*,*,*,*,*,*,*,* 0 0 0 0 0 0 2 1 0.000000 0.000000 0.000000 0
6 Nomenklatur der sozialen Distanz,Proprietäre Nomenklatur,Allgemeines,*,*,*,Soziale Distanz,Soziale Distanz,Soziale Distanz 0 33 1288 1288 41 7 0 1 0.000000 0.000000 0.000000 -1987
213 als Assistent,Fallassistent,Allgemeines,*,*,*,Zu,Wo,Wo 33 36 156 156 13 6 0 1 0.000000 0.000000 0.000000 -1613
218 Ho und Verb,Unabhängigkeit,*,*,Fünf Schritte / Ta-Linie,Verbindung,behalten,Tamoto,Tamoto 36 42 739 739 31 2 0 1 0.000000 0.000000 0.000000 3067
234 U Assistentenverb,*,*,*,Unveränderlicher Typ,Grundform,U.,C.,C. 42 45 506 506 25 6 0 1 0.000000 0.000000 0.000000 3215
236 EOS BOS/EOS,*,*,*,*,*,*,*,* 45 45 0 0 0 0 3 1 0.000000 0.000000 0.000000 1300```  


Recommended Posts

Wie man Mecab, neologd-ipadic auf Colab verwendet
Verwendung von Dataiku unter Windows
Hinweise zur Verwendung von Pywinauto
Hinweise zur Verwendung von featuretools
Wie benutzt man Homebrew in Debian?
So verwenden Sie Google Assistant unter Windows 10
Memorandum über die Verwendung von Gremlin Python
Verwendung von xml.etree.ElementTree
Wie benutzt man Python-Shell
Hinweise zur Verwendung von tf.data
Verwendung von virtualenv
Wie benutzt man Seaboan?
Verwendung von Image-Match
Wie man Shogun benutzt
Verwendung von Pandas 2
Verwendung von numpy.vectorize
Verwendung von pytest_report_header
Wie man teilweise verwendet
Wie man Bio.Phylo benutzt
Verwendung von SymPy
Wie man x-means benutzt
Verwendung von WikiExtractor.py
Verwendung von IPython
Verwendung von virtualenv
Wie benutzt man Matplotlib?
Verwendung von iptables
Wie benutzt man numpy?
Verwendung von TokyoTechFes2015
Wie benutzt man venv
Verwendung des Wörterbuchs {}
Wie benutzt man Pyenv?
Verwendung der Liste []
Wie man Python-Kabusapi benutzt
Verwendung von OptParse
Verwendung von return
Wie man Imutils benutzt
Verwendung von Python Kivy ④ ~ Ausführung unter Android ~
So führen Sie MeCab unter Ubuntu 18.04 LTS Python aus
Verwendung von Qt Designer
Verwendung der Suche sortiert
[gensim] Verwendung von Doc2Vec
python3: Verwendung der Flasche (2)
Verwenden Sie MeCab, um Messwerte abzurufen
Verwendung des Generators
Verwendung von C216 Audio Controller unter Arch Linux
[Python] Verwendung von Liste 1
Verwendung von FastAPI ③ OpenAPI
Ein Memorandum zur Verwendung von Keras 'keras.preprocessing.image
Verwendung von TensorFlow auf GPUs unter Titan
So registrieren Sie sich bei pypi
Wie benutzt man Python Argparse?
Verwendung von IPython Notebook
Wie man Pandas Rolling benutzt
[Hinweis] Verwendung von virtualenv
Verwendung von Redispy-Wörterbüchern
Python: Wie man pydub benutzt