[PYTHON] Comment utiliser mecab, neologd-ipadic sur colab

introduction

Qu'est-ce que ipadic-neologd? mecab-ipadic-NEologd : Neologism dictionary for MeCab Un des dictionnaires pour mecab. Il est mis à jour plus de deux fois par semaine, ce qui vous permet de gérer de nouveaux mots et des expressions uniques.

Exemple


#ipadic-neologd inutilisé
m=MeCab.Tagger()
print(m.parse("COVID-19 a provoqué un dépassement."))
>Nomenclature COVID COVID COVID-Nomenclature propriétaire-Organisation
 -	-	-nom-Changer de connexion
19 19 19 nomenclature-nombre
En souriant par des mots auxiliaires-Assistant de cas-Langage commun
Plus de nomenclature-Changer de connexion
Shoot shoot shoot substantif-Changer de connexion
Gaga est un assistant-Assistant de cas-Général
Wake up ok réveiller verbe-Connexion continue indépendante à cinq étages / ligne
Ta ta ta verbe auxiliaire special ta ta forme de base
.. .. .. symbole-Phrase
 EOS

#ipadic-en utilisant neologd
m=MeCab.Tagger("-d {Chemin du dictionnaire}")
print(m.parse("COVID-19 a provoqué un dépassement."))
>COVID-19 nomenclature,Nomenclature propriétaire,Général,*,*,*,COVID-19,Covid dix-neuf,Covid dix-neuf
Par,Assistant de cas,Langage commun,*,*,*,Par,Grimaçant,Grimaçant
Overshoot substantif,Nomenclature propriétaire,Général,*,*,*,Dépasser,Dépasser,Dépasser
Est un assistant,Assistant de cas,Général,*,*,*,Mais,Géorgie,Géorgie
Happening verbe,Indépendance,*,*,Cinq étapes, La ligne,Connexion continue,Se produire,Oko,Oko
Verbe auxiliaire,*,*,*,Spécial,Forme basique,Ta,Ta,Ta
.. symbole,Phrase,*,*,*,*,。,。,。
 EOS

Comment installer sur Colab

L'article suivant était très facile à comprendre. mecab ipadic-NEologd を Google Colaboratory で使う Si vous obtenez une erreur, l'ajout de ce qui suit a bien fonctionné: !sudo cp /etc/mecabrc /usr/local/etc/

comment utiliser


import MeCab
m=MeCab.Tagger("{Format de sortie(Voir ci-dessous)} -d {ipadic-chemin neologd}")
print(m.parse("Gardez votre distance sociale"))

Format de sortie

1. mecabrc: pas d'arguments


Distance sociale,Nomenclature propriétaire,Général,*,*,*,Distance sociale,Distance sociale,Distance sociale
Auxiliaire,Assistant de cas,Général,*,*,*,À,Wo,Wo
Tamotsu et verbe,Indépendance,*,*,Cinq étapes / ligne Ta,Lien,garder,Tamoto,Tamoto
U verbe auxiliaire,*,*,*,Type immuable,Forme basique,U,C,C
EOS

Type de surface: Reste séparé par morphologie Partie: Nomenclature, verbes, assistants, verbes auxiliaires, etc. Partie partie sous-catégorie 1: Nez → nom propre, verbe → indépendance, assistant Sous-catégorie de mot partiel 2: Général, citation Partie paroles sous-catégorie 3: Type d'utilisation: verbe → 5 étapes / ligne ta Type d'utilisation: connexion C Prototype. Lecture, prononciation:

2. -Ochasen: format compatible ChaSen


Distance sociale Distance sociale Distance sociale Nomenclature-Nomenclature propriétaire-Général
Wo wo auxiliaire-Assistant de cas-Général
Tamotsu et Tamoto gardent les verbes-Indépendance 5 étapes / connexion ligne Ta
Uuu Forme de base invariante du verbe auxiliaire
EOS

3. -Owakati: Séparation uniquement


Gardez votre distance sociale

4. -Oyomi: lecture seule

Distance sociale Otamoto

5. -Odump: sortie toutes les informations

0 BOS BOS/EOS,*,*,*,*,*,*,*,* 0 0 0 0 0 0 2 1 0.000000 0.000000 0.000000 0
6 Nomenclature de la distance sociale,Nomenclature propriétaire,Général,*,*,*,Distance sociale,Distance sociale,Distance sociale 0 33 1288 1288 41 7 0 1 0.000000 0.000000 0.000000 -1987
213 en tant qu'assistant,Assistant de cas,Général,*,*,*,À,Wo,Wo 33 36 156 156 13 6 0 1 0.000000 0.000000 0.000000 -1613
218 Ho et verbe,Indépendance,*,*,Cinq étapes / ligne Ta,Lien,garder,Tamoto,Tamoto 36 42 739 739 31 2 0 1 0.000000 0.000000 0.000000 3067
234 U verbe assistant,*,*,*,Type immuable,Forme basique,U,C,C 42 45 506 506 25 6 0 1 0.000000 0.000000 0.000000 3215
236 EOS BOS/EOS,*,*,*,*,*,*,*,* 45 45 0 0 0 0 3 1 0.000000 0.000000 0.000000 1300```  


Recommended Posts

Comment utiliser mecab, neologd-ipadic sur colab
Comment utiliser Dataiku sous Windows
Remarques sur l'utilisation de pywinauto
Remarques sur l'utilisation des featuretools
Comment utiliser l'homebrew dans Debian
Comment utiliser l'Assistant Google sur Windows 10
Mémorandum sur l'utilisation du python gremlin
Comment utiliser xml.etree.ElementTree
Comment utiliser Python-shell
Remarques sur l'utilisation de tf.data
Comment utiliser virtualenv
Comment utiliser Seaboan
Comment utiliser la correspondance d'image
Comment utiliser le shogun
Comment utiliser Pandas 2
Comment utiliser numpy.vectorize
Comment utiliser pytest_report_header
Comment utiliser partiel
Comment utiliser Bio.Phylo
Comment utiliser SymPy
Comment utiliser x-means
Comment utiliser WikiExtractor.py
Comment utiliser IPython
Comment utiliser virtualenv
Comment utiliser Matplotlib
Comment utiliser iptables
Comment utiliser numpy
Comment utiliser TokyoTechFes2015
Comment utiliser venv
Comment utiliser le dictionnaire {}
Comment utiliser Pyenv
Comment utiliser la liste []
Comment utiliser python-kabusapi
Comment utiliser OptParse
Comment utiliser le retour
Comment utiliser pyenv-virtualenv
Comment utiliser imutils
Comment utiliser Python Kivy ④ ~ Exécution sur Android ~
Comment exécuter MeCab sur Ubuntu 18.04 LTS Python
Comment utiliser Qt Designer
Comment utiliser la recherche triée
[gensim] Comment utiliser Doc2Vec
python3: Comment utiliser la bouteille (2)
Utilisez MeCab pour récupérer les lectures
Comment utiliser le générateur
Comment utiliser le contrôleur audio C216 sur Arch Linux
[Python] Comment utiliser la liste 1
Comment utiliser FastAPI ③ OpenAPI
Un mémorandum sur l'utilisation de keras.preprocessing.image de Keras
Pour utiliser TensorFlow sur des GPU inférieurs à Titan
Comment s'inscrire auprès de pypi
Comment utiliser Python Argparse
Comment utiliser IPython Notebook
Comment utiliser Pandas Rolling
[Note] Comment utiliser virtualenv
Comment utiliser les dictionnaires redis-py
Python: comment utiliser pydub