Analyse morphologique japonaise avec Janome

J'ai vérifié comment utiliser Janome, alors j'ai fait une note.

Qu'est-ce que Janome?

Janome

Janome est un analyseur morphologique encapsulé par dictionnaire écrit en Pure Python. Nous visons à être une bibliothèque d'analyse morphologique avec une API simple qui peut être facilement installée sans bibliothèques dépendantes et facilement incorporée dans les applications.

Je pense l'essayer, alors j'ai décidé d'utiliser Janome, qui semble être le plus simple à utiliser avec Python. Comparé à Mecab, il est plus facile à utiliser avec juste pip install. Pour d'autres outils d'analyse morphologique japonais, voir le résumé de ici.

Comment utiliser Janome

Extrait du site officiel.

from janome.tokenizer import Tokenizer
t = Tokenizer()
for token in t.tokenize(u'Des cuisses et des cuisses'):
    print(token)

À propos de la sortie de Tokenizer

Lorsque le résultat de Tokenizer.tokenize est sorti par impression, il ressemble à ceci.

Est le verbe, non indépendant, \ *, \ *, une étape, forme de base, est, il, il

Selon ici, à partir de la gauche, "mot original", "partie de mots", "partie de sous-classification de partie 1", "classification 2", "classification" "3", "type d'utilisation", "type d'utilisation", "prototype", "lecture", "prononciation".

Le résultat de tokenize a les propriétés de chaîne suivantes.

--surface: mot d'origine --part_of_speech: [Partie du mot], [Partie du mot sous-classification 1], [Catégorie 2], [Catégorie 3] --infl_type: type d'utilisation --infl_form: type d'utilisation --base_form: Prototype --lecture: lecture --phonetic: Prononciation.

Recommended Posts

Analyse morphologique japonaise avec Janome
Traitement de l'analyse japonaise à l'aide de Janome part1
Python: texte japonais: analyse morphologique
Analyse morphologique japonaise avec Python
■ [Google Colaboratory] Utiliser l'analyse morphologique (janome)
Essayez d'utiliser jieba, un moteur d'analyse morphologique chinois
Installation d'outils d'analyse morphologique (MeCab, Human ++, Janome, GiNZA)
Analyse des données à l'aide de xarray
Analyse orthologue à l'aide d'OrthoFinder
100 Language Processing Knock-30 (en utilisant des pandas): lecture des résultats de l'analyse morphologique
[Python] Analyse morphologique avec MeCab
Traitement du langage naturel 1 Analyse morphologique
PNL japonais @ janome / spaCy / Python
■ [Google Colaboratory] Prétraitement du traitement du langage naturel et janome
Analyse de données à l'aide de pandas python
Analyse morphologique avec Igo + mecab-ipadic-neologd en Python (avec bonus Ruby)
[PowerShell] Analyse morphologique avec SudachiPy
Traitement du langage naturel japonais utilisant Python3 (4) Analyse des émotions par régression logistique
De l'introduction de JUMAN ++ à l'analyse morphologique du japonais avec Python
Précautions lors de l'utilisation de l'analyse des traits TextBlob
100 coups de traitement du langage 2020: Chapitre 4 (analyse morphologique)
100 Language Processing Knock 2020 Chapitre 4: Analyse morphologique
Text mining avec Python ① Analyse morphologique
Reconnaissance faciale à l'aide de l'analyse des composants principaux
100 Traitement du langage Knock Chapitre 4: Analyse morphologique
■ [Google Colaboratory] Utiliser l'analyse morphologique (MeCab)
Utilisation du japonais avec IPython @ Windows de Rodeo
J'ai joué avec Mecab (analyse morphologique)!
Recommandation d'analyse des données à l'aide de MessagePack
Binarisation d'images par analyse discriminante linéaire
[PyTorch] Génération de phrases japonaises à l'aide de Transformer
[Traitement du langage 100 coups 2020] Chapitre 4: Analyse morphologique
100 Language Processing Knock 2015 Chapitre 4 Analyse morphologique (30-39)
Tutoriel de recommandation utilisant l'analyse d'association (concept)
De la préparation à l'analyse morphologique avec python en utilisant polyglotte au marquage des mots partiels