Obtenez des synonymes japonais avec Python

Je n'ai pas trouvé beaucoup de moyens faciles d'obtenir des synonymes en japonais lors du traitement du langage naturel avec python, donc je vais le résumer.

Préparation préalable

Cette fois, nous utiliserons le wordnet de NLTK et la fonction Open Multilingual Wordnet pour gérer le japonais.

pip install nltk
python -c "import nltk;nltk.download('wordnet')"
python -c "import nltk;nltk.download('omw)"

Obtenez Synset

Synset est une unité de concept définie dans Wordnet. Essayons d'obtenir un Synset pour le mot «riz» et voyons la définition.

from nltk.corpus import wordnet

synsets = wordnet.synsets("Riz",lang='jpn')
for syn in synsets:
    print(syn,":",syn.definition())

# Synset('rice.n.01') : grains used as food either unpolished or more often polished
# Synset('united_states.n.01') : North American republic containing 50 states - 48 conterminous states in North America plus Alaska in northwest North America and the Hawaiian Islands in the Pacific Ocean; achieved independence in 1776
# Synset('meter.n.01') : the basic unit of length adopted under the Systeme International d'Unites (approximately 1.094 yards)

Il peut être confirmé que les termes «nourriture», «Amérique» et «mètre» sont enregistrés comme concept de «riz».

Acquisition de synonymes

Les mots appartenant au concept étant enregistrés dans Synset, ils peuvent être obtenus comme synonymes. Essayez d'obtenir un synonyme de "riz" comme "nourriture"

rice_synset=synsets[0]
synonyms=rice_synset.lemma_names("jpn")
print(synonyms)
# ['Riz', 'riz', 'Omanma', 'ETATS-UNIS.', 'Riz levé', 'riz offert à un dieu', 'Yagi', 'riz', 'Oreiller de riz', 'Production de riz', 'Fruit du champ de riz', 'riz blanc', 'Riz de Dieu', 'Grain', 'Riz', 'Riz孫', 'Grain', 'Riz', 'RizGrain', 'Riznourriture', '粮Riz', '糧Riz', 'Sari', '褻Riz', 'Riz argenté', 'riz', 'nourriture', 'nourritureRiz']

J'ai pu acquérir de bons synonymes tels que «riz» et «riz».

Résumé

J'ai pu facilement rechercher des synonymes de python en utilisant Open Multilingual Wordnet de NLTK. En guise de mise en garde, plusieurs concepts sont enregistrés pour certains mots, il semble donc nécessaire de choisir un Synset approprié afin de ne pas obtenir des synonymes différents de ceux prévus.

c'est tout

référence

Recommended Posts

Obtenez des synonymes japonais avec Python
Obtenir la date en Python
Sortie japonaise avec Python
Obtenez des commentaires YouTube en Python
J'ai écrit python en japonais
Obtenez le mois dernier en Python
Obtenir la taille du terminal en Python
Obtenir explicitement EOF en python
Je comprends Python en japonais!
Obtenez des notes Evernote en Python
Obtenez des données LeapMotion en Python.
Obtenir des données de Quandl en Python
Obtenez le chemin du bureau en Python
Obtenez le chemin du script en Python
Obtenir, publier un mémo de communication en Python
Obtenez le nom d'hôte en Python
Comment gérer le japonais avec Python
Démarrez avec Python avec Blender
Obtenez des données supplémentaires vers LDAP avec python
Quadtree en Python --2
Python en optimisation
Métaprogrammation avec Python
Python 3.3 avec Anaconda
Géocodage en python
SendKeys en Python
Obtenir l'équilibre Suica en Python (en utilisant libpafe)
Méta-analyse en Python
Unittest en Python
Comparaison des modules de conversion japonais en Python3
Époque en Python
Discord en Python
Obtenez les données de l'API Google Fit en Python
Allemand en Python
nCr en python
N-Gram en Python
Comment obtenir stacktrace en python
Programmation avec Python
Obtenez des données Youtube en Python à l'aide de l'API Youtube Data
Plink en Python
Obtenez le niveau de la batterie de SwitchBot avec Python
Obtenez un jeton pour conoha avec python
Commençons avec TopCoder en Python (version 2020)
FizzBuzz en Python
Sqlite en Python
LINE-Bot [0] en Python
CSV en Python
Assemblage inversé avec Python
Constante en Python
nCr en Python.
format en python
Scons en Python 3
Puyopuyo en python
python dans virtualenv
PPAP en Python
Obtenir la liste de codes EDINET en Python
Obtenez la probabilité de précipitation de XML avec Python
Obtenez Cloud Logging disponible en Python en 10 minutes
Quad-tree en Python
Réflexion en Python