Je n'ai pas trouvé beaucoup de moyens faciles d'obtenir des synonymes en japonais lors du traitement du langage naturel avec python, donc je vais le résumer.
Cette fois, nous utiliserons le wordnet de NLTK et la fonction Open Multilingual Wordnet pour gérer le japonais.
pip install nltk
python -c "import nltk;nltk.download('wordnet')"
python -c "import nltk;nltk.download('omw)"
Synset est une unité de concept définie dans Wordnet. Essayons d'obtenir un Synset pour le mot «riz» et voyons la définition.
from nltk.corpus import wordnet
synsets = wordnet.synsets("Riz",lang='jpn')
for syn in synsets:
print(syn,":",syn.definition())
# Synset('rice.n.01') : grains used as food either unpolished or more often polished
# Synset('united_states.n.01') : North American republic containing 50 states - 48 conterminous states in North America plus Alaska in northwest North America and the Hawaiian Islands in the Pacific Ocean; achieved independence in 1776
# Synset('meter.n.01') : the basic unit of length adopted under the Systeme International d'Unites (approximately 1.094 yards)
Il peut être confirmé que les termes «nourriture», «Amérique» et «mètre» sont enregistrés comme concept de «riz».
Les mots appartenant au concept étant enregistrés dans Synset, ils peuvent être obtenus comme synonymes. Essayez d'obtenir un synonyme de "riz" comme "nourriture"
rice_synset=synsets[0]
synonyms=rice_synset.lemma_names("jpn")
print(synonyms)
# ['Riz', 'riz', 'Omanma', 'ETATS-UNIS.', 'Riz levé', 'riz offert à un dieu', 'Yagi', 'riz', 'Oreiller de riz', 'Production de riz', 'Fruit du champ de riz', 'riz blanc', 'Riz de Dieu', 'Grain', 'Riz', 'Riz孫', 'Grain', 'Riz', 'RizGrain', 'Riznourriture', '粮Riz', '糧Riz', 'Sari', '褻Riz', 'Riz argenté', 'riz', 'nourriture', 'nourritureRiz']
J'ai pu acquérir de bons synonymes tels que «riz» et «riz».
J'ai pu facilement rechercher des synonymes de python en utilisant Open Multilingual Wordnet de NLTK. En guise de mise en garde, plusieurs concepts sont enregistrés pour certains mots, il semble donc nécessaire de choisir un Synset approprié afin de ne pas obtenir des synonymes différents de ceux prévus.
c'est tout
Recommended Posts