Holen Sie sich japanische Synonyme mit Python

Ich habe nicht viele einfache Möglichkeiten gefunden, um Synonyme auf Japanisch zu erhalten, wenn ich die Verarbeitung natürlicher Sprache mit Python durchführe, daher werde ich es zusammenfassen.

Vorbereitungen

Dieses Mal werden wir das Wordnet von NLTK und die Funktion Open Multilingual Wordnet für den Umgang mit Japanisch verwenden.

pip install nltk
python -c "import nltk;nltk.download('wordnet')"
python -c "import nltk;nltk.download('omw)"

Holen Sie sich Synset

Synset ist eine in Wordnet definierte Konzepteinheit. Lassen Sie uns versuchen, ein Synset für das Wort "Reis" zu erhalten und die Definition zu sehen.

from nltk.corpus import wordnet

synsets = wordnet.synsets("Reis",lang='jpn')
for syn in synsets:
    print(syn,":",syn.definition())

# Synset('rice.n.01') : grains used as food either unpolished or more often polished
# Synset('united_states.n.01') : North American republic containing 50 states - 48 conterminous states in North America plus Alaska in northwest North America and the Hawaiian Islands in the Pacific Ocean; achieved independence in 1776
# Synset('meter.n.01') : the basic unit of length adopted under the Systeme International d'Unites (approximately 1.094 yards)

Es kann bestätigt werden, dass "Lebensmittel", "Amerika" und "Meter" als Konzept für "Reis" registriert sind.

Erwerb von Synonymen

Da Wörter, die zum Konzept gehören, in Synset registriert sind, können sie als Synonyme erhalten werden. Versuchen Sie, ein Synonym für "Reis" als "Lebensmittel" zu erhalten.

rice_synset=synsets[0]
synonyms=rice_synset.lemma_names("jpn")
print(synonyms)
# ['Reis', 'Reis', 'Omanma', 'USA.', 'Reis angehoben', 'Reis einem Gott angeboten', 'Yagi', 'Reis', 'Kissenreis', 'Reisproduktion', 'Frucht des Reisfeldes', 'weißer Reis', 'Gott Reis', 'Korn', 'Reis', 'Reis孫', 'Korn', 'Reis', 'ReisKorn', 'ReisLebensmittel', '粮Reis', '糧Reis', 'Sari', '褻Reis', 'Silberreis', 'Reis', 'Lebensmittel', 'LebensmittelReis']

Ich konnte gute Synonyme wie "Reis" und "Reis" erwerben.

Zusammenfassung

Mit dem Open Multilingual Wordnet von NLTK konnte ich problemlos nach Synonymen aus Python suchen. Als Einschränkung werden für einige Wörter mehrere Konzepte registriert, sodass es notwendig erscheint, ein geeignetes Synset auszuwählen, um keine Synonyme zu erhalten, die sich von den beabsichtigten unterscheiden.

das ist alles

Referenz

Recommended Posts

Holen Sie sich japanische Synonyme mit Python
Holen Sie sich Datum in Python
Japanische Ausgabe mit Python
Holen Sie sich YouTube-Kommentare in Python
Ich habe Python auf Japanisch geschrieben
Holen Sie sich letzten Monat in Python
Holen Sie sich die Terminalgröße in Python
Holen Sie sich explizit EOF in Python
Ich verstehe Python auf Japanisch!
Holen Sie sich Evernote-Notizen in Python
Holen Sie sich LeapMotion-Daten in Python.
Holen Sie sich den Desktop-Pfad in Python
Holen Sie sich den Skriptpfad in Python
Holen Sie sich ein Kommunikationsmemo in Python
Holen Sie sich den Hostnamen in Python
Umgang mit Japanisch mit Python
Beginnen Sie mit Python mit Blender
Holen Sie sich mit Python zusätzliche Daten zu LDAP
Quadtree in Python --2
Python in der Optimierung
Metaprogrammierung mit Python
Python 3.3 mit Anaconda
Geokodierung in Python
SendKeys in Python
Holen Sie sich Suica Balance in Python (mit libpafe)
Metaanalyse in Python
Unittest in Python
Vergleich japanischer Konvertierungsmodule in Python3
Epoche in Python
Zwietracht in Python
Holen Sie sich Google Fit API-Daten in Python
Deutsch in Python
nCr in Python
N-Gramm in Python
Wie bekomme ich Stacktrace in Python?
Programmieren mit Python
Holen Sie sich Youtube-Daten in Python mithilfe der Youtube-Daten-API
Plink in Python
Holen Sie sich den Batteriestand von SwitchBot mit Python
Holen Sie sich ein Zeichen für Conoha mit Python
Beginnen wir mit TopCoder in Python (Version 2020)
FizzBuzz in Python
SQLite in Python
LINE-Bot [0] in Python
CSV in Python
Reverse Assembler mit Python
Konstante in Python
nCr in Python.
Format in Python
Scons in Python 3
Puyopuyo in Python
Python in Virtualenv
PPAP in Python
Ruft die EDINET-Codeliste in Python ab
Holen Sie sich mit Python die Niederschlagswahrscheinlichkeit aus XML
Holen Sie sich die Cloud-Protokollierung in Python in 10 Minuten
Quad-Tree in Python
Reflexion in Python