Utilisez polyglot (Document).
Ce qui suit a été confirmé pour fonctionner avec Python 3.8.5. Première,
pip install numpy
pip install polyglot
pip install six
pip install pycld2
pip install morfessor
pip install pyicu
Installez dans l'ordre de.
Cependant, lorsque ModuleNotFoundError vous dit de mettre icu
pip install icu
ne pas
pip install pyicu
Laisser. Si vous essayez d'installer et d'utiliser icu
, vous devriez obtenir l'erreur impossible d'importer le nom xxx
. Notez qu'il s'agit d'un élément différent.
Si cela ne fonctionne pas, consultez Erreur lors de l'installation de pip pyicu.
Regardez le [Part of Speech Tagging] officiel (https://polyglot.readthedocs.io/en/latest/POS.html) et recherchez les paroles de la partie.
from polyglot.text import Text
blob = "You never fail until you stop trying."
tokens = Text(blob)
print(tokens.pos_tags)
Cela devrait vous donner la partie de chaque mot de la phrase, mais vous devriez obtenir une erreur.
ValueError: This resource is available in the index but not downloaded, yet. Try to run
polyglot download embeddings2.en
donc
git clone https://github.com/web64/nlpserver.git
Après cela, sur la 14ème ligne de nlpserver.py
app.config['JSON_AS_ASCII'] = False
Après avoir ajouté
polyglot download embeddings2.en
polyglot download pos2.en
Est inséré. Cette partie a été écrite en Impossible d'extraire les fichiers polyglottes.
Maintenant que vous pouvez analyser l'anglais, le code précédent fonctionne,
from polyglot.text import Text
blob = "You never fail until you stop trying."
tokens = Text(blob)
print(tokens.pos_tags)
En conséquence de
[('You', 'PRON'), ('never', 'ADV'), ('fail', 'VERB'), ('until', 'SCONJ'), ('you', 'PRON'), ('stop', 'VERB'), ('trying', 'VERB'), ('.', 'PUNCT')]
Est obtenu.
Le résultat est difficile à voir sur une seule ligne, alors utilisez pprint
sur la dernière ligne
import pprint
pprint.pprint(tokens.pos_tags)
Par
[('You', 'PRON'),
('never', 'ADV'),
('fail', 'VERB'),
('until', 'SCONJ'),
('you', 'PRON'),
('stop', 'VERB'),
('trying', 'VERB'),
('.', 'PUNCT')]
Vous pouvez concevoir comme. Les noms des pièces sont les suivants. L'abréviation et la description (en anglais) sont tirées de Part of Speech Tagging.
Nom abrégé | Explication(Anglais) | Explication(Japonais) |
---|---|---|
ADJ | adjective | adjectif |
ADP | adposition | Conjoint |
ADV | adverb | adverbe |
AUX | auxiliary verb | Verbe auxiliaire |
CONJ | coordinating conjunction | Coordonner la connexion |
DET | determiner | Mots limités |
INTJ | interjection | interjection |
NOUN | noun | nom |
NUM | numeral | numéral |
PART | particle | Immuable |
PRON | pronoun | Synonyme |
PROPN | proper noun | Nomenclature propriétaire |
PUNCT | punctuation | Ponctuation |
SCONJ | subordinating conjunction | Connexion subordonnée |
SYM | symbol | symbole |
VERB | verb | verbe |
X | other | autres |
Référence d'installation https://qiita.com/sawada/items/528da0b22546045122b2
Référence sur les fonctionnalités de polyglotte http://lab.astamuse.co.jp/entry/try-polyglot