[PYTHON] Le sexe est déterminé à partir du nom.

pip install nltk
import nltk
import random
from nltk import classify
from nltk import NaiveBayesClassifier as NBC

Les données

Préparez une liste avec des noms masculins (liste masculine) et une liste avec des noms féminins (liste féminine). (Romaji) (Le nombre d'échantillons est le même) (Seul le prénom parmi le prénom et le nom)

Exemple: malelist = ['kazuo', 'kenji', ...]

name.py


def feature_extraction(word):
    return {"last":word[-3:]}
#Fonction pour extraire uniquement les 3 derniers caractères du nom

maleNames=[(name, "male")for name in malelist]
femaleNames = [(name, 'female')for name in femalelist]
allNames = maleNames + femaleNames #Rejoignez la liste des hommes et la liste des femmes
random.shuffle(allNames) #Mélangez le contenu de la liste

featureData=[(feature_extraction(n),gender) for (n,gender) in allNames]
#[(Trois lettres derrière,sexe),(Trois lettres derrière,sexe),(Trois lettres derrière,sexe)・ ・ ・]En forme de

genderIdentifier=NBC.train(featureData)

#Si vous voulez vérifier l'exactitude, c'est comme si vous l'aviez fait,
#num=7*len(featureData)//Sur 10 données
#train_data=featureData[num:]
#test_data=featureData[:num]
#genderIdentifier=NBC.train(train_data)

Comment enregistrer le modèle que vous avez créé

import pickle
f = open('my_classifier.pickle', 'wb')
pickle.dump(genderIdentifier, f)
f.close()

Comment charger un modèle enregistré

import pickle
f = open('my_classifier.pickle', 'rb')
classifier = pickle.load(f)
f.close()

référence

Save Naive Bayes Trained Classifier in NLTK

Machine Learning Model - Gender Identifier with NLTK in less than 15 lines of code

Machine Learning Model - Gender Identifier with NLTK in less than 15 lines of code

Recommended Posts

Le sexe est déterminé à partir du nom.
Découvrez le nom de la méthode qui l'a appelée à partir de la méthode qui est python
Je veux voir le nom de fichier de DataLoader
Identifiez le nom de l'image de la fleur avec des keras (flux tenseur)
Trouvez la partie 575 de Wikipedia en Python
Prédire le sexe à partir du nom à l'aide de l'API Gender et de Pykakasi en Python
Récupère le nom de la classe où la méthode est définie dans le décorateur
Cherchons à partir de la ligne
Quelle est la fonction d'activation?
Supprimer le cadre de l'image
J'ai tweeté depuis le terminal!
A quoi sert l'interface ...
Qu'est-ce que la fonction de rappel?
L'image est Namekuji
Qu'est-ce qu'un chien? Django - Volume d'obtention du nom et de la date à partir de l'URL
À partir de la page du produit AWS cloud, placez le nom du service AWS sur csv