[PYTHON] Das Geschlecht wird aus dem Namen bestimmt.

pip install nltk
import nltk
import random
from nltk import classify
from nltk import NaiveBayesClassifier as NBC

Daten

Bereiten Sie eine Liste mit männlichen Namen (männliche Liste) und eine Liste mit weiblichen Namen (weibliche Liste) vor. (Romaji) (Die Anzahl der Proben ist gleich) (Nur der Vorname unter dem Vor- und Nachnamen)

Beispiel: malelist = ['kazuo', 'kenji', ...]

name.py


def feature_extraction(word):
    return {"last":word[-3:]}
#Funktion zum Extrahieren nur der letzten 3 Zeichen des Namens

maleNames=[(name, "male")for name in malelist]
femaleNames = [(name, 'female')for name in femalelist]
allNames = maleNames + femaleNames #Treten Sie der Liste der Männer und der Liste der Frauen bei
random.shuffle(allNames) #Mische den Inhalt der Liste

featureData=[(feature_extraction(n),gender) for (n,gender) in allNames]
#[(Drei Buchstaben dahinter,Sex),(Drei Buchstaben dahinter,Sex),(Drei Buchstaben dahinter,Sex)・ ・ ・]In Form von

genderIdentifier=NBC.train(featureData)

#Wenn Sie die Genauigkeit überprüfen möchten, fühlen Sie sich wie Sie,
#num=7*len(featureData)//Von 10 Daten
#train_data=featureData[num:]
#test_data=featureData[:num]
#genderIdentifier=NBC.train(train_data)

So speichern Sie das von Ihnen erstellte Modell

import pickle
f = open('my_classifier.pickle', 'wb')
pickle.dump(genderIdentifier, f)
f.close()

So laden Sie ein gespeichertes Modell

import pickle
f = open('my_classifier.pickle', 'rb')
classifier = pickle.load(f)
f.close()

Referenz

Save Naive Bayes Trained Classifier in NLTK

Machine Learning Model - Gender Identifier with NLTK in less than 15 lines of code

Machine Learning Model - Gender Identifier with NLTK in less than 15 lines of code

Recommended Posts

Das Geschlecht wird aus dem Namen bestimmt.
Den Namen der Methode, die ihn aufgerufen hat, finden Sie in der Python-Methode
Ich möchte den Dateinamen von DataLoader sehen
Identifizieren Sie den Namen aus dem Blumenbild mit Keras (Tensorfluss)
Suchen Sie den Teil 575 aus Wikipedia in Python
Prognostizieren Sie das Geschlecht anhand des Namens mithilfe der Gender-API und von Pykakasi in Python
Rufen Sie den Klassennamen ab, in dem die Methode im Dekorator definiert ist
Lassen Sie uns von der Linie suchen
Was ist die Aktivierungsfunktion?
Entfernen Sie den Rahmen aus dem Bild
Ich habe vom Terminal getwittert!
Was ist die Schnittstelle für ...
Was ist die Rückruffunktion?
Das Bild ist Namekuji
Was ist ein Hund? Django - Umfang, in dem Name und Datum von der URL abgerufen werden
Geben Sie auf der AWS Cloud-Produktseite den Namen des AWS-Dienstes in csv ein