Sie können den von gensim bereitgestellten Wrapper verwenden.
gensim: models.wrappers.fasttext – FastText Word Embeddings
Modelllernen:
$ fasttext skipgram -input data.txt -output model
$ ls model*
model.bin model.vec
gensim Installation:
$ pip install gensim
Wie benutzt man:
>>> from gensim.models.wrappers.fasttext import FastText
>>> model = FastText.load_fasttext_format('model')
>>> model['Der Umsatz']
array([-0.03654 , 0.19302 , 0.2026 , 0.14026 , 0.06685 ,
0.10969 , -0.095857 , -0.20964 , -0.27291 , -0.33750001,
...
0.47084001, -0.030295 , -0.003683 , -0.10061 , 0.17308 ], dtype=float32)
>>> m.most_similar('Der Umsatz')
[('Verkaufspersonal', 0.7841936945915222),
('Teleapo', 0.7670873403549194),
('Tauchen', 0.7659018039703369),
('Telefonverkauf', 0.7384717464447021),
...]
Das Modelltraining selbst kann mit der Verpackung von Gensim durchgeführt werden, aber es scheint, dass es nicht viel Verdienst gibt, so dass es weggelassen wird.