Sie können den von gensim bereitgestellten Wrapper verwenden.
gensim: models.wrappers.fasttext – FastText Word Embeddings
Modelllernen:
$ fasttext skipgram -input data.txt -output model
$ ls model*
model.bin  model.vec
gensim Installation:
$ pip install gensim
Wie benutzt man:
>>> from gensim.models.wrappers.fasttext import FastText
>>> model = FastText.load_fasttext_format('model')
>>> model['Der Umsatz']
array([-0.03654   ,  0.19302   ,  0.2026    ,  0.14026   ,  0.06685   ,
        0.10969   , -0.095857  , -0.20964   , -0.27291   , -0.33750001,
        ...
        0.47084001, -0.030295  , -0.003683  , -0.10061   ,  0.17308   ], dtype=float32)
>>> m.most_similar('Der Umsatz')
[('Verkaufspersonal', 0.7841936945915222),
 ('Teleapo', 0.7670873403549194),
 ('Tauchen', 0.7659018039703369),
 ('Telefonverkauf', 0.7384717464447021),
 ...]
Das Modelltraining selbst kann mit der Verpackung von Gensim durchgeführt werden, aber es scheint, dass es nicht viel Verdienst gibt, so dass es weggelassen wird.