--R Ne peut pas être utilisé. Je ne veux pas l'utiliser parce que c'est lourd `` J'aimerais pouvoir traiter en parallèle plus tard ... ―― Donc je vais le faire avec python
fp-growth ――Je veux faire de l'exploration de modèles pour un peu de recherche et l'agréger, alors je l'utilise ――Il y a peu de japonais
Première installation
pip install pyfpgrowth
Démarrer python
>>> import pyfpgrowth                                                          
>>> transactions = [[1, 2, 5],                                                 
...                 [2, 4],                                                    
...                 [2, 3],                                                    
...                 [1, 2, 4],                                                 
...                 [1, 3],                                                    
...                 [2, 3],                                                    
...                 [1, 3],                                                    
...                 [1, 2, 3, 5],                                              
...                 [1, 2, 3]]                                                 
>>> patterns = pyfpgrowth.find_frequent_patterns(transactions, 2)              
>>> print patterns                                                             
{(1, 2): 4, (1, 2, 3): 2, (1, 3): 4, (1,): 6, (2,): 7, (2, 4): 2, (1, 5): 2, (5,): 2, (2, 3): 4, (2, 5): 2, (4,): 2, (1, 2, 5): 2} 
C'était un peu comme ça. Mais les valeurs sont triées, alors je me suis demandé si je ne pouvais pas faire la distinction entre 1 → 2 et 2 → 1.
Recommended Posts