[PYTHON] Informations sur les réunions d'apprentissage automatique pour HRTech

TL; DR

Nous allons créer un modèle d'apprentissage pour créer quelque chose comme ça en utilisant les données de la conférence. membersearch-min.png

L'article entier est ici.

1. Prémisse

Voici les données des réunions basées sur les procès-verbaux du parlement.

2. Apprentissage automatique

Calculez les phrases caractéristiques de chaque membre et le degré de similitude entre chaque membre. En supposant que vous devriez considérer ce qui détermine que les phrases sont similaires, nous évaluerons ici le degré de similitude par les deux méthodes suivantes.

Hé là toi! Vous pensiez que ** TF-IDF n'est pas du machine learning **! !!

Oui c'est vrai. Mais les gens dans la rue ne connaissent pas la différence, donc si le résultat semble bon, vous ne le remarquerez pas. Alors

"L'IA a travaillé dur! (Smiley)"

Cela dit, il ne devrait y avoir pratiquement aucun problème. Il y a autant d'images d'IA que de personnes (Kiri!

2.1 Calcul de la similitude entre les personnes utilisant TF-IDF

Voir ici. Si vous utilisez la bibliothèque chan scipy, même les matrices clairsemées qui ont tendance à grossir peuvent être traitées à une vitesse sans stress.

2.2 Calcul de la similitude entre les personnes avec doc2vec

Voir ici. C'est facile à apprendre avec le package gensim.

3. Analyse du réseau

Veuillez voir ici.

Créez un graphe de réseau et utilisez une technique appelée la méthode louvain pour regrouper les personnes avec des remarques similaires du graphe Netowrk.

Si vous le visualisez, vous obtiendrez le résultat suivant.

path_to_fig.png

Lorsque ce graphique Netowrk est écrit en Json, le contenu spécifique est le suivant.

{
  "directed": false,
  "multigraph": false,
  "graph": {},
  "nodes": [
    {
      "size": 3,
      "cluster": 1,
      "id": "Tomomi Inada"
    },
    {
      "size": 54,
      "cluster": 3,
      "id": "Taro Aso"
    },
    {
      "size": 142,
      "cluster": 0,
      "id": "Hironari Seko"
    },
    {
      "size": 39,
      "cluster": 4,
      "id": "Yasuhisa Shiozaki"
    },
    {
      "size": 30,
      "cluster": 1,
      "id": "Sanae Takaichi"
    },
    {
      "size": 95,
      "cluster": 1,
      "id": "Shinzo Abe"
    }
  ],
  "links": [
    {
      "weight": 0.5984722375869751,
      "source": "Tomomi Inada",
      "target": "Hironari Seko"
    },
    {
      "weight": 0.9666371941566467,
      "source": "Tomomi Inada",
      "target": "Shinzo Abe"
    },
    {
      "weight": 0.48173508048057556,
      "source": "Tomomi Inada",
      "target": "Yasuhisa Shiozaki"
    },
    {
      "weight": 0.4896692633628845,
      "source": "Tomomi Inada",
      "target": "Sanae Takaichi"
    },
    {
      "weight": 0.7263149619102478,
      "source": "Taro Aso",
      "target": "Hironari Seko"
    },
    {
      "weight": 0.6178034543991089,
      "source": "Taro Aso",
      "target": "Shinzo Abe"
    },
    {
      "weight": 0.46518972516059875,
      "source": "Taro Aso",
      "target": "Yasuhisa Shiozaki"
    },
    {
      "weight": 0.8961162567138672,
      "source": "Hironari Seko",
      "target": "Yasuhisa Shiozaki"
    },
    {
      "weight": 1.2007122039794922,
      "source": "Hironari Seko",
      "target": "Shinzo Abe"
    },
    {
      "weight": 0.945235550403595,
      "source": "Hironari Seko",
      "target": "Sanae Takaichi"
    },
    {
      "weight": 0.9955565333366394,
      "source": "Yasuhisa Shiozaki",
      "target": "Shinzo Abe"
    },
    {
      "weight": 0.9067516922950745,
      "source": "Yasuhisa Shiozaki",
      "target": "Sanae Takaichi"
    },
    {
      "weight": 1.053189754486084,
      "source": "Sanae Takaichi",
      "target": "Shinzo Abe"
    }
  ]
}

Recommended Posts

Informations sur les réunions d'apprentissage automatique pour HRTech
Ensemble de données pour l'apprentissage automatique
Prétraitement japonais pour l'apprentissage automatique
14 newsletters par e-mail utiles pour collecter des informations sur l'apprentissage automatique
<Pour les débutants> bibliothèque python <Pour l'apprentissage automatique>
[Balisage recommandé pour l'apprentissage automatique # 4] Script d'apprentissage automatique ...?
Amplifiez les images pour l'apprentissage automatique avec Python
Premiers pas pour les débutants en apprentissage automatique (IA)
Une introduction à OpenCV pour l'apprentissage automatique
Pourquoi Python est choisi pour l'apprentissage automatique
Méthode d'encodage à chaud "utilisable" pour l'apprentissage automatique
[Python] Conception d'applications Web pour l'apprentissage automatique
Une introduction à Python pour l'apprentissage automatique
Créer un environnement de développement pour l'apprentissage automatique
[Memo] Apprentissage automatique
Classification de l'apprentissage automatique
Exemple d'apprentissage automatique
Début de l'apprentissage automatique (matériel didactique / informations recommandés)
Ordre d'étude recommandé pour les débutants en apprentissage automatique / apprentissage en profondeur
Apprentissage automatique à partir de 0 pour les étudiants en physique théorique # 1
[Python] Collectez des images avec Icrawler pour l'apprentissage automatique [1000 feuilles]
Classer les informations liées à l'apprentissage automatique par modèle de sujet
Apprentissage automatique à partir de 0 pour les étudiants en physique théorique # 2
Collecter des images pour l'apprentissage automatique (API Bing Search)
[Pour les débutants] Introduction à la vectorisation dans l'apprentissage automatique
Résumé du didacticiel d'apprentissage automatique
Script Python de collection d'images pour créer des ensembles de données pour l'apprentissage automatique
Apprentissage automatique sur le surapprentissage
Créez un environnement interactif pour l'apprentissage automatique avec Python
[Balisage recommandé dans le machine learning # 2.5] Modification du script de scraping
Apprentissage automatique ⑤ Résumé AdaBoost
Apprentissage automatique: supervisé - AdaBoost
Régression logistique d'apprentissage automatique
Mémo d'apprentissage Python pour l'apprentissage automatique par Chainer chapitres 1 et 2
Renforcer l'apprentissage de la troisième ligne
Machine de vecteur de support d'apprentissage automatique
Étudier l'apprentissage automatique ~ matplotlib ~
Régression linéaire d'apprentissage automatique
Mémo du cours d'apprentissage automatique
Préparation au démarrage de «Python Machine Learning Programming» (pour macOS)
Apprentissage automatique (TensorFlow) + Lotto 6
Apprenez en quelque sorte le machine learning
Méthode d'étude pour apprendre le machine learning à partir de zéro (version mars 2020)
Résumé de l'apprentissage RAPIDS
Mémo de construction d'environnement d'apprentissage automatique par Python
xgboost: modèle d'apprentissage automatique efficace pour les données de table
Bibliothèque d'apprentissage automatique Shogun
Défi de lapin d'apprentissage automatique
Introduction à l'apprentissage automatique
Tout pour que les débutants puissent faire du machine learning
Apprentissage automatique: k-voisins les plus proches
Qu'est-ce que l'apprentissage automatique?
Reconstruction de l'environnement pour l'apprentissage automatique avec Miniconda (version Windows)
Créer un environnement d'apprentissage automatique à l'aide de Python sur MacOSX
Vérification des performances du prétraitement des données pour l'apprentissage automatique (données numériques) (partie 2)
Utilisation d'icrawler plus simple pour la collecte de données d'apprentissage automatique
Résumé du site où vous pouvez apprendre gratuitement le machine learning
J'ai essayé d'utiliser Tensorboard, un outil de visualisation pour l'apprentissage automatique
Pour ceux qui souhaitent démarrer l'apprentissage automatique avec TensorFlow2
Comment utiliser l'apprentissage automatique pour le travail? 03_Procédure de codage Python
Ingénierie des fonctionnalités pour l'apprentissage automatique à partir de la partie 3 Échelle collaborative de Google