[PYTHON] Informationen zum maschinell erlernten Meeting für HRTech

TL; DR

Wir werden ein Lernmodell erstellen, um so etwas unter Verwendung von Konferenzdaten zu erstellen. membersearch-min.png

Der gesamte Artikel ist hier.

1. Prämisse

Das Folgende sind Sitzungsdaten, die auf dem Protokoll des Parlaments basieren.

2. Maschinelles Lernen

Berechnen Sie die Sätze, die für jedes Mitglied charakteristisch sind, und den Grad der Ähnlichkeit zwischen jedem Mitglied. Lassen Sie uns darüber nachdenken, was die Sätze ähnlich macht, aber hier werden wir den Ähnlichkeitsgrad mit den folgenden zwei Methoden bewerten.

Hey du da! Sie dachten ** TF-IDF ist kein maschinelles Lernen **! !!

Ja, das ist richtig. Aber die Leute auf der Straße kennen den Unterschied nicht. Wenn das Ergebnis gut aussieht, werden Sie es nicht bemerken. Damit

"AI hat hart gearbeitet! (Smiley)"

Das heißt, es sollte fast kein Problem geben. Es gibt so viele Bilder von KI wie Menschen (Kiri!

2.1 Berechnung der Ähnlichkeit zwischen Personen, die TF-IDF verwenden

Siehe hier. Wenn Sie die Chan-Scipy-Bibliothek verwenden, können auch spärliche Matrizen, die zum Wachsen neigen, stressfrei verarbeitet werden.

2.2 Berechnung der Ähnlichkeit zwischen Personen mit doc2vec

Siehe hier. Mit dem Gensim-Paket ist es einfach zu lernen.

3. Netzwerkanalyse

Siehe hier.

Erstellen Sie ein Netzwerkdiagramm und verwenden Sie eine Technik namens Louvain-Methode, um Personen mit ähnlichen Bemerkungen aus dem Netowrk-Diagramm zu gruppieren.

Wenn Sie es visualisieren, erhalten Sie das folgende Ergebnis.

path_to_fig.png

Wenn dieses Netowrk-Diagramm in Json geschrieben ist, lauten die spezifischen Inhalte wie folgt.

{
  "directed": false,
  "multigraph": false,
  "graph": {},
  "nodes": [
    {
      "size": 3,
      "cluster": 1,
      "id": "Tomomi Inada"
    },
    {
      "size": 54,
      "cluster": 3,
      "id": "Taro Aso"
    },
    {
      "size": 142,
      "cluster": 0,
      "id": "Hironari Seko"
    },
    {
      "size": 39,
      "cluster": 4,
      "id": "Yasuhisa Shiozaki"
    },
    {
      "size": 30,
      "cluster": 1,
      "id": "Sanae Takaichi"
    },
    {
      "size": 95,
      "cluster": 1,
      "id": "Shinzo Abe"
    }
  ],
  "links": [
    {
      "weight": 0.5984722375869751,
      "source": "Tomomi Inada",
      "target": "Hironari Seko"
    },
    {
      "weight": 0.9666371941566467,
      "source": "Tomomi Inada",
      "target": "Shinzo Abe"
    },
    {
      "weight": 0.48173508048057556,
      "source": "Tomomi Inada",
      "target": "Yasuhisa Shiozaki"
    },
    {
      "weight": 0.4896692633628845,
      "source": "Tomomi Inada",
      "target": "Sanae Takaichi"
    },
    {
      "weight": 0.7263149619102478,
      "source": "Taro Aso",
      "target": "Hironari Seko"
    },
    {
      "weight": 0.6178034543991089,
      "source": "Taro Aso",
      "target": "Shinzo Abe"
    },
    {
      "weight": 0.46518972516059875,
      "source": "Taro Aso",
      "target": "Yasuhisa Shiozaki"
    },
    {
      "weight": 0.8961162567138672,
      "source": "Hironari Seko",
      "target": "Yasuhisa Shiozaki"
    },
    {
      "weight": 1.2007122039794922,
      "source": "Hironari Seko",
      "target": "Shinzo Abe"
    },
    {
      "weight": 0.945235550403595,
      "source": "Hironari Seko",
      "target": "Sanae Takaichi"
    },
    {
      "weight": 0.9955565333366394,
      "source": "Yasuhisa Shiozaki",
      "target": "Shinzo Abe"
    },
    {
      "weight": 0.9067516922950745,
      "source": "Yasuhisa Shiozaki",
      "target": "Sanae Takaichi"
    },
    {
      "weight": 1.053189754486084,
      "source": "Sanae Takaichi",
      "target": "Shinzo Abe"
    }
  ]
}

Recommended Posts

Informationen zum maschinell erlernten Meeting für HRTech
Datensatz für maschinelles Lernen
Japanische Vorverarbeitung für maschinelles Lernen
14 E-Mail-Newsletter zum Sammeln von Informationen zum maschinellen Lernen
<Für Anfänger> Python-Bibliothek <Für maschinelles Lernen>
[Empfohlenes Tagging für maschinelles Lernen # 4] Skript für maschinelles Lernen ...?
Verstärken Sie Bilder für maschinelles Lernen mit Python
Erste Schritte für Anfänger des maschinellen Lernens (KI)
Eine Einführung in OpenCV für maschinelles Lernen
Warum Python für maschinelles Lernen ausgewählt wird
"Verwendbare" One-Hot-Codierungstechnik für maschinelles Lernen
[Python] Webanwendungsdesign für maschinelles Lernen
Eine Einführung in Python für maschinelles Lernen
Erstellen einer Entwicklungsumgebung für maschinelles Lernen
[Memo] Maschinelles Lernen
Klassifikation des maschinellen Lernens
Beispiel für maschinelles Lernen
Beginn des maschinellen Lernens (empfohlene Unterrichtsmaterialien / Informationen)
Empfohlene Studienreihenfolge für Anfänger des maschinellen Lernens / Deep Learning
Maschinelles Lernen ab 0 für theoretische Physikstudenten # 1
[Python] Sammeln Sie Bilder mit Icrawler für maschinelles Lernen [1000 Blatt]
Klassifizieren Sie Informationen zum maschinellen Lernen nach Themenmodellen
Maschinelles Lernen ab 0 für theoretische Physikstudenten # 2
Sammeln Sie Bilder für maschinelles Lernen (Bing Search API)
[Für Anfänger] Einführung in die Vektorisierung beim maschinellen Lernen
Zusammenfassung des Lernprogramms für maschinelles Lernen
Bildersammlung Python-Skript zum Erstellen von Datensätzen für maschinelles Lernen
Maschinelles Lernen Über Overlearning
Erstellen Sie mit Python eine interaktive Umgebung für maschinelles Lernen
[Empfohlenes Tagging beim maschinellen Lernen # 2.5] Änderung des Scraping-Skripts
Maschinelles Lernen ⑤ AdaBoost-Zusammenfassung
Maschinelles Lernen: Betreut --AdaBoost
Logistische Regression beim maschinellen Lernen
Python-Lernnotiz für maschinelles Lernen von Chainer Kapitel 1 und 2
Stärkung des Lernens der dritten Zeile
Maschinelles Lernen unterstützt Vektormaschine
Maschinelles Lernen studieren ~ matplotlib ~
Lineare Regression des maschinellen Lernens
Memo zum Kurs für maschinelles Lernen
Vorbereitung zum Starten von "Python Machine Learning Programming" (für macOS)
Maschinelles Lernen (TensorFlow) + Lotto 6
Lerne irgendwie maschinelles Lernen
Lernmethode zum Lernen von maschinellem Lernen von Grund auf neu (Version März 2020)
Zusammenfassung zum Lernen von RAPIDS
Konstruktionsnotiz für eine maschinelle Lernumgebung von Python
xgboost: Effektives Modell für maschinelles Lernen für Tabellendaten
Bibliothek für maschinelles Lernen Shogun
Maschinelles Lernen Kaninchen Herausforderung
Einführung in das maschinelle Lernen
Alles für Anfänger, um maschinelles Lernen zu können
Maschinelles Lernen: k-Nächste Nachbarn
Was ist maschinelles Lernen?
Neuerstellung der Umgebung für maschinelles Lernen mit Miniconda (Windows-Version)
Erstellen Sie eine Umgebung für maschinelles Lernen mit Python unter MacOSX
Leistungsüberprüfung der Datenvorverarbeitung für maschinelles Lernen (numerische Daten) (Teil 2)
Die Verwendung von icrawler zum Sammeln von Daten zum maschinellen Lernen wurde vereinfacht
Site-Zusammenfassung, auf der Sie kostenlos maschinelles Lernen lernen können
Ich habe versucht, Tensorboard zu verwenden, ein Visualisierungstool für maschinelles Lernen
Für diejenigen, die mit TensorFlow2 maschinelles Lernen beginnen möchten
Wie nutzt man maschinelles Lernen für die Arbeit? 03_Python-Codierungsverfahren
Feature Engineering für maschinelles Lernen ab Teil 3 Google Colaboratory-Scale