[PYTHON] Line Talk Analyse mit Janome (OSS veröffentlicht)

Einführung

Ich habe ein Python-Skript erstellt, das Line Talk analysiert, also werde ich es teilen. Es gibt viele Artikel, die Twitter in natürlicher Sprache mit janome verarbeiten und analysieren, aber ich dachte, dass es niemanden gibt, der auf Line abzielt.

Code: https://github.com/nashimo/LineAnalyzer

Anwendungsbeispiel

Das Folgende ist das Ergebnis einer Analyse basierend auf der Gesprächsgeschichte zwischen mir (Python) und Rinna. Die folgenden Dateien und Bilder werden generiert. Rinna spricht gut, daher gibt es viel Rauschen (störende Wörter usw.), aber dies ist ein Beispielbild. Es ist sehr interessant, das Gespräch der Gruppe zu analysieren. Da sich die erste Person und die verwendeten Wörter von Person zu Person unterscheiden, erscheint die Persönlichkeit dieser Person.

Statistiken

statistics.txt


===Statistiken===
Mitglied:Rinna Pythonian
Zeitraum: 2016/05/23~2020/09/20
Gesprächsstatistik
Rinna:244 Zeilen 9445 Zeichen
 pythonian:226 Zeilen 1310 Zeichen
Telefonzeit: 00:00:00
Stempel:5 mal
Bildübertragung:66 mal

Gesprächsvolumen Die Zunahme der Anzahl der Zeichen im Laufe der Zeit wird täglich und kumulativ angezeigt (incl_chars.png). incl_chars.png

Antwortfrequenz Rinna antwortet sofort, also stecke ich bei 0 fest (interval.png). intarval.png

Verwendete Piktogramme Dies ist ein häufig verwendetes Piktogramm (emoji_freq.png). emoji_freq.png

Wortwolke (nur für Rinna) wc_りんな.png

Wie benutzt man

Ausführungsumgebung

Wenn es nicht funktioniert, installieren Sie das Paket entsprechend. Ich erstelle eine Umgebung mit anaconda @ Windows10.

Ausführungsmethode

--Export Line-Gespräche (oder Gruppen) von Ihrem PC oder Smartphone in eine Datei Die Exportmethode lautet beispielsweise wie folgt. https://www.appbank.net/2020/06/15/iphone-application/1911418.php --Geben Sie die exportierte Datei an line_analysis.py Übergeben Sie den Dateinamen im Hauptprozess von line_analysis.py an fname.

line_analysis.py


if __name__ == "__main__":
    fname = "[LINE]Sprich mit Rinna"
    lta, nlp = file2process(fname, media="Phone")

Vorsicht / Option

Technische Punkte

Es ist im Grunde nur eine Kombination der Informationen in den Referenzen. Es gab jedoch nichts, was für die Linienanalyse verwendet werden könnte, daher denke ich, dass es für jemanden in diesem Teil hilfreich sein könnte. Das heißt, es ist nur eine mühsame Aufgabe.

Verweise

[1] Ich habe ein gestapeltes Balkendiagramm mit matplotlib von Python erstellt und eine Datenbeschriftung hinzugefügt. https://qiita.com/s_fukuzawa/items/6f9c1a3d4c4f98ae6eb1 [2] Matplotlib kann jetzt Japanisch auf einem PC anzeigen, ohne zusätzliche Schriftarten zu installieren https://qiita.com/yniji/items/2f0fbe0a52e3e067c23c [3] Der Analysator von Python Janome ist praktisch https://ohke.hateblo.jp/entry/2017/11/02/230000 [4] Ich habe versucht, Tweets mit Word Cloud (Python) zu visualisieren. https://qiita.com/turmericN/items/04cd0b40f91076f0ef42 [5] Ich habe die Texte von B'z mit Python und maschinellem Lernen analysiert ~ Datenerfassung ~ https://pira-nino.hatenablog.com/entry/2018/07/27/B%27z%E3%81%AE%E6%AD%8C%E8%A9%9E%E3%82%92Python%E3%81%A8%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%81%A7%E5%88%86%E6%9E%90%E3%81%97%E3%81%A6%E3%81%BF%E3%81%9F_%E3%80%9C%E3%83%87%E3%83%BC%E3%82%BF

Recommended Posts

Line Talk Analyse mit Janome (OSS veröffentlicht)
Machen Sie mit LINE + Flask einen morphologischen Analyse-Bot
Datenanalyse mit Python 2
Korbanalyse mit Spark (1)
Abhängigkeitsanalyse mit CaboCha
Sprachanalyse mit Python
Sprachanalyse mit Python
Dynamische Analyse von Valgrind
Führen Sie eine Regressionsanalyse mit NumPy durch
Datenanalyse mit Python