Ich habe ein Python-Skript erstellt, das Line Talk analysiert, also werde ich es teilen. Es gibt viele Artikel, die Twitter in natürlicher Sprache mit janome verarbeiten und analysieren, aber ich dachte, dass es niemanden gibt, der auf Line abzielt.
Code: https://github.com/nashimo/LineAnalyzer
Das Folgende ist das Ergebnis einer Analyse basierend auf der Gesprächsgeschichte zwischen mir (Python) und Rinna. Die folgenden Dateien und Bilder werden generiert. Rinna spricht gut, daher gibt es viel Rauschen (störende Wörter usw.), aber dies ist ein Beispielbild. Es ist sehr interessant, das Gespräch der Gruppe zu analysieren. Da sich die erste Person und die verwendeten Wörter von Person zu Person unterscheiden, erscheint die Persönlichkeit dieser Person.
Statistiken
statistics.txt
===Statistiken===
Mitglied:Rinna Pythonian
Zeitraum: 2016/05/23~2020/09/20
Gesprächsstatistik
Rinna:244 Zeilen 9445 Zeichen
pythonian:226 Zeilen 1310 Zeichen
Telefonzeit: 00:00:00
Stempel:5 mal
Bildübertragung:66 mal
Gesprächsvolumen Die Zunahme der Anzahl der Zeichen im Laufe der Zeit wird täglich und kumulativ angezeigt (incl_chars.png).
Antwortfrequenz Rinna antwortet sofort, also stecke ich bei 0 fest (interval.png).
Verwendete Piktogramme Dies ist ein häufig verwendetes Piktogramm (emoji_freq.png).
Wortwolke (nur für Rinna)
Wenn es nicht funktioniert, installieren Sie das Paket entsprechend. Ich erstelle eine Umgebung mit anaconda @ Windows10.
--Export Line-Gespräche (oder Gruppen) von Ihrem PC oder Smartphone in eine Datei Die Exportmethode lautet beispielsweise wie folgt. https://www.appbank.net/2020/06/15/iphone-application/1911418.php --Geben Sie die exportierte Datei an line_analysis.py Übergeben Sie den Dateinamen im Hauptprozess von line_analysis.py an fname.
line_analysis.py
if __name__ == "__main__":
fname = "[LINE]Sprich mit Rinna"
lta, nlp = file2process(fname, media="Phone")
> Python line_analysis.py
`nlp.show_emoji_freq (min_freq = 1)`
). Bitte ändern Sie die Anzahl entsprechend.Es ist im Grunde nur eine Kombination der Informationen in den Referenzen. Es gab jedoch nichts, was für die Linienanalyse verwendet werden könnte, daher denke ich, dass es für jemanden in diesem Teil hilfreich sein könnte. Das heißt, es ist nur eine mühsame Aufgabe.
[1] Ich habe ein gestapeltes Balkendiagramm mit matplotlib von Python erstellt und eine Datenbeschriftung hinzugefügt. https://qiita.com/s_fukuzawa/items/6f9c1a3d4c4f98ae6eb1 [2] Matplotlib kann jetzt Japanisch auf einem PC anzeigen, ohne zusätzliche Schriftarten zu installieren https://qiita.com/yniji/items/2f0fbe0a52e3e067c23c [3] Der Analysator von Python Janome ist praktisch https://ohke.hateblo.jp/entry/2017/11/02/230000 [4] Ich habe versucht, Tweets mit Word Cloud (Python) zu visualisieren. https://qiita.com/turmericN/items/04cd0b40f91076f0ef42 [5] Ich habe die Texte von B'z mit Python und maschinellem Lernen analysiert ~ Datenerfassung ~ https://pira-nino.hatenablog.com/entry/2018/07/27/B%27z%E3%81%AE%E6%AD%8C%E8%A9%9E%E3%82%92Python%E3%81%A8%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%81%A7%E5%88%86%E6%9E%90%E3%81%97%E3%81%A6%E3%81%BF%E3%81%9F_%E3%80%9C%E3%83%87%E3%83%BC%E3%82%BF
Recommended Posts