Hallo, das ist Sunfish. Die Datenanalyse mit Python ist heutzutage populär geworden, aber schwer zu beherrschen. Das Ziel ist es, mit Python zu ringen, und die Geschäftsverbesserung, die ich ursprünglich erreichen wollte, ist hier. .. .. Ich möchte ein Beispiel für die Analyse von Daten mit dem GUI-Tool "nehan" vorstellen, um solche Probleme zu lösen.
Mehr als ein halbes Jahr ist vergangen, seit das Koronavirus zu einem sozialen Problem wurde. Lassen Sie uns die Anzahl der Vorkommen dieses Wortes aus den Tweet-Daten der letzten zwei Monate verfolgen.
nehan kann Twitter-Daten direkt importieren, und diesmal habe ich diese Funktion verwendet. Ich werde es später vorstellen. Täglich ab dem 27. Juli 2020 ** werden 3.000 Tweets einschließlich "Corona" im Tweet-Text gesammelt und Daten für etwa 2 Monate werden vorbereitet. Klicken Sie hier für Details zu den Daten (https://sunfish.nehan.io/datasources_v2/3424).
port_2 = port_1[['Created_At', 'Text']]
port_3 = port_2.copy()
port_3['Created_At'] = pd.to_datetime(
port_3['Created_At'], errors='coerce', foramt=None)
port_3['Created_At'] = port_3['Created_At'].map(lambda x: x.date())
port_4 = port_3.copy()
port_4 = port_4.dropna(subset=None, how='any')
port_5 = port_4[(port_4['Text'].str.contains('Cluster', na=False, regex=False))]
port_9 = port_5.copy()
port_9 = port_9.groupby(['Created_At']).agg(
{'Created_At': ['size']}).reset_index()
port_9.columns = ['Created_At', 'Zeilenanzahl']
Das Wort "Cluster" ist weithin als Symbol für eine explosive Infektion anerkannt. Der Grund, warum es am 9. August geflogen ist, liegt wahrscheinlich am [Cluster Festival] in Shibuya (https://news.yahoo.co.jp/articles/76e47dc2ce6608e018fe37bc92be296e381f76fa?page=1).
Ich habe mir auch dieses Wort angesehen, wodurch ich mich nostalgisch fühlte.
Ein neuer Lebensstil hat Wurzeln geschlagen, aber es scheint, dass die Selbstbeherrschungsstimmung noch nicht vollständig vorbei ist. Es sieht so aus, als würde es allmählich abnehmen.
Um strenge Ergebnisse zu erzielen, muss ich wirklich mehr Vorverarbeitung durchführen, aber ich habe versucht, die Daten nur zum Zweck der groben Beobachtung und Einführung von Nehan zu verarbeiten. Der obige Quellcode ist eine Kopie des Codes, der von nehans [Python-Exportfunktion] ausgegeben wird (https://prtimes.jp/main/html/rd/p/000000004.000044237.html).
Recommended Posts