[PYTHON] [Twitter] Ich möchte die heruntergeladenen vergangenen Tweets (meines Kontos) in eine schöne CSV verwandeln

Auf Twitter "Einstellungen"> "Konten"> "Twiter-Daten"> "Archiv herunterladen" Wie Sie wissen, gibt es eine Funktion zum Herunterladen aller Ihrer vergangenen Tweets. スクリーンショット 2019-12-07 17.53.12.png

Die heruntergeladene Datei enthält Informationen zu früheren Tweets, RT-Tweets, bevorzugten Tweets, Direktnachrichten usw. (Es scheint, dass Sie durchsuchen können, indem Sie index.html öffnen, das normalerweise zusammen heruntergeladen wird, aber in meinem Fall wurde index.html nicht heruntergeladen. Warum?)


Nachskript 2019/12/15
Es scheint, dass index.html in eine Spezifikation geändert wurde, die überhaupt nicht heruntergeladen wurde.

Praktisch, um Ihre eigenen Tweets zu visualisieren und gleichzeitig BERT zu verstehen ↑ Ich habe es nach dem Lesen dieses Artikels bemerkt.

[Gelöst] Ich kann nicht den gesamten Tweet-Verlauf auf Twitter herunterladen [Methode]


Wenn Sie Text Mining oder eine Analyse durchführen möchten, sollten Sie tweet.json lesen. In diesem Artikel werden wir diese JSON-Datei in eine CSV-Datei umwandeln, die für die morphologische Analyse einfach zu verwenden ist. Die zu erstellende CSV besteht aus zwei Spalten: "Zeitstempel" und "Textkörper".

Bild von CSV, das endlich erstellt werden kann n5v579QliBDG6o51575723317_1575723341.png

Umgebung Python 3.6.5 Mac OS Mojave 10.14.4

pandas==0.23.0

Wenn ich den heruntergeladenen JSON öffne, sieht es meiner Meinung nach so aus. tLvy3PlzlPJ2Khh1575731228_1575731416.jpg

Rot unterstrichen

window.YTD.tweet.part0 = 

Ist nicht notwendig, also bitte löschen. Ändern Sie dann die Erweiterung in .txt und legen Sie sie in Ihrem Arbeitsverzeichnis ab.

read_dl_tweet.py


import pandas as pd
import json

tweets_file = open("tweet.txt", "r")
tweet = json.load(tweets_file)

Öffnen Sie json im obigen Skript als Pandas-Datenrahmen. Es gibt viele Spalten, aber nur die erforderlichen Spalten werden extrahiert.

read_dl_tweet.py


df = tweet_data_frame.loc[:,["created_at","full_text"]]

Entfernen Sie diese, da beim Erstellen von CSV störende Zeichen wie Zeilenumbrüche und Kommas auftreten. Ohne Regex = True hat es nicht funktioniert.

read_dl_tweet.py


df = df.replace(['\n',',','	','\r'],'',regex=True)

Außerdem hat das Format des Zeitstempels eine Form, die nicht zum Sortieren verwendet werden kann. Korrigieren Sie es daher, um das Lesen zu erleichtern. Ich konnte es mit der to_datetime-Methode von pandas auf einmal konvertieren.

read_dl_tweet.py


df_date = pd.to_datetime(df["created_at"])
df["date_form"] = df_date
df_sorted = df.sort_values("date_form") 
df_text_date = df_sorted.loc[:,["date_form","full_text"]]

Sortiert nach dem neu erstellten Zeitstempel.

read_dl_tweet.py


df_text_date.to_csv("df_text_date.csv", header=False, index=False,sep=',',encoding='utf-16')

Ändern Sie die Optionen bei der Ausgabe von CSV entsprechend (z. B. indem Sie das Trennzeichen zu einer Registerkarte machen).

In Nächster Artikel werde ich versuchen, die Anzahl der Tweets für jeden Zeitraum aus der erstellten CSV grafisch darzustellen.

Dieser Code: https://github.com/KanikaniYou/plot_tweet_graph

Recommended Posts

[Twitter] Ich möchte die heruntergeladenen vergangenen Tweets (meines Kontos) in eine schöne CSV verwandeln
Ich möchte die Position meines Gesichts mit OpenCV überprüfen!
Ich habe versucht, ein Skript zu erstellen, das die Tweets eines bestimmten Benutzers auf Twitter verfolgt und das veröffentlichte Bild sofort speichert
Ich möchte meine Gefühle mit den Texten von Mr. Children ausdrücken
Python: Ich möchte die Verarbeitungszeit einer Funktion genau messen
Ich möchte Matplotlib zu einem dunklen Thema machen
Ich möchte einen DataFrame in MSSQL einfügen
Ich möchte ein Spiel mit Python machen
Ich möchte Passungen aus meinem Kopf machen
Ich möchte das Erscheinungsbild von zabbix anpassen
Die Geschichte der IPv6-Adresse, die ich auf ein Minimum beschränken möchte
Ich möchte einen Lebenszyklus in der Aufgabendefinition von ECS festlegen
Ich möchte dem Anfang einer WAV-Datei 1 Sekunde lang Stille hinzufügen
Ich möchte eine Liste der WebDAV-Dateien im Modul Anfragen anzeigen
Ermitteln Sie mithilfe der Twitter-API die Anzahl der Tweets, die sich auf ein bestimmtes Keyword beziehen
So erstellen Sie einen Raspberry Pi, der die Tweets eines bestimmten Benutzers spricht
Ich habe "Ich habe versucht, ein Skript zu erstellen, das gepostete Bilder sofort speichert, indem ich zu den Tweets eines bestimmten Benutzers auf Twitter zurückgekehrt bin" überarbeitet.
Ich habe versucht, mit dem Seq2Seq-Modell von TensorFlow so etwas wie einen Chatbot zu erstellen
Ich möchte die Grundlagen von Bokeh vollständig verstehen
Ich möchte einen Screenshot der Site in Docker mit einer beliebigen Schriftart erstellen
Ich möchte ein Paket von Php Redis installieren
Die weltweit am einfachsten zu verstehende Erklärung zur Herstellung von LINE BOT (1) [Kontoerstellung]
Ich möchte die Sicherheit der SSH-Verbindung erhöhen
Notieren Sie sich, was Sie in Zukunft mit Razpai machen möchten
Ich möchte eine wunderschön angepasste Wärmekarte der Korrelationsmatrix ausgeben. matplotlib edition
Ich möchte einen Blog-Editor mit dem Administrator von Django erstellen
Ich möchte viele Prozesse von Python aus starten
Ich möchte ein Klickmakro mit pyautogui (Wunsch) erstellen.
Ich möchte nur die SudachiPy-Normalisierungsverarbeitung verwenden
Ich möchte Betriebsinformationen über die Yahoo-Route erhalten
Ich möchte ein Klickmakro mit pyautogui (Outlook) erstellen.
[Python] Ich habe versucht, die folgende Beziehung von Twitter zu visualisieren
Ich möchte die Authentizität eines Elements eines numpy-Arrays bestimmen
Ich möchte die Natur von Python und Pip kennenlernen
Ich möchte den Wörterbuchtyp in der Liste eindeutig machen
[Visualisierung] Ich möchte mit Plotly ein schönes Diagramm zeichnen
Keras Ich möchte die Ausgabe einer beliebigen Ebene erhalten !!
Ich möchte die Legende der IT-Technologiewelt kennenlernen
Ich möchte eine schöne Ergänzung zu input () in Python hinzufügen
Ich möchte vorerst eine Docker-Datei erstellen.
So verbinden Sie den Inhalt der Liste mit einer Zeichenfolge
Ich habe versucht, eine Site zu erstellen, mit der die aktualisierten Informationen von Azure einfach angezeigt werden können
[Erstes Scraping] Ich habe versucht, einen VIP-Charakter für Smash Bra [Beautiful Soup] zu erstellen. [Zusätzlich Datenanalyse]
Ich möchte die Frage nach der Methode "__init__" und dem Argument "self" der Python-Klasse klären.
Ich möchte Tag-Informationen (Titel und Künstler) einer Musikdatei (flac, wav) extrahieren.
Ich möchte den Namen der ausgeführten Funktion / Methode erhalten
[Pytorch] Ich möchte die Trainingsparameter des Modells manuell zuweisen
Ich habe versucht, ein System zu erstellen, das nur gelöschte Tweets abruft
Ich habe versucht, mit Python einen regulären Ausdruck für "Betrag" zu erstellen
Ich möchte die HTML-Version der OpenCV 3.1-Version "OpenCV-Python Tutorials" lesen
Ich habe versucht, mit Python einen regulären Ausdruck von "Zeit" zu erstellen
Ich wollte mein Gesichtsfoto in einen Yuyu-Stil umwandeln.
[Einführung in StyleGAN] Ich habe mit "The Life of a Man" ♬ gespielt
Ich möchte den Anfang des nächsten Monats mit Python ausgeben
Ich habe versucht, mit Python einen regulären Ausdruck von "Datum" zu erstellen
Ich möchte ein System erstellen, um zu verhindern, dass vergessen wird, den Schlüssel 1 festzuziehen
[Einführung] Ich möchte mit Python einen Mastodon-Bot erstellen! 【Anfänger】
Ich möchte eine Parameterliste aus CloudFormation-Code (yaml) erstellen.
Ich möchte die zweite Zeile zum Spaltennamen in Pandas machen