[PYTHON] [Notizen] ① Tweets abrufen und speichern ~ Ich möchte die Nachrichten-Tweets identifizieren, die verbreitet werden ~

Entwicklungsumgebung

Windows10 Anaconda3 ( jupyter notebook )

Beschreibung und Zweck

Ein Memorandum der Abschlussarbeit eines Universitätsstudenten Das Thema ist, einen Diskriminator zwischen dem, was verbreitet wird und dem, was nicht in Nachrichtentweets verbreitet wird, zu schaffen. Dieses Mal schreibe ich darüber, Tweet darin zu bekommen.

Voraussetzungen

・ Tweet Entwickler zertifiziert ・ Tweepy installiert

Referenz

https://qiita.com/i_am_miko/items/a2e5168e619ed37afeb9

Holen Sie sich Tweets

Das Konto, das Sie erhalten möchten, ist @livedoornews. Der Grund ist, dass es sich durch die Anzahl der Follower und die Sensibilität dieser Follower auszeichnet (ob die RT verbessert werden soll).

get_newstweet.ipynb


#Importieren Sie die erforderlichen Bibliotheken
import tweepy
import pandas as pd

get_newstweet.ipynb



#Einstellungen für Verbraucherschlüssel und Zugriffstoken für die Verwendung der Twitter-API
Consumer_key = "API key"
Consumer_secret = "API secret Key"
Access_token = "Access token"
Access_secret = "Access token secret"

#Authentifizierung
auth = tweepy.OAuthHandler(Consumer_key,Consumer_secret)
auth.set_access_token(Access_token, Access_secret)
api = tweepy.API(auth)

get_newstweet.ipynb


#Geben Sie den Kontonamen an
acount = "@livedoornews"
"""
Erfassungsinhalt: Tweet-Nummer, Zeit, Tweet-Text, Anzahl der Likes, Anzahl der RTs
"""
def get_tweets(acount):
    tweet_data = [] #Leere Liste zum Speichern der abzurufenden Daten
    for tweet in tweepy.Cursor(api.user_timeline,screen_name = acount,exclude_replies = True).items():
        tweet_data.append([tweet.id,tweet.created_at,tweet.text.replace('\n',''),tweet.favorite_count,tweet.retweet_count])
        df = pd.DataFrame(tweet_data,columns=['tweet_no', 'time', 'text', 'favorite_count', 'RT_count']) #In Pandas DataFrame gespeichert
    return df

df = get_tweets(acount)

Speichern Sie die abgerufenen Tweets (csv)

Wenn Sie weiterhin Tweets mit der oben genannten Funktion aufnehmen möchten, müssen Sie zusätzliche Daten speichern. Daher habe ich zwei Speichermethoden erstellt, eine für das neue Speichern und die andere für das zusätzliche Speichern.

Speichern Sie zuerst neu

get_newstweet.ipynb


#Neu speichern
file_name = "../data/tweet_{}.csv".format(acount)
df.to_csv(file_name, index=False) #Index wird oft nicht benötigt
Zweitens speichern überschreiben speichern

get_newstweet.ipynb


#Speichern überschreiben
file_name = "../data/tweet_{}.csv".format(acount)
pre_df = pd.read_csv(file_name) #Laden Sie die vorherige CSV
df = pd.concat([df, pre_df])
df = df.drop_duplicates(subset=['tweet_no']) #Duplikate mit Tweet Nr. Löschen.(Hinterlassen Sie die neuen Daten)
df.to_csv(file_name, index=False)

Zusammenfassung und nächster Inhalt

Das ist alles zum Abrufen und Speichern von Tweets. Ich denke, es gibt einen besseren Weg, um neue zu speichern oder zu überschreiben. Nächstes Mal möchte ich RT und URL löschen.

Recommended Posts

[Notizen] ① Tweets abrufen und speichern ~ Ich möchte die Nachrichten-Tweets identifizieren, die verbreitet werden ~
Ich möchte visualisieren, wo und wie viele Leute in der Fabrik sind
Ich möchte den Dateinamen, die Zeilennummer und den Funktionsnamen in Python 3.4 erhalten
Ich möchte Betriebsinformationen über die Yahoo-Route erhalten
Ich möchte den EDINET-Code und die Wertpapiernummer zuordnen
Keras Ich möchte die Ausgabe einer beliebigen Ebene erhalten !!
Ich möchte Informationen von fstab am ssh-Verbindungsziel abrufen und den Befehl ausführen
Ich möchte den Namen der ausgeführten Funktion / Methode erhalten
Ich möchte die Ausführungszeit aufzeichnen und ein Protokoll führen.
[Für Anfänger] Ich möchte den Index eines Elements erhalten, das einen bestimmten bedingten Ausdruck erfüllt
Memorandum Regulärer Ausdruck Wenn die Zeichenfolge mehrere Zeichen enthält, die Sie trennen möchten
Ich möchte die Verarbeitung zwischen Testzeit und Produktionsumgebung trennen
Erhalten Sie Tweets mit der Google Cloud-Funktion und speichern Sie Bilder automatisch in Google Fotos
Ich möchte die Gefühle von Menschen analysieren, die sich treffen und zittern wollen
Ich habe das VGG16-Modell mit Keras implementiert und versucht, CIFAR10 zu identifizieren
Ich möchte Spyder an die Taskleiste anheften
Ich möchte kühl auf die Konsole ausgeben
Ich möchte mit dem Reim Teil1 umgehen
Ich möchte mit dem Reim part3 umgehen
Ich möchte den Fortschrittsbalken anzeigen
Ich möchte mit dem Reim part2 umgehen
Ich möchte mit dem Reim part5 umgehen
Ich möchte mit dem Reim part4 umgehen
Die mit vim bearbeitete Datei war schreibgeschützt, aber ich möchte sie speichern
Ich möchte den Pfad des Verzeichnisses abrufen, in dem die laufende Datei gespeichert ist.
Python Ich weiß nicht, wie ich den Druckernamen bekomme, den ich normalerweise benutze.
Die Geschichte der IPv6-Adresse, die ich auf ein Minimum beschränken möchte
Ich möchte eine Datei auf tkinter ablegen und ihren Pfad abrufen [Tkinter DnD2]
Python-Programmierung: Ich habe versucht, Nachrichtenartikel mit Selenium und BeautifulSoup4 abzurufen (zu crawlen)
Ich möchte gleichzeitig einen Musik-Player erstellen und Musik ablegen
Ich habe versucht, die Operationen zusammenzufassen, die wahrscheinlich mit numpy-stl verwendet werden
Ich möchte ein Programm ausführen und verteilen, das die Größe von Bildern in Python3 + Pyinstaller ändert
Ich habe versucht, die Daten mit Zwietracht zu speichern
Ich möchte mit dem Reim part7 (BOW) umgehen
Ich möchte die Daten von League of Legends ③ erhalten
Ich möchte die Daten von League of Legends ② erhalten
Ich möchte das Erscheinungsbild von zabbix anpassen
Ich möchte League of Legends-Daten erhalten ①
Ich möchte die Aktivierungsfunktion Mish verwenden
Ich möchte den Fortschritt in Python anzeigen!
[LPIC 101] Ich habe versucht, die Befehlsoptionen zusammenzufassen, die leicht zu Fehlern führen können
Ich möchte mit dem Linux-Kernel beginnen. Wie ist die Listenkopfstruktur?
Ich habe versucht, die Syntax zu bewerten, die mit der COTOHA-API zu humorvoll und humorvoll war.
Ich möchte die Variablen in der Python-Vorlagendatei ersetzen und in einer anderen Datei in Massenproduktion herstellen
Eine Lösung für das Problem, dass Dateien mit [und] nicht in glob.glob () aufgeführt sind
Ich möchte mit Python nur das Gesicht aus einem Personenbild ausschneiden und speichern ~ Gesichtserkennung und Zuschneiden mit face_recognition ~
Ich möchte den Dateinamen von DataLoader sehen
Holen Sie sich den Titel der Yahoo News und analysieren Sie die Stimmung
Ich habe versucht, mit VOICEROID2 2 automatisch zu lesen und zu speichern
Ich möchte schnell UUID generieren (Gedenknotiz) ~ Python Edition ~
Ich möchte das Ausführungsergebnis von strace erfassen
Ich möchte in der Django-Verschiebungstabelle scrollen, aber ...
Ich möchte die Optimierung mit Python und CPlex behandeln
Ich möchte mit Python-Datenklasse nach hinten erben
Ich möchte die Grundlagen von Bokeh vollständig verstehen
Ich möchte in Python schreiben! (3) Verwenden Sie Mock