So verwenden Sie Tweepy, eine Python-Bibliothek, um eine große Anzahl Ihrer Tweets zu sammeln.
--Verwenden Sie die Python3-Serie (Personen der Python2-Serie sollten ihr Bestes geben) --Tweepy geht davon aus, dass es bereits installiert ist.
Tweet_data.py
# -*- coding: utf-8 -*-
import tweepy
#Tweepy Einstellungen
CONSUMER_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
CONSUMER_SECRET = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET)
ACCESS_TOKEN = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
ACCESS_SECRET = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
auth.set_access_token(ACCESS_TOKEN, ACCESS_SECRET)
api = tweepy.API(auth)
i = 1
with open("Tweet_data.txt", "a+") as tf:
for status in tweepy.Cursor(api.user_timeline).items():
try:
status = str(status.text).replace("\n","") #Zeilenumbrüche in Tweets entfernen
if "RT" in status: #RT schreibt nicht
pass
elif "https" in status: #Schreiben Sie keine Tweets mit Bildern und URLs
pass
elif "@" in status: #Entfernen Sie im Falle eines Rips die ID und schreiben Sie
status = status[status.find(" ")+1:len(status)] # "@"Von" "Holen Sie sich den Index und danach nur den Teil
tf.write(status+"\n")
print("Step%d: "%(i) +status) #In die txt-Datei geschriebene Tweets anzeigen
i += 1
else:
tf.write(status+"\n")
print("Step%d: "%(i) +status) #In die txt-Datei geschriebene Tweets anzeigen
i += 1
except UnicodeEncodeError: #Wenn ich laufe, erhalte ich plötzlich einen UnicodeEncodeError, der jedoch fortgesetzt wird
pass
Wenn dieser Code ausgeführt wird, wird er bis zum ersten Tweet für immer in die txt-Datei geschrieben. Wenn also genügend Tweets gesammelt werden und Sie ihn mit Strg + c entsprechend unterbrechen, wird er in der txt-Datei gespeichert.
Es ist mir gelungen, eine große Menge meiner Tweets zu sichern
Ich möchte das Sprachmodellnetzwerk kennen
Ero
Immerhin Massenmüll
Wie viele Tweet-Daten soll ich sammeln?
Möglicherweise erhalten Sie dadurch einen Unicode-Fehler
Pass auf dich auf ... Wenn du das Gefühl hast, dass etwas nicht stimmt, geh ins Krankenhaus und sieh es dir an.
Sollte kaufen
Ist es ein bisschen besser, wenn Sie es waschen?
Die Quelle ist meine Oma
Nun, vielleicht schwillt es an und es tut nur eine Weile weh
Wenn dies ein streunender Hund war, war er tot
Wenn Sie es nicht desinfizieren, werden Sie nicht sterben, aber es wird anschwellen ...
e…! ?? !! ?? !! ?? Ich habe es nicht desinfiziert! ?? !! ?? !! ?? !! ??
Es war gut
Bist du in Ordnung…
UnicodeEncodeError: 'cp932' codec can't encode character '\U0001f4a2' in position 28: illegal multibyte sequence
Ich bin wirklich besorgt ...
Ich mache mir Sorgen um das, worüber ich mir Sorgen mache, auch wenn mir gesagt wird, dass es in Ordnung ist
Ich bin wirklich besorgt
Sorge
Ist es wirklich okay?
Nein nein Nein Nein Nein
Variable.find[x:y]Scheint zu gehen
Ich möchte erst nach dem Leerzeichen extrahieren
Zum Beispiel @JUN_NETZWERKE Wenn es einen Rip gab, möchte ich nur den ID-Teil löschen und nur den Text wie diesen Rip herausnehmen
@Gibt es eine Möglichkeit, nur die leeren Zeichen aus der Zeichenfolge zu entfernen?
Ich sagte, dass es ziemlich gut war, aber irgendwo habe ich die ID von Lip bekommen, also muss ich sie löschen
Es sieht überhaupt nicht gut aus
Fein…?
Von einem Nordhund zu sehr gebissen werden ...
Nun, Sie können eine Datei wie diese erstellen.
Wenn Sie Fragen haben, hinterlassen Sie bitte einen Kommentar oder senden Sie mir einen Rip an meine Twitter und ich werde antworten.
Recommended Posts