Voici comment utiliser Tweepy, une bibliothèque Python, pour collecter un grand nombre de vos tweets.
--Utilisez la série Python3 (les personnes de la série Python2 devraient faire de leur mieux) --Tweepy parle en supposant qu'il est déjà installé.
Tweet_data.py
# -*- coding: utf-8 -*-
import tweepy
#Paramètres Tweepy
CONSUMER_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
CONSUMER_SECRET = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET)
ACCESS_TOKEN = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
ACCESS_SECRET = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
auth.set_access_token(ACCESS_TOKEN, ACCESS_SECRET)
api = tweepy.API(auth)
i = 1
with open("Tweet_data.txt", "a+") as tf:
for status in tweepy.Cursor(api.user_timeline).items():
try:
status = str(status.text).replace("\n","") #Supprimer les sauts de ligne dans les tweets
if "RT" in status: #RT n'écrit pas
pass
elif "https" in status: #N'écrivez pas de tweets avec des images et des URL
pass
elif "@" in status: #Dans le cas de rip, supprimez l'ID et écrivez
status = status[status.find(" ")+1:len(status)] # "@"De" "Obtenez l'index et obtenez seulement la partie après cela
tf.write(status+"\n")
print("Step%d: "%(i) +status) #Afficher les tweets écrits dans un fichier txt
i += 1
else:
tf.write(status+"\n")
print("Step%d: "%(i) +status) #Afficher les tweets écrits dans un fichier txt
i += 1
except UnicodeEncodeError: #Lorsque je suis en cours d'exécution, j'obtiens soudainement une erreur UnicodeEncodeError, mais cela continue
pass
Lorsque ce code est exécuté, il continuera à écrire dans le fichier txt pour toujours jusqu'au premier tweet, donc si suffisamment de tweets sont collectés, si vous l'interrompez correctement avec ctrl + c, il sera enregistré dans le fichier txt.
J'ai réussi à sécuriser une grande partie de mes tweets
Je veux connaître le réseau de modèles linguistiques
Ero
Après tout, poubelle de masse
Combien de données de tweet dois-je collecter
Peut-être que cela vous donnera une erreur Unicode
Faites attention ... Si vous pensez que quelque chose ne va pas, allez à l'hôpital et voyez-le.
Devriez acheter
Est-ce un peu mieux si vous le lavez?
La source est ma grand-mère
Eh bien, peut-être que ça gonfle et ça ne fait mal que pendant un moment
Si c'était un chien errant, il était mort
Si vous ne la désinfectez pas, vous ne mourrez pas, mais elle gonflera ...
e…! ?? !! ?? !! ?? Je ne l'ai pas désinfecté! ?? !! ?? !! ?? !! ??
C'était bon
Est-ce que ça va…
UnicodeEncodeError: 'cp932' codec can't encode character '\U0001f4a2' in position 28: illegal multibyte sequence
Je suis vraiment inquiet ...
Je m'inquiète de ce qui m'inquiète même si on me dit que ça va
Je suis vraiment inquiet
inquiéter
Est-ce vraiment bien
Non non Non Non Non
variable.find[x:y]Semble aller
Je veux extraire uniquement après le caractère vide
Par exemple @JUN_RÉSEAUX Quand il y a eu une déchirure, je veux effacer uniquement la partie ID et retirer uniquement le texte comme cette déchirure
@Existe-t-il un moyen de supprimer uniquement les caractères vides de la chaîne?
J'ai dit que c'était plutôt bien, mais quelque part j'ai eu l'ID de Lip, donc je dois l'effacer
Ça ne va pas du tout
D'accord…?
Être trop mordu par un chien du Nord ...
Eh bien, vous pouvez créer un fichier comme celui-ci.
Si vous avez des questions, laissez un commentaire ou envoyez-moi une copie sur mon Twitter et je répondrai.
Recommended Posts