Wenn Sie entschieden haben, was zu tun ist und die Aussetzung, ist es Ihr Stil, ** von Google zu starten. Kurz gesagt, "** 80% von dem, was ich tun wollte, ist jemand, der es zuerst tut **". Sogar in Qiita, Ähnliche Dinge ( Ich meine, es gibt Leute, die fortgeschrittenere Dinge tun) , und ich habe keine andere Wahl, als es als Referenz zu verwenden, aber leider gibt es keine Fälle, in denen alles in Ordnung ist. Soweit ich Stack Over Flow untersucht habe, gab es keinen Fall, in dem ein Programm veröffentlicht wurde, das die erforderlichen Spezifikationen ordnungsgemäß erfüllen konnte. Es wäre einfacher gewesen, wenn es ... Chi </ sub> gegeben hätte
Selbst wenn Sie durch Kopieren und Einfügen des Skripts etwas erstellen, das den Anforderungen im Bereich des persönlichen Gebrauchs von Skripten entspricht, müssen Sie diesen Bereich anscheinend selbst organisieren.
Es gibt ungefähr zwei Arten der Datenerfassung von Twitter: "** REST-API ** verwendet" und "** Streaming-API ** verwendet". ** REST ** ist eine Möglichkeit, eine Nachricht zu senden und das Ergebnis zurückzugeben, während ** Streaming API ** einen Befehl einmal sendet und das Ergebnis dann endlos an ihn sendet. Es wird gesendet. (Und ich verstehe. Bitte überprüfen Sie die Literatur für Details. )
Der Grund, es überhaupt zu Public Steram zu machen, ist
Es ist ein sehr fauler Grund, dass die Stream-API weniger problematisch zu sein scheint als REST, wenn Sie nur eine geeignete Bibliothek einbringen und sie lesen. Sie sollten einfach weiter werfen, was in die DB gesendet wurde.
Es gibt auch mehrere Stream-APIs, ** "Alles, was zu Twitter fließt (Vertrag erforderlich)" **, ** "Tweets auf meiner Timeline" **, ** "Zufällig 1% der Gesamtzahl" * Es gibt mehrere * und ** "Ergebnisse, die durch Schlüsselwörter, Gebietsschemas usw. für das Ganze eingegrenzt werden" , aber hier die letzten " <a href =" https://dev.twitter.com/streaming/reference " / post / statuses / filter "> Eingeschränkt durch das angegebene Suchwort **" wird verwendet. Public Stream scheint ein Oberbegriff für diese zu sein, aber da bin ich mir nicht sicher. (Ich habe es gerade nachgeschlagen, aber ist es in Ordnung zu verstehen, dass die Gesamtzahl der Tweets, die mit Filfer abgerufen werden können, nicht 1%, sondern alle beträgt?) </ Small>
Vielleicht, weil es ein Rotor-Mensch ist, wird gesagt, dass die Stream-API eine HTTP-Verbindung aufrechterhält, aber sie ist unzuverlässig, oder ** sie trennt die Verbindung, selbst wenn nichts passiert. Ich bin eher vorsichtig, wenn ich nicht verbunden bin **, weil es kein Problem gibt. Selbst wenn Sie sich das vorherige Nachschlagewerk (Taschenreferenz) ansehen, ist es so geschrieben, dass Sie von einer erneuten Verbindung ausgehen müssen, da die Verbindung getrennt wird, wenn etwas passiert. …… Aber selbst wenn Sie sich die Seite einer bekannten Bibliothek oder das Beispiel für die Implementierung selbst ansehen, gibt es keine Seite, die die Wiederverbindung nach dem Trennen * innerhalb des Bereichs beschreibt, den Sie ungefähr sehen können. * * ...... Kannst du das mit der API machen? Wenn ja, war es noch nie so einfach ...
(Hinweis für diejenigen, die wissen: Ich schreibe während des Codierens und Erinnerns entlang der Zeitreihen in meinem Gehirn, also warten Sie bitte eine Weile.)
Ich muss über viele Dinge nachdenken, aber ich habe mich entschlossen, eine mit Twitter verbundene Bibliothek mit vielen japanischen Materialien in Betracht zu ziehen, um auf den wunderbaren Code meiner Vorgänger zu verweisen.
Als ich auf der Datenbankseite unter dem gleichen Gesichtspunkt nach einer Bibliothek suchte,
Eine Eisenplatte, die dazu neigt, passend zu sein? Nun, wenn Shiroto etwas dagegen tun müsste, müsste er den Standard verwenden ...
Nachdem Sie entschieden haben, was verwendet werden soll, bereiten wir eine Entwicklungsumgebung und eine Testumgebung vor. Ich bin ein Gatchigachi Win-Shop, der von VB und in C → VC ++ → C # kam. Die Umgebung, die für die Entwicklung verwendet werden kann, ist natürlich auch Windows. Es versteht sich von selbst, dass es ideal ist, bis kurz vor Release = Implementierung unter Win zu entwickeln. Oder besser gesagt, wenn Sie keine IDE (Integrated Development Environment) haben, werden Sie sofort sterben. Umso mehr, wenn Ihnen gesagt wird, wie es unter Linux geht, haben Sie keine andere Wahl, als sich zu setzen.
Da es sich um eine Skriptsprache handelt, besteht glücklicherweise keine große Abhängigkeit von der Umgebung, und heutzutage ist die Installation von Bibliotheken usw. automatisiert, sodass die Probleme viel geringer sein sollten als in der Vergangenheit.
Ich denke, das ist in Ordnung für die Infrastruktur, aber ich möchte doch IDE verwenden ~~ Ich habe die Welt geleckt ~~ Als ich in einer vertrauten Umgebung gegoogelt wurde, Python-Tools für Visual Studio ist eine wunderbare Sache. ** Darüber hinaus können Sie problemlos vor Ort debuggen, indem Sie die Win-Version Python wie Anaconda aufrufen **. Weil es nur noch das gibt
Beschlossen, mit der Konfiguration zu entwickeln und zu testen. Als Anliegen,
Herum, aber ... Nun, auf jeden Fall ist der eigentliche Maschinentest am Ende notwendig, und wenn Sie ihn nicht gut schreiben, tritt kein Problem auf, also lassen Sie ihn vorerst. (Wenn dies ein Job ist, muss ich ihn leider überall einpacken ...)
Das Programm, das ich dieses Mal mache, enthält die Regel des Teufels, dass Sie, sobald Sie anfangen zu laufen, 3 Monate lang weitermachen können, was Sie wollen, und es stoppen können. Daher werden wir es implementieren, indem wir uns auf die wesentlichen Funktionen konzentrieren und auf andere Weise etwas anderes tun **.
Nun, es sieht so aus. Beginnen wir mit den Elementen mit der höchsten Priorität und verbessern schrittweise den Grad der Perfektion.
Mit dem Gelübde "** Ich habe O'Reillys Python-Tutorial " und " Ich google, wenn ich nicht verstehe **" begann ich vorerst mit der Erstellung eines Demonstrationsprogramms. Geben Sie unter Erstellen eines neuen Projekts in Visual Studio "Python-Anwendung" an, und Sie können Python-Code in Ihrem vertrauten Editor schreiben. Das ist praktisch. Nachdem Sie den Tutorial-Code eingegeben haben, führen Sie ihn mit [F5] aus. Sie können es mit dem gleichen Verfahren wie mit der C-Sprachkonsolen-App versuchen, sodass es wirklich keinen Stress gibt. Es tut mir leid, dass ich nicht treten kann.
Wenn Sie nicht zuerst mit Twitter sprechen können, kommt dies nicht in Frage. Beginnen wir also damit, diesen Bereich zu erstellen. Sie müssen zuerst Tweepy installieren. Wenn Sie der Meinung sind, dass Sie den Befehl "pip" in der Anaconda-Eingabeaufforderung eingeben können, kann dies auch in Visual Studio ausgeführt werden.
Es macht so viel Spaß wie NuGet.
Stream basierend auf einigen Seiten, die Google derzeit gefunden hat, und Tweepys Tutorial Schreiben Sie ein Programm, um Tweets mit API zu erhalten.
tweetCheck.py
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import tweepy
#Bereiten Sie die Variablen vor, die erforderlich sind, um die Twitter-API selbst auszuführen.
CK = '' # Consumer Key
CS = '' # Consumer Secret
AT = '' # Access Token
AS = '' # Accesss Token Secert
class Listener(tweepy.StreamListener):
def on_status(self, status):
print(status.text.encode('shift_jis', 'ignore'))
return True
def on_error(self, status_code):
print('Ein Fehler ist aufgetreten: ' + str(status_code))
return True
#Hauptverarbeitung von hier
auth = tweepy.OAuthHandler(CK, CS)
auth.set_access_token(AT, AS) #Zugriffstoken erhalten
listener = Listener() #Listener-Klasseninstanz
stream = tweepy.Stream(auth, listener) #Die Rezeption beginnt hier.
#Wählen Sie eine aus und kommentieren Sie sie aus.
#stream.filter(track=['#xxxxxx']) #Nach angegebenem Suchwort filtern
stream.sample() #1 von allen Twitter-Tweets%abholen
#stream.userstream() #Benutzereigene TL
…… Eh, 31 Zeilen (Leerzeilen, einschließlich Kommentare)? Was kann ich damit machen? ?? Beim Denken ausführen. Ich kann es nicht lesen (weil es UTF-8 ist), aber ich kann es empfangen. Mit Strg + C zwangsweise beenden.
Es fühlt sich an, als würde es sich schnell bewegen, aber es ist tatsächlich an zwei Stellen verstopft.
Ersteres ist in Ordnung, wenn Sie es beim ersten Mal beheben. Letzteres ist in Ordnung, da es nicht angezeigt werden muss, wenn es sich immer bewegt. Wenn Python zum ersten Mal in wenigen Tagen in diesem Umfang verwaltet werden kann, kann es unerwartet rechtzeitig für Ende Oktober sein.
Nächstes Mal werde ich diese Sauce ausarbeiten. (Fortsetzen)
Recommended Posts