Die Serie geht vorerst weiter. Ich plane, die Analyse der erfassten Daten in Zukunft weiter zu schreiben. (Pläne)
$ python yahoo_news_rss.py
damit,
Yahoo!Nachrichtenthemen-oben
http://dailynews.yahoo.co.jp/fc/world/nuclear_weapons/?id=6160968
Das kaputte NVV-Dokument konnte nicht angenommen und geschlossen werden
http://dailynews.yahoo.co.jp/fc/domestic/injury_case/?id=6160975
4 tote und verletzte Männer festgenommen
http://dailynews.yahoo.co.jp/fc/economy/coffee_chain/?id=6160962
Über tausend Menschen bei den Starba Tottori Open
http://dailynews.yahoo.co.jp/fc/economy/apparel/?id=6160961
Barbary geht es gut und sie beendet den Vertrag im Juni
http://dailynews.yahoo.co.jp/fc/science/life_on_earth/?id=6160969
Wird das Konzept der "Null" von Affen erkannt?
http://dailynews.yahoo.co.jp/fc/sports/prowrestling/?id=6160973
Erste Tigermaske Notfallchirurgie
http://dailynews.yahoo.co.jp/fc/entertainment/broad_casting/?id=6160945
Ablehnung der Live-Übertragung Yuko Ando verwirrt
http://dailynews.yahoo.co.jp/fc/domestic/obituary/?id=6160936
Das kämpfende Krankheitsidol Maruyama stirbt
Ich werde erklären, wie man RSS einfach bis zu dem Punkt verwendet, an dem es erscheint.
RSS ist ein allgemeiner Begriff für verschiedene Dokumentformate zum einfachen Kompilieren und Verteilen von Updates auf verschiedenen Websites wie Nachrichten und Blogs.
Aus Wiki. Mit anderen Worten, es ist mühsam, echtes Scraping durchzuführen, aber es fühlt sich so an, als ob es leicht für die Informationsbeschaffung zusammengestellt werden kann.
Verwenden Sie feedparser, um RSS-Feeds zu analysieren.
Installieren Sie also den Feed-Parser [this](http: // otiai10.hatenablog.com/entry/2012/05/04/180950)が参考になった。
Wie Sie unter Dokumentation sehen können, sollten Sie die folgenden beiden Schlüssel berücksichtigen.
entries
A list of dictionaries. Each dictionary contains data from a different entry. Entries are listed in the order in which they appear in the original feed.
feed
A dictionary of data about the feed.
Eine Liste aller internen Schlüssel finden Sie unter Dokumentation.
Yahoo bietet RSS unter [Gefällt mir](http://headlines.yahoo.co.jp/rss/list http://headlines.yahoo.co.jp/rss/list). Hier erfahren Sie, wie Sie das zurückgegebene XML analysieren, indem Sie diese URL in ein Wörterbuch eingeben.
yahoo_news_rss.py
import feedparser
RSS_URL = "http://rss.dailynews.yahoo.co.jp/fc/rss.xml"
yahoo_news_dic = feedparser.parse(RSS_URL)
Die Nachrichten sind jetzt im Wörterbuch. In der Feedparser-Dokumentation finden Sie Informationen zur Struktur.
Im Folgenden werden der gesamte Titel sowie der Titel und der Link jedes Artikels angezeigt.
yahoo_news_rss.py
print yahoo_news_dic.feed.title
for entry in yahoo_news_dic.entries:
title = entry.title
link = entry.link
print link
print title
Und wie es am Anfang war
Yahoo!Nachrichtenthemen-oben
http://dailynews.yahoo.co.jp/fc/world/nuclear_weapons/?id=6160968
Das kaputte NVV-Dokument konnte nicht angenommen und geschlossen werden
http://dailynews.yahoo.co.jp/fc/domestic/injury_case/?id=6160975
4 tote und verletzte Männer festgenommen
http://dailynews.yahoo.co.jp/fc/economy/coffee_chain/?id=6160962
Über tausend Menschen bei den Starba Tottori Open
http://dailynews.yahoo.co.jp/fc/economy/apparel/?id=6160961
Barbary geht es gut und sie beendet den Vertrag im Juni
http://dailynews.yahoo.co.jp/fc/science/life_on_earth/?id=6160969
Wird das Konzept der "Null" von Affen erkannt?
http://dailynews.yahoo.co.jp/fc/sports/prowrestling/?id=6160973
Erste Tigermaske Notfallchirurgie
http://dailynews.yahoo.co.jp/fc/entertainment/broad_casting/?id=6160945
Ablehnung der Live-Übertragung Yuko Ando verwirrt
http://dailynews.yahoo.co.jp/fc/domestic/obituary/?id=6160936
Das kämpfende Krankheitsidol Maruyama stirbt
Es kommt mit einem Gefühl heraus.
Wie oben erwähnt, ist der Quellcode auch hier.
Recommended Posts