Ich brauchte es nicht, weil es lokal eine große Menge an Wikipedia-Daten gibt, aber als ich ein wenig Daten wollte, bin ich auf die Wikipedia-API gestoßen, also ist es zu dieser Zeit ein Datensatz.
Betriebssystem (funktioniert sowohl unter Windows als auch unter Mac) ┗mac OS Catalina 10.15.7 ┗Widows 10 Python 3.8.3
Nur das. pip install wikipedia
Wenn Sie ein Suchwort eingeben, wird ohne Erlaubnis nach Artikeln gesucht, die sich auf dieses Wort beziehen. ** python3 wikipedia_data.py Suchwort ** Sie können es mit tun. Das Ausführungsergebnis, dh die Artikeldaten von wikipdia, werden in wikipedia.txt gespeichert.
Wenn Sie ein Problem mit Ihrem Suchbegriff haben ** wikipedia.exceptions.DisambiguationError: "Suchwort" kann sich beziehen auf: ** Nach dem Satz werden Kandidaten vorgeschlagen, sodass die erneute Suche mit diesem Wort funktioniert.
In seltenen Fällen kann ein langer Fehler auftreten, aber aufgrund der Art der API liegt wahrscheinlich ein Kommunikationsfehler aufgrund eines gewissen Einflusses vor. Wenn Sie also einen anderen als den oben genannten Fehler erhalten, ignorieren Sie ihn und versuchen Sie erneut, erfolgreich zu sein.
wikipedia_data.py
import sys
import wikipedia
#Stellen Sie die Sprache auf Japanisch ein
wikipedia.set_lang("jp")
#Textdatei öffnen
f = open('wikipedia.txt', 'a')
args = sys.argv
word = args[1]
#Suche mit Suchwörtern
words = wikipedia.search(word)
if not words:
print("Keine Übereinstimmung")
else:
#Holen Sie sich eine Zusammenfassung, wenn das Suchwort trifft
line = str(wikipedia.summary(words[0]))
f.write(line.rstrip())
print("success!")
f.write("\n" + "endline" + "\n")
f.close()
Offizielles Englisch-Tutorial ↓ https://wikipedia.readthedocs.io/en/latest/code.html
Es schmeckt alleine nicht gut, deshalb habe ich kurz extrahiert und zusammengefasst, was ich denke, dass ich verwenden werde. (Ich denke, es reicht aus, dies zu wissen, aber es gibt viele defekte Teile. Wenn Sie es also beherrschen möchten, lesen Sie bitte das Tutorial selbst.)
Methode td> | Übersicht td> |
wikipedia.search ("Suchwort", Ergebnisse = 10) td> | Gibt eine Liste mit bis zu 10 Suchergebnissen für ein Suchwort td> zurück |
wikipedia.summary ("Suchwort", Sätze = 0) td> | Ruft die Artikelzusammenfassung für das Suchwort td> ab |
wikipedia.page ("Suchwort") td> | Den gesamten Artikel für das Suchwort als Objekt abrufen Wenn Sie dem generierten Objekt .content hinzufügen, können Sie den gesamten Artikel als Textdaten abrufen td> |
Recommended Posts