[PYTHON] Ich habe versucht, den Urknall-Satz zu verifizieren [Kommt er zurück?]

Was ist der Urknallsatz ...

Die Theorie, dass jedes Wort zu einem "Urknall" führt

Zitat

Ich habe versucht, die Theorie zu überprüfen, dass alle Wörter den Urknall erreichen, wenn sie im Wörterbuch wieder eine Bedeutung haben. https://www.youtube.com/watch?v=CN7q1thA7mU

Implementierung

Dieses Mal verwenden wir die "MediaWiki-API", um eine Liste der Artikel zu erhalten, die mit Artikeln verknüpft sind. Überprüfen Sie, wie viele Artikel mit Urknallartikeln verknüpft sind

Quelle

python


url = "http://ja.wikipedia.org/w/api.php"
payload = {"format":"json", "action":"query", "list":"backlinks", "blnamespace":"0"}
payload['bltitle'] = word
r = requests.get(url, params=payload)

#Json Shaping
json_load = r.json()
json_load = json.dumps(json_load)
json_load = json.loads(json_load)

#Teilweise ausgeschnitten
json_load = json_load['query']['backlinks']

theList = []
#Schleife für Artikel
for value in json_load:

	theDict = {}
	theDict['id'] = value['pageid']
	theDict['title'] = value['title']

	theDict['blTitle'] = word

	theDict['url'] = 'https://ja.wikipedia.org/wiki/' + value['title']
	theDict['floor'] = floor
	theDict['ns'] = value['ns']

	theList.append(theDict)

dataFrame = pd.io.json.json_normalize(theList)

Referenz

https://qiita.com/yubessy/items/16d2a074be84ee67c01f#記事へリンクしている記事の一覧を取得

Prüfergebnis

https://ja.wikipedia.org/wiki/Wikipedia:日本語版の統計 Erhöhen Sie die Gesamtzahl der Artikel auf "1227198".

image.png

n = Häufigkeit, mit der zum Urknall zurückgekehrt wird

Repräsentativer Wert

n=0 ·Urknall

n=1 ·Physik ·Chronologie ・ Raumtheorie

n=2 ·Erdkunde · Biologie ·Biologie

Ausgabeergebnis CSV

Alle Akquisitionsergebnisse (mit doppelten Artikeln) https://github.com/Syogo-Suganoya/bigBanete/blob/master/downloads/record.csv

Alle Akquisitionsergebnisse (keine doppelten Artikel) https://github.com/Syogo-Suganoya/bigBanete/blob/master/downloads/uniqueRecord.csv

Fazit

Die Artikelverknüpfungsschleife trat beim 10. Versuch auf, und die Artikelabdeckungsrate erreichte die Obergrenze. Die Abdeckungsrate (Big Baneite Rate) in japanischen Artikeln von Big Bang beträgt 0,0993%, Der Satz "Jedes Wort führt zu einem" Urknall "" ist ein Fehler.


github https://github.com/Syogo-Suganoya/bigBanete

Recommended Posts

Ich habe versucht, den Urknall-Satz zu verifizieren [Kommt er zurück?]
Ich habe versucht, die Umrisse von Big Gorilla herauszufinden
Ich habe versucht, mich über MCMC zu organisieren.
Ich habe versucht, den Ball zu bewegen
Ich habe versucht, den Abschnitt zu schätzen.
Ich habe versucht, den besten Weg zu finden, um einen guten Ehepartner zu finden
Ich habe versucht, den Befehl umask zusammenzufassen
Als ich versuchte, Python auszuführen, wurde ich zum Microsoft Store übersprungen
Ich habe versucht, die grafische Modellierung zusammenzufassen.
Passende Karaoke-Tasten ~ Ich habe versucht, es auf Laravel zu setzen ~ <auf dem Weg>
Ich habe versucht, die logische Denkweise über Objektorientierung zusammenzufassen.
Ich habe versucht, das Umfangsverhältnis π probabilistisch abzuschätzen
Ich habe versucht, die COTOHA-API zu berühren
Ich habe versucht, die Beschleunigung von Python durch Cython zu verifizieren und zu analysieren
[Linux] Ich habe versucht, die sichere Bestätigungsmethode von FQDN (CentOS7) zu überprüfen.
Da es der 20. Jahrestag der Gründung ist, habe ich versucht, die Texte von Parfüm mit Word Cloud zu visualisieren
Ich habe versucht, das Ergebnis des A / B-Tests mit dem Chi-Quadrat-Test zu überprüfen
Als ich versuchte, das Root-Passwort mit ansible zu ändern, konnte ich nicht darauf zugreifen.
Ich habe versucht, die Daten des Laptops durch Booten unter Ubuntu zu retten
Ich habe die Größenänderung von TensorFlow nicht verstanden und sie daher visuell zusammengefasst.
Ich habe Web Scraping versucht, um die Texte zu analysieren.
Ich habe versucht, beim Trocknen der Wäsche zu optimieren
Ich habe versucht, die Daten mit Zwietracht zu speichern
Ich habe versucht, die Trapezform des Bildes zu korrigieren
Qiita Job Ich habe versucht, den Job zu analysieren
LeetCode Ich habe versucht, die einfachen zusammenzufassen
Ich habe versucht, das Problem des Handlungsreisenden umzusetzen
Ich habe versucht, die Texte von Hinatazaka 46 zu vektorisieren!
Ich habe versucht, OneHotEncoder zu erstellen, der häufig für die Datenanalyse verwendet wird, damit er den juckenden Ort erreicht.
[Einführung] Ich habe versucht, es selbst zu implementieren, während ich den Dichotomiebaum erklärte
Ich habe versucht, YouTube zu kratzen, aber ich kann die API verwenden, also tu es nicht.
Ich habe versucht, das Telefon klingeln zu lassen, als es auf dem IoT-Post veröffentlicht wurde
Ich habe versucht zu überprüfen, ob die Natural Language API (Emotionsanalyse) Net Slang unterstützt.
[Einführung] Ich habe versucht, es selbst zu implementieren, während ich erklärte, um die Dichotomie zu verstehen
Mir wurde klar, dass es Unsinn ist, es ohne nachzudenken zu verwenden, weil das Modul praktisch ist
Ich habe versucht, es einfach zu machen, die Einstellung des authentifizierten Proxys auf Jupyter zu ändern
Ich habe versucht, einen "verdammt großen Literaturkonverter" zu machen.
Ich habe versucht, die in Python installierten Pakete grafisch darzustellen
Ich habe versucht, Iris aus dem Kamerabild zu erkennen
Ich habe versucht, die Grundform von GPLVM zusammenzufassen
Ich habe versucht, eine CSV-Datei mit Python zu berühren
Ich habe versucht, Soma Cube mit Python zu lösen
Ich möchte mit Python-Datenklasse nach hinten erben
Ich habe versucht, die Sündenfunktion mit Chainer zu approximieren
Ich habe versucht, Pytest in die eigentliche Schlacht zu bringen
[Python] Ich habe versucht, die Top 10 der Lidschatten grafisch darzustellen
Ich habe versucht, die Spacha-Informationen von VTuber zu visualisieren
Ich habe versucht, den negativen Teil von Meros zu löschen
Ich habe versucht, das Problem mit Python Vol.1 zu lösen
Ich habe versucht, die Methode zur Mittelung der Dollarkosten zu simulieren
Ich habe versucht, die nicht negative Matrixfaktorisierung (NMF) zu wiederholen.
AI Gaming Ich habe es zum ersten Mal versucht
Ich habe versucht, die Sprache mit CNN + Melspectogram zu identifizieren
Ich habe versucht, das Wissensdiagramm mit OpenKE zu ergänzen
Ich habe versucht, die Stimmen der Sprecher zu klassifizieren
Ich habe versucht, das Bild mithilfe von maschinellem Lernen zu komprimieren
Ich habe versucht, die String-Operationen von Python zusammenzufassen
Das Geräusch von Mr. Tick am Arbeitsplatz ist ... Ich habe es mit dem Code geschafft
Als ich den AtCoder Beginner Contest ausprobierte, war es ein schreckliches Ergebnis, also schaue ich zurück