[PYTHON] J'ai essayé de vérifier le théorème du Big Bang [Est-il sur le point de revenir?]

Quel est le théorème du Big Bang ...

La théorie selon laquelle n'importe quel mot entraîne un «big bang»

Citation

J'ai essayé de vérifier la théorie selon laquelle si vous revenez à la signification de chaque mot du dictionnaire, vous atteindrez le big bang. https://www.youtube.com/watch?v=CN7q1thA7mU

la mise en oeuvre

Cette fois, nous utiliserons "l'API MediaWiki" pour obtenir une liste d'articles liés à des articles. Vérifiez combien d'articles sont liés à des articles Big Bang

La source

python


url = "http://ja.wikipedia.org/w/api.php"
payload = {"format":"json", "action":"query", "list":"backlinks", "blnamespace":"0"}
payload['bltitle'] = word
r = requests.get(url, params=payload)

#mise en forme json
json_load = r.json()
json_load = json.dumps(json_load)
json_load = json.loads(json_load)

#Partiellement découpé
json_load = json_load['query']['backlinks']

theList = []
#Boucle pour les articles
for value in json_load:

	theDict = {}
	theDict['id'] = value['pageid']
	theDict['title'] = value['title']

	theDict['blTitle'] = word

	theDict['url'] = 'https://ja.wikipedia.org/wiki/' + value['title']
	theDict['floor'] = floor
	theDict['ns'] = value['ns']

	theList.append(theDict)

dataFrame = pd.io.json.json_normalize(theList)

référence

https://qiita.com/yubessy/items/16d2a074be84ee67c01f#記事へリンクしている記事の一覧を取得

résultat de l'inspection

https://ja.wikipedia.org/wiki/Wikipedia:日本語版の統計 Augmenter le nombre total d'articles à "1227198"

image.png

n = nombre de fois pour revenir au big bang

Valeur représentative

n=0 ·Big Bang

n=1 ·La physique ·chronologie ・ Théorie de l'espace

n=2 ·la géographie · La biologie ·la biologie

Résultat de sortie CSV

Tous les résultats d'acquisition (avec articles en double) https://github.com/Syogo-Suganoya/bigBanete/blob/master/downloads/record.csv

Tous les résultats d'acquisition (pas d'articles en double) https://github.com/Syogo-Suganoya/bigBanete/blob/master/downloads/uniqueRecord.csv

Conclusion

La boucle de liaison d'article s'est produite au 10e essai et le taux de couverture d'articles a atteint le plafond. Le taux de couverture (taux de big baneite) dans les articles japonais de Big Bang est de 0,0993%, La proposition "Tout mot entraîne un" big bang "" est une erreur.


github https://github.com/Syogo-Suganoya/bigBanete

Recommended Posts

J'ai essayé de vérifier le théorème du Big Bang [Est-il sur le point de revenir?]
J'ai essayé de découvrir les grandes lignes de Big Gorilla
J'ai essayé de m'organiser à propos de MCMC.
J'ai essayé de déplacer le ballon
J'ai essayé d'estimer la section.
J'ai essayé de vérifier la meilleure façon de trouver un bon partenaire de mariage
J'ai essayé de résumer la commande umask
Lorsque j'ai essayé d'exécuter Python, j'ai été ignoré dans le Microsoft Store
J'ai essayé de résumer la modélisation graphique.
Touches de karaoké assorties ~ J'ai essayé de le mettre sur Laravel ~ <en route>
J'ai essayé de résumer la manière logique de penser l'orientation objet.
J'ai essayé d'estimer le rapport de circonférence π de manière probabiliste
J'ai essayé de toucher l'API COTOHA
J'ai essayé de vérifier et d'analyser l'accélération de Python par Cython
[Linux] J'ai essayé de vérifier la méthode de confirmation sécurisée du FQDN (CentOS7)
Comme c'est le 20e anniversaire de la formation, j'ai essayé de visualiser les paroles de Parfum avec Word Cloud
J'ai essayé de vérifier le résultat du test A / B avec le test du chi carré
Lorsque j'ai essayé de changer le mot de passe root avec ansible, je ne pouvais pas y accéder.
J'ai essayé de récupérer les données de l'ordinateur portable en le démarrant sur Ubuntu
Je n'ai pas compris le redimensionnement de TensorFlow, alors je l'ai résumé visuellement.
J'ai essayé Web Scraping pour analyser les paroles.
J'ai essayé d'optimiser le séchage du linge
J'ai essayé de sauvegarder les données avec discorde
J'ai essayé de corriger la forme trapézoïdale de l'image
Qiita Job J'ai essayé d'analyser le travail
LeetCode j'ai essayé de résumer les plus simples
J'ai essayé de mettre en œuvre le problème du voyageur de commerce
J'ai essayé de vectoriser les paroles de Hinatazaka 46!
J'ai essayé de créer OneHotEncoder, qui est souvent utilisé pour l'analyse des données, afin qu'il puisse atteindre l'endroit qui démange.
[Introduction] J'ai essayé de l'implémenter moi-même tout en expliquant l'arbre de dichotomie
J'ai essayé de gratter YouTube, mais je peux utiliser l'API, alors ne le faites pas.
J'ai essayé de faire sonner le téléphone lorsqu'il a été publié sur le poste IoT
J'ai essayé de vérifier si l'API Natural Language (analyse des émotions) prend en charge l'argot net.
[Introduction] J'ai essayé de l'implémenter moi-même tout en expliquant pour comprendre la dichotomie
Je me suis rendu compte qu'il était absurde de l'utiliser sans réfléchir car le module est pratique
J'ai essayé de faciliter la modification du paramètre du proxy authentifié sur Jupyter
J'ai essayé de faire un "putain de gros convertisseur de littérature"
J'ai essayé de représenter graphiquement les packages installés en Python
J'ai essayé de détecter l'iris à partir de l'image de la caméra
J'ai essayé de résumer la forme de base de GPLVM
J'ai essayé de toucher un fichier CSV avec Python
J'ai essayé de résoudre Soma Cube avec python
Je veux hériter de l'arrière avec la classe de données python
J'ai essayé d'approcher la fonction sin en utilisant le chainer
J'ai essayé de mettre Pytest dans la bataille réelle
[Python] J'ai essayé de représenter graphiquement le top 10 des ombres à paupières
J'ai essayé de visualiser les informations spacha de VTuber
J'ai essayé d'effacer la partie négative de Meros
J'ai essayé de résoudre le problème avec Python Vol.1
J'ai essayé de simuler la méthode de calcul de la moyenne des coûts en dollars
J'ai essayé de refaire la factorisation matricielle non négative (NMF)
AI Gaming Je l'ai essayé pour la première fois
J'ai essayé d'identifier la langue en utilisant CNN + Melspectogram
J'ai essayé de compléter le graphe de connaissances en utilisant OpenKE
J'ai essayé de classer les voix des acteurs de la voix
J'ai essayé de compresser l'image en utilisant l'apprentissage automatique
J'ai essayé de résumer les opérations de chaîne de Python
Le son émis par M. Tick sur le lieu de travail est ... J'ai réussi à le faire avec le code
Quand j'ai essayé le concours AtCoder pour débutants, c'était un résultat terrible, alors je regarde en arrière