[PYTHON] Transition du baseball vue à partir des données

J'ai considéré à partir des données comment le baseball a changé en tant que sortie.

Données

Charge de la bibliothèque

Chargez les bibliothèques requises selon vos besoins.

import pandas as pd
import scipy as sp
import matplotlib.pyplot as plt
import seaborn as sns

Lire les données

Veuillez les mettre dans le même répertoire. Télécharger si collaboration

team = pd.read_csv('Teams.csv')

Sélection de fonctionnalité

Si vous le lisez avec seaborn sans sélectionner le montant de la fonctionnalité, ce sera énorme, alors sélectionnez le montant de la fonctionnalité.

teams  = teams[['yearID','teamID', 'Rank', 'W','L', 'H','SB','SO','RA','SV', 'BB', 'HBP', 'AB', 'SF', 'HR', '2B', '3B']]

Matrice de corrélation

Visualisez la matrice de corrélation avec la carte thermique Seaborn.

colormap = plt.cm.RdBu
plt.figure(figsize=(16,10))
plt.title('Pearson Correlation of Features', y=1.05, size=15)
sns.heatmap(teams2.corr(),linewidths=0.1,vmax=1.0, 
            square=True, cmap=colormap, linecolor='white', annot=True)

download.png

Considération

Il peut être confirmé que le HR (nombre de circuits) et le SO (taux de triviation) augmentent d'année en année. Ce qui peut être considéré à partir de là, c'est la révolution du flyball. C'est un fait bien connu que la révolution du flyball a augmenté le taux de frappe et le nombre de circuits. Cela peut également être confirmé à partir de ces données. SV (L'augmentation du nombre d'arrêts montre que le système de division des lanceurs a été établi par les temps)

Ensuite, nous examinerons la relation entre le nombre total de bâtons annuels et le nombre de victoires.

En clarifiant la relation entre le nombre total de bâtons annuels et le nombre de victoires, j'aimerais examiner s'il existe une différence entre le passé et le présent, ce qui est le choix le plus efficace.

Lire les données de la barre d'année

salaries = pd.read_csv('Salaries.csv')

Mise en forme des données

teams = teams.set_index(['yearID'])
teams.head()
salaries_by_yearID_teamID = salaries.groupby(['yearID', 'teamID'])['salary'].sum()
teams = teams.join(salaries_by_yearID_teamID)

Visualisation

plt.subplot(1,2,1)
plt.scatter(teams['salary'][2001], teams['W'][2001])
plt.title('2001')
plt.subplot(1,2,2)
plt.scatter(teams['salary'][2013], teams['W'][2013])
plt.title('2013')

download-1.png

Considération

Une corrélation positive peut être confirmée en 2013 qu'en 2001. Cela peut être dû au fait que la technologie permettant de détecter les capacités des athlètes a évolué depuis 2001.

Résumé

J'ai pu rappeler l'historique de l'évolution de Saber Metrics tout en l'analysant avec des données. La révolution du flyball a eu un impact majeur sur le baseball.

Recommended Posts

Transition du baseball vue à partir des données
L'histoire de la copie de données de S3 vers TeamDrive de Google
Existence du point de vue de Python
Etudier le web scraping dans le but d'extraire des données de Filmarks # 2
Unité importante vue à partir du matériel de conférence Python de l'Université de Kyoto
Expliquer le mécanisme de la classe de données PEP557
Comparaison de R, Python, SAS, SPSS du point de vue des data scientists européens
Obtenez la liste des colonnes et la liste des données de CASTable
Omettre la nomenclature depuis le début de la chaîne
Acquisition des données de croissance des plantes Acquisition des données des capteurs
L'importance de Lint comme le pense Pythonista
Notes d'apprentissage depuis le début de Python 2
Vérifions la transition démographique de la ville de Matsue, préfecture de Shimane avec des données ouvertes
Extension Python C / C ++: transmettre une partie des données à Python en tant que np.array (set stride)
Récupérer le contenu de git diff depuis python
J'ai recherché Railway Kawayanagi à partir des données
Animation de transition du langage de programmation le plus populaire (#programming language #popular)
Modifiez le point décimal de la journalisation de, à.
Trouver le début de l'avenomics à partir du grossissement NT 2
L'histoire de la lecture des données HSPICE en Python
Détecter les données General MIDI à partir d'une grande quantité de MIDI
Extrait uniquement complet du résultat de Trinity
Trouver le début de l'avenomics à partir du grossissement NT 1
De l'introduction de pyethapp à l'exécution du contrat
Histoire de passer de Pipenv à la poésie
Vérifiez l'état des données à l'aide de pandas_profiling
Téléchargez les données éoliennes de l'Agence météorologique
Gratter les données gagnantes de Numbers à l'aide de Docker
Le gars qui obtient les données Fitbit du serveur
Déterminez le nombre de classes à l'aide de la formule Starges
Transition du baseball vue à partir des données
Vérifiez l'état des données à l'aide de pandas_profiling
Gratter les données gagnantes de Numbers à l'aide de Docker
J'ai essayé d'utiliser l'API de Sakenowa Data Project
[Python] J'ai essayé de collecter des données en utilisant l'API de wikipedia
Essayez de créer une table d'enregistrement de bataille avec matplotlib à partir des données de "Schedule-kun"
Quelle est la force de votre Qiita? Statistiques sur le nombre de Contributes visibles dans les données
L'histoire du lancement d'un serveur Minecraft depuis Discord
Le mur lors du passage du service Django de Python 2.7 à la série Python 3
Obtenez le nom de la variable sous forme de chaîne de caractères.
Utilisé depuis l'introduction de Node.js dans l'environnement WSL
[Python] Récupérez le texte de la loi à partir de l'API e-GOV law
Ouvrez la version Chrome de LINE à partir de la ligne de commande [Linux]
Calcul du nombre minimum de voix requis à partir du taux de vote
Processus de compétition Kaggle du point de vue de la transition des scores
Comment enregistrer une interruption comme vu dans le code source
Générer une image verticale d'un roman à partir de données textuelles
L'idée de Tensorflow a appris de la fabrication de pommes de terre
Étude depuis le début de Python Hour1: Hello World
Compréhension mathématique de l'analyse en composantes principales depuis le début
Récupérer le code retour d'un script Python depuis bat
Points Python du point de vue d'un programmeur en langage C
À propos de l'inefficacité du transfert de données dans luigi on-memory
Celui qui représente graphiquement celui qui a obtenu les données fitbit du serveur
Ne pas être conscient du contenu des données en python
J'ai essayé d'utiliser l'API de Sakenowa Data Project
DataNitro, implémentation de la fonction de lecture des données de feuille
Utilisons les données ouvertes de "Mamebus" en Python
Tweetez la probabilité de précipitations dans le cadre de la fonction de bot
Étude de Python Hour8: Utilisation de packages
Afficher le résultat de sortie de sklearn.metrics.classification_report sous forme de fichier CSV
[Bases de la science des données] Collecte de données depuis RSS avec python