[PYTHON] Übergang von Baseball aus Daten gesehen

Ich habe anhand der Daten überlegt, wie sich Baseball als Ausgabe verändert hat.

Daten

Bibliothekslast

Laden Sie die erforderlichen Bibliotheken entsprechend.

import pandas as pd
import scipy as sp
import matplotlib.pyplot as plt
import seaborn as sns

Daten lesen

Bitte legen Sie sie in das gleiche Verzeichnis. Upload wenn colaboratry

team = pd.read_csv('Teams.csv')

Merkmalsauswahl

Wenn Sie es mit seaborn lesen, ohne die Feature-Menge auszuwählen, wird es eine große Menge sein, wählen Sie also die Feature-Menge.

teams  = teams[['yearID','teamID', 'Rank', 'W','L', 'H','SB','SO','RA','SV', 'BB', 'HBP', 'AB', 'SF', 'HR', '2B', '3B']]

Korrelationsmatrix

Visualisieren Sie die Korrelationsmatrix mit der Seaborn Heatmap.

colormap = plt.cm.RdBu
plt.figure(figsize=(16,10))
plt.title('Pearson Correlation of Features', y=1.05, size=15)
sns.heatmap(teams2.corr(),linewidths=0.1,vmax=1.0, 
            square=True, cmap=colormap, linecolor='white', annot=True)

download.png

Erwägung

Es kann bestätigt werden, dass HR (Anzahl der Home Runs) und SO (Triviation Rate) mit jedem Jahr zunehmen. Daraus lässt sich die Flyball-Revolution ableiten. Es ist eine bekannte Tatsache, dass die Flyball-Revolution die Trefferquote und die Anzahl der Home Runs erhöht hat. Dies kann auch anhand dieser Daten bestätigt werden. SV (Die Erhöhung der Anzahl der Paraden zeigt, dass das Pitcher-Divisionssystem zu der Zeit eingerichtet wurde.)

Als nächstes betrachten wir die Beziehung zwischen der Gesamtzahl der jährlichen Stöcke und der Anzahl der Gewinne.

Indem ich die Beziehung zwischen der Gesamtzahl der jährlichen Stöcke und der Anzahl der Siege kläre, möchte ich untersuchen, ob es einen Unterschied zwischen der Vergangenheit und der Gegenwart gibt, was die effizienteste Wahl ist.

Lesen Sie die Daten des Jahresbalkens

salaries = pd.read_csv('Salaries.csv')

Datenformung

teams = teams.set_index(['yearID'])
teams.head()
salaries_by_yearID_teamID = salaries.groupby(['yearID', 'teamID'])['salary'].sum()
teams = teams.join(salaries_by_yearID_teamID)

Visualisierung

plt.subplot(1,2,1)
plt.scatter(teams['salary'][2001], teams['W'][2001])
plt.title('2001')
plt.subplot(1,2,2)
plt.scatter(teams['salary'][2013], teams['W'][2013])
plt.title('2013')

download-1.png

Erwägung

Eine positive Korrelation kann 2013 als 2001 bestätigt werden. Dies kann daran liegen, dass sich die Technologie zur Erkennung der Fähigkeiten von Sportlern ab 2001 weiterentwickelt hat.

Zusammenfassung

Ich konnte mich an die Geschichte der Entwicklung von Sabre Metrics erinnern, während ich sie mit Daten analysierte. Die Flyball-Revolution hatte einen großen Einfluss auf den Baseball.

Recommended Posts

Übergang von Baseball aus Daten gesehen
Die Geschichte des Kopierens von Daten von S3 auf Googles TeamDrive
Existenz aus Sicht von Python
Studieren von Web Scraping zum Extrahieren von Daten aus Filmarks # 2
Wichtige Einheit aus den Python-Vorlesungsmaterialien der Universität Kyoto
Erläutern Sie den Mechanismus der PEP557-Datenklasse
Vergleich von R, Python, SAS, SPSS aus Sicht europäischer Datenwissenschaftler
Holen Sie sich die Spaltenliste und Datenliste von CASTable
Lassen Sie die Stückliste am Anfang der Zeichenfolge weg
Erfassung von Pflanzenwachstumsdaten Erfassung von Daten von Sensoren
Die Bedeutung von Lint, wie Pythonista denkt
Notizen vom Anfang von Python 2 lernen
Lassen Sie uns den Bevölkerungsübergang von Matsue City, Präfektur Shimane, mit offenen Daten überprüfen
Python C / C ++ - Erweiterung: Übergeben Sie einen Teil der Daten als np.array an Python (Schritt setzen)
Holen Sie sich den Inhalt von Git Diff aus Python
Ich habe nach Railway Kawayanagi aus den Daten gesucht
Übergangsanimation der beliebtesten Programmiersprache (#Programmiersprache #popular)
Ändern Sie den Dezimalpunkt der Protokollierung von, nach.
Finden des Beginns der Avenomics anhand der NT-Vergrößerung 2
Die Geschichte des Lesens von HSPICE-Daten in Python
Erkennen Sie allgemeine MIDI-Daten von einer großen Menge von MIDI
Auszug nur vollständig aus dem Ergebnis von Trinity
Finden des Beginns der Avenomics anhand der NT-Vergrößerung 1
Von der Einführung von Pyethapp bis zur Vertragsabwicklung
Die Geschichte vom Umzug von Pipenv zur Poesie
Überprüfen Sie den Status der Daten mit pandas_profiling
Laden Sie die Winddaten der Meteorological Agency herunter
Scraping der Gewinndaten von Zahlen mit Docker
Der Typ, der die Fitbit-Daten vom Server erhält
Bestimmen Sie die Anzahl der Klassen mithilfe der Starges-Formel
Übergang von Baseball aus Daten gesehen
Überprüfen Sie den Status der Daten mit pandas_profiling
Scraping der Gewinndaten von Zahlen mit Docker
Ich habe versucht, die API von Sakenowa Data Project zu verwenden
[Python] Ich habe versucht, Daten mit der API von Wikipedia zu sammeln
Versuchen Sie, mit matplotlib aus den Daten von "Schedule-kun" eine Kampfaufzeichnungstabelle zu erstellen.
Wie stark ist dein Qiita? Statistiken über die Anzahl der in den Daten angezeigten Beiträge
Die Geschichte des Starts eines Minecraft-Servers von Discord
Die Wand beim Ändern des Django-Dienstes von Python 2.7 auf Python 3-Serie
Ruft den Variablennamen der Variablen als Zeichenfolge ab.
Wird ab der Einführung von Node.js in der WSL-Umgebung verwendet
[Python] Ruft den Gesetzestext aus der e-GOV-Gesetz-API ab
Öffnen Sie die Chrome-Version von LINE über die Befehlszeile [Linux].
Berechnung der minimal erforderlichen Stimmenzahl aus der Stimmenzahl
Kaggle-Wettbewerbsprozess unter dem Gesichtspunkt des Punkteübergangs
So registrieren Sie einen Interrupt wie im Quellcode angegeben
Generieren Sie aus Textdaten ein vertikales Bild eines Romans
Tensorflows Denkweise lernte aus der Kartoffelherstellung
Studie vom Anfang von Python Hour1: Hallo Welt
Mathematisches Verständnis der Hauptkomponentenanalyse von Anfang an
Holen Sie sich den Rückkehrcode eines Python-Skripts von bat
Python zeigt aus der Perspektive eines C-Sprachprogrammierers
Über die Ineffizienz der Datenübertragung im luigi on-memory
Derjenige, der den grafisch darstellt, der die Fitbit-Daten vom Server erhalten hat
Den Inhalt der Daten in Python nicht kennen
Ich habe versucht, die API von Sakenowa Data Project zu verwenden
DataNitro, Implementierung einer Funktion zum Lesen von Daten aus dem Blatt
Verwenden wir die offenen Daten von "Mamebus" in Python
Tweet die Niederschlagswahrscheinlichkeit als Teil der Funktion des Bots
Studie aus Python Hour8: Verwenden von Paketen
Geben Sie das Ausgabeergebnis von sklearn.metrics.classification_report als CSV-Datei aus
[Grundlagen der Datenwissenschaft] Sammeln von Daten aus RSS mit Python