Ich habe vor kurzem angefangen, Python zu studieren. Da es eine große Sache ist, möchte ich einen nützlichen Beitrag für diejenigen verfassen, die gerade erst anfangen, Python wie mich zu berühren. Da ich Python noch nie geschrieben habe, möchte ich dieses Mal eine einfache Datenanalyse durchführen und dabei die Syntax von Python und die Art der Bibliothek verstehen.
Nachschlagewerk: [Gebrauchsfertig! Kann im Geschäftsleben geübt werden! So erstellen Sie mit Python Apps für KI / maschinelles Lernen / Deep Learning](https://www.amazon.co.jp/%E3%81%99%E3%81%90% E3% 81% AB% E4% BD% BF% E3% 81% 88% E3% 82% 8B-% E6% A5% AD% E5% 8B% 99% E3% 81% A7% E5% AE% 9F% E8 % B7% B5% E3% 81% A7% E3% 81% 8D% E3% 82% 8B-Python% E3% 81% AB% E3% 82% 88% E3% 82% 8B-AI% E3% 83% BB % E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E3% 83% BB% E6% B7% B1% E5% B1% A4% E5% AD% A6% E7 % BF% 92% E3% 82% A2% E3% 83% 97% E3% 83% AA% E3% 81% AE% E3% 81% A4% E3% 81% 8F% E3% 82% 8A% E6% 96 % B9-% E3% 82% AF% E3% 82% B8% E3% 83% A9% E9% A3% 9B% E8% A1% 8C% E6% 9C% BA / dp / 4802611641)
** Ausführungsumgebung ** Google Colaboratory
** Bibliothek zu verwenden **
Bereiten Sie zunächst die für die Analyse erforderlichen Daten vor.
Laden Sie den Datensatz von der folgenden URL herunter, um die Wetterdaten zu analysieren. Sie können es direkt herunterladen, aber wir installieren es mit einer Bibliothek namens urllib.
#Greifen Sie von urllib auf eine Funktion namens urlretrieve zu
from urllib.request import urlretrieve
#Bereiten Sie eine Variable namens Dateiname vor. Dateinamen-Interpretation.csv
filename = "tempreture.csv"
#URL angeben
url = "https://raw.githubusercontent.com/kujirahand/mlearn-sample/master/tenki2006-2016/kion10y.csv"
#Lesen Sie die in der obigen Zeile beschriebene URL und Temperatur.Speichern Sie die Daten als Datei mit dem Namen csv
urlretrieve(url, filename)
Pandas ist eine Bibliothek zur effizienten Datenanalyse in Python. Mit Pandas können Sie problemlos Datenanalyseaufgaben ausführen, z. B. Daten laden, Statistiken anzeigen und Grafiken erstellen.
#Beim Importieren und Verwenden von Pandas scheint es üblich zu sein, pd zu schreiben. Verwenden Sie also pd.
import pandas as pd
#Lesen Sie den Inhalt der zuvor erhaltenen CSV-Datei_csv()Verwenden Sie die
pd.read_csv(filename)
Als Ergebnis der Ausführung stellte ich fest, dass die Daten 4018 Zeilen x 6 Spalten waren.
#[Machen Sie die Daten der letzten 10 Jahre zu einem Wörterbuchtyp und vereinfachen Sie die Programmierung]
history = {}
#Holen Sie sich Index und Daten für jede Zeile. Entspricht der Aufzählungsfunktion in anderen Sprachen
for i, row in df.iterrows():
#Ersetzen Sie jede Variable durch die monatliche Temperatur
month, day, tempreture = (int(row['Mond']), int(row['Tag']), float(row['Temperatur']))
#Schlüssel zu "12/Lass es aussehen wie 25 "
key = str(month) + "/" + str(day)
#Die Beurteilung erfolgt so, dass derselbe Schlüssel nicht dupliziert wird
if not(key in history): history[key] = []
#Wenn es keine Duplizierung gibt, fügen Sie sie dem Verlauf hinzu
history[key] += [tempreture]
# [Finden Sie den Durchschnittswert]
average = {}
#Loop-Verlauf und Schlüssel erhalten
for key in history:
#Verknüpfen Sie den berechneten Durchschnittswert mit dem Schlüssel und addieren Sie ihn zum Durchschnitt
average[key] = sum(history[key]) / len(history[key])
result = average[key]
# print("{0}: {1}".format(key, result))
import math
#Funktion zur Überprüfung des Typs(Nur Zeichenketten akzeptieren)
def isString(date):
return type(date) is str
#Den Durchschnittswert des angegebenen Datums aus dem Durchschnitt des Wörterbuchtyps abrufen
def getTempreture(date):
if isString(date):
return average[date]
tempreture = getTempreture("12/25")
value = round(tempreture)
#Geben Sie die Konvertierung int in string ein
print(str(value)+ "Grad")
#Importieren Sie matplotlib, um das Diagramm zu zeichnen
import matplotlib.pyplot as plt
#Verarbeitung zur Aufteilung der Temperaturdaten nach Monat
tempreture_per_month = df.groupby(['Mond'])['Temperatur']
#Summieren Sie die geteilten Temperaturdaten monatlich und dividieren Sie sie durch die Anzahl der Daten pro Monat
average_tempreture = tempreture_per_month.sum() / tempreture_per_month.count()
#zeichnen
average_tempreture.plot()
Ich konnte zeichnen.
―― Anfängern wird empfohlen, mit Google Colaboratory zu beginnen, da dies die Installation und andere Arbeiten erspart. ――Ich konnte Daten einfacher als erwartet bearbeiten und zeichnen und habe gelernt, wie großartig die Python-Bibliothek ist.
Seit ich Python zum ersten Mal berührt habe, gibt es noch viele Dinge, die ich nicht verstehe, aber ich werde weiter lernen, damit ich schrittweise erweiterte Analysen durchführen kann.
Recommended Posts