J'ai récemment commencé à étudier Python. Comme c'est un gros problème, j'aimerais faire un article utile pour ceux qui commencent tout juste à toucher Python comme moi. Comme je n'ai jamais écrit Python, cette fois, j'aimerais effectuer une analyse de données simple tout en comprenant la syntaxe de python et le type de bibliothèque existant.
Livre de référence: [Prêt à l'emploi! Peut être pratiqué en entreprise! Comment créer des applications d'IA / d'apprentissage automatique / d'apprentissage en profondeur avec Python](https://www.amazon.co.jp/%E3%81%99%E3%81%90% E3% 81% AB% E4% BD% BF% E3% 81% 88% E3% 82% 8B-% E6% A5% AD% E5% 8B% 99% E3% 81% A7% E5% AE% 9F% E8 % B7% B5% E3% 81% A7% E3% 81% 8D% E3% 82% 8B-Python% E3% 81% AB% E3% 82% 88% E3% 82% 8B-AI% E3% 83% BB % E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E3% 83% BB% E6% B7% B1% E5% B1% A4% E5% AD% A6% E7 % BF% 92% E3% 82% A2% E3% 83% 97% E3% 83% AA% E3% 81% AE% E3% 81% A4% E3% 81% 8F% E3% 82% 8A% E6% 96 % B9-% E3% 82% AF% E3% 82% B8% E3% 83% A9% E9% A3% 9B% E8% A1% 8C% E6% 9C% BA / dp / 4802611641)
** Environnement d'exécution ** Google Colaboratory
** Bibliothèque à utiliser **
Tout d'abord, préparez les données nécessaires à l'analyse.
Pour analyser les données météorologiques, téléchargez l'ensemble de données à partir de l'URL suivante. Vous pouvez le télécharger directement, mais installons-le en utilisant une bibliothèque appelée urllib.
#Accéder à une fonction appelée urlretrieve depuis urllib
from urllib.request import urlretrieve
#Préparez une variable appelée nom de fichier. Nom du fichier tempreture.csv
filename = "tempreture.csv"
#Spécifiez l'URL
url = "https://raw.githubusercontent.com/kujirahand/mlearn-sample/master/tenki2006-2016/kion10y.csv"
#Lisez l'url et la température décrites dans la ligne ci-dessus.Enregistrez les données dans un fichier nommé csv
urlretrieve(url, filename)
Pandas est une bibliothèque pour une analyse efficace des données en Python. Pandas vous permet d'effectuer facilement des tâches d'analyse de données telles que le chargement de données, l'affichage de statistiques et la création de graphiques.
#Lors de l'importation et de l'utilisation de pandas, il semble qu'il soit courant d'écrire pd, alors utilisez pd.
import pandas as pd
#Pour voir le contenu du fichier csv obtenu précédemment, lisez_csv()Utilisez le
pd.read_csv(filename)
À la suite de l'exécution, j'ai constaté que les données étaient de 4018 lignes x 6 colonnes.
#[Transformez les données des 10 dernières années en un type de dictionnaire et simplifiez la programmation]
history = {}
#Obtenez l'index et les données pour chaque ligne. Identique à la fonction enumurate dans d'autres langues
for i, row in df.iterrows():
#Remplacez la température mensuelle dans chaque variable
month, day, tempreture = (int(row['Mois']), int(row['journée']), float(row['Température']))
#clé de "12/Donne-lui un aspect de 25 "
key = str(month) + "/" + str(day)
#Le jugement est fait pour que la même clé ne soit pas dupliquée
if not(key in history): history[key] = []
#S'il n'y a pas de duplication, ajoutez-le à l'historique
history[key] += [tempreture]
# [Trouvez la valeur moyenne]
average = {}
#Bouclez l'historique et obtenez la clé
for key in history:
#Liez la valeur moyenne calculée à la clé et ajoutez-la à la moyenne
average[key] = sum(history[key]) / len(history[key])
result = average[key]
# print("{0}: {1}".format(key, result))
import math
#fonction pour vérifier le type(Pour n'accepter que les chaînes de caractères)
def isString(date):
return type(date) is str
#Obtenir la valeur moyenne de la date spécifiée à partir de la moyenne du type de dictionnaire
def getTempreture(date):
if isString(date):
return average[date]
tempreture = getTempreture("12/25")
value = round(tempreture)
#Type de conversion int en chaîne
print(str(value)+ "Diplôme")
#Importez matplotlib pour dessiner le graphique
import matplotlib.pyplot as plt
#Traitement pour diviser les données de température par mois
tempreture_per_month = df.groupby(['Mois'])['Température']
#Additionnez les données de température divisées mensuellement et divisez-les par le nombre de données par mois
average_tempreture = tempreture_per_month.sum() / tempreture_per_month.count()
#dessiner
average_tempreture.plot()
J'ai pu dessiner.
――Il est recommandé aux débutants de commencer avec Google Colaboratory car cela évite les problèmes d'installation et autres travaux. «J'ai pu manipuler et dessiner des données plus facilement que prévu et j'ai appris à quel point la bibliothèque python est géniale.
Depuis que j'ai touché python pour la première fois, il y a encore beaucoup de choses que je ne comprends pas, mais je vais continuer à apprendre pour pouvoir effectuer progressivement des analyses avancées.
Recommended Posts