Lors de l'analyse des données de séries chronologiques, utilisez des colonnes telles que les horodatages 「2016-12-17 09:59:17」 Il peut être enregistré dans un format comme celui-ci. À partir de ce format, afin qu'il puisse être géré par l'apprentissage automatique Voici comment diviser une date en année, mois, jour, heure et jour **.
Cette fois, nous utiliserons les données factices suivantes.
time.py
import pandas as pd
df = pd.read_csv('df.csv')
df.head()
#production
patient Last UpDdated
0 5.0 2020-03-22 10:00:00
1 4.0 2020-03-22 11:00:00
2 6.0 2020-03-22 12:00:00
3 10.0 2020-03-23 10:00:00
4 3.0 2020-03-23 11:00:00
df.info()
#production
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 21 entries, 0 to 20
Data columns (total 3 columns):
patient 21 non-null float64
Last UpDdated 21 non-null object
dtypes: float64(2), object(1)
memory usage: 800.0+ bytes
Fractionne la date dans la colonne Dernière mise à jour.
■ Commande
** ① Conversion du type d'objet au type datetime64 [ns] **
pd.to_datetime(df['Last UpDdated'])
** ②. Dt. Obtenir l'année, le mois, le jour, l'heure, le jour de l'année **
df['Last UpDdated'].dt.month
time.py
df['Last UpDdated'] = pd.to_datetime(df['Last UpDdated']) #Convertir le type
df.dtypes
#production
patient float64
Last UpDdated datetime64[ns]
dtype: object
#Ajout de la colonne "manth"
df['month'] = df['Last UpDdated'].dt.month
#Ajout de la colonne "jour"
df['day'] = df['Last UpDdated'].dt.day
#Colonne "heure" ajoutée
df['hour'] = df['Last UpDdated'].dt.hour
#Colonne "semaine" ajoutée
df['week'] = df['Last UpDdated'].dt.dayofweek
#Dernière mise à jour supprimée
df = df.drop(['Last UpDdated'],axis=1)
df.head()
#production
patient month day hour week
0 5.0 3 22 10 6
1 4.0 3 22 11 6
2 6.0 3 22 12 6
3 10.0 3 23 10 0
4 3.0 3 23 11 0
Les colonnes du mois, du jour, de l'heure et du jour ont été ajoutées en fonction des valeurs de la colonne Dernière mise à jour! Le jour est de type int compris entre 0 et 6.
Recommended Posts