Verwenden Sie bei der Analyse von Zeitreihendaten Spalten wie Zeitstempel 「2016-12-17 09:59:17」 Es kann in einem Format wie diesem gespeichert werden. Aus diesem Format, damit es durch maschinelles Lernen gehandhabt werden kann So teilen Sie ein Datum in Jahr, Monat, Tag, Stunde und Tag ** auf.
Dieses Mal werden wir die folgenden Dummy-Daten verwenden.
time.py
import pandas as pd
df = pd.read_csv('df.csv')
df.head()
#Ausgabe
patient Last UpDdated
0 5.0 2020-03-22 10:00:00
1 4.0 2020-03-22 11:00:00
2 6.0 2020-03-22 12:00:00
3 10.0 2020-03-23 10:00:00
4 3.0 2020-03-23 11:00:00
df.info()
#Ausgabe
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 21 entries, 0 to 20
Data columns (total 3 columns):
patient 21 non-null float64
Last UpDdated 21 non-null object
dtypes: float64(2), object(1)
memory usage: 800.0+ bytes
Teilt das Datum in der Spalte "Zuletzt aktualisiert" auf.
■ Bestellen
** ① Vom Objekttyp in den Typ datetime64 [ns] konvertieren **
pd.to_datetime(df['Last UpDdated'])
** ② .dt. Holen Sie sich Jahr, Monat, Tag, Uhrzeit, Tag des Jahres **
df['Last UpDdated'].dt.month
time.py
df['Last UpDdated'] = pd.to_datetime(df['Last UpDdated']) #Typ konvertieren
df.dtypes
#Ausgabe
patient float64
Last UpDdated datetime64[ns]
dtype: object
#Spalte "manth" hinzugefügt
df['month'] = df['Last UpDdated'].dt.month
#Spalte "Tag" hinzugefügt
df['day'] = df['Last UpDdated'].dt.day
#Spalte "Stunde" hinzugefügt
df['hour'] = df['Last UpDdated'].dt.hour
#Spalte "Woche" hinzugefügt
df['week'] = df['Last UpDdated'].dt.dayofweek
#Zuletzt aktualisiert
df = df.drop(['Last UpDdated'],axis=1)
df.head()
#Ausgabe
patient month day hour week
0 5.0 3 22 10 6
1 4.0 3 22 11 6
2 6.0 3 22 12 6
3 10.0 3 23 10 0
4 3.0 3 23 11 0
Die Spalten Monat, Tag, Stunde und Tag wurden basierend auf den Werten in der Spalte Last UpDated hinzugefügt! Der Tag ist ein int-Typ von 0 bis 6.
Recommended Posts