[PYTHON] [Pandas] Principes de base du traitement des données de date à l'aide de dt

À propos du traitement des données de date à l'aide de l'accesseur dt de la bibliothèque Pandas de Python

Cas

Après la conversion de l'objet en données de date avec la fonction to_datetime, etc. Changer de type de date ou extraire les données de date d'une partie spécifique

Les données

Tout d'abord, créez des données de temps

import pandas as pd
date_data = pd.DataFrame({'date':
                         ['2020-04-01 01:01:01',
                         '2021-04-02 02:02:02',
                         '2022-04-03 03:03:03',
                         '2023-04-04 04:04:04',
                         '2024-05-05 05:05:05']})
date_data
date
0 2020-04-01 01:01:01
1 2021-04-02 02:02:02
2 2022-04-03 03:03:03
3 2023-04-04 04:04:04
4 2024-05-05 05:05:05

Voyons le type de données

date_data.dtypes
date    object
dtype: object

Actuellement, le type date_data ['date'] est un objet

Commençons par changer cela en un type de données pouvant être traité comme une date

date_data['date'] = pd.to_datetime(date_data['date'])
date_data['date']
0   2020-04-01 01:01:01
1   2021-04-02 02:02:02
2   2022-04-03 03:03:03
3   2023-04-04 04:04:04
4   2024-05-05 05:05:05
Name: date, dtype: datetime64[ns]

Traitement des données de date

Je veux prendre uniquement l'année, le mois, le jour et les secondes

L'accesseur dt est le suivant

Series.dt

pandas.Series.dt
Series.dt()[source]
Accessor object for datetimelike properties of the Series values.

date_data['date'].dt.year
0    2020
1    2021
2    2022
3    2023
4    2024
Name: date, dtype: int64
date_data['date'].dt.month
0    4
1    4
2    4
3    4
4    5
Name: date, dtype: int64
date_data['date'].dt.day
0    1
1    2
2    3
3    4
4    5
Name: date, dtype: int64
date_data['date'].dt.second
0    1
1    2
2    3
3    4
4    5
Name: date, dtype: int64

Si vous voulez un type spécifique tel que année / mois (ex: 17/01)

Il y avait une fonction appelée strftime. "strf" semble être une abréviation pour "str format"

date_data['date'].dt.strftime("%y/%m")
0    20/04
1    21/04
2    22/04
3    23/04
4    24/05
Name: date, dtype: object

ex:2002/04/01 Si vous modifiez% y →% Y, ce sera 4 chiffres.

date_data['date'].dt.strftime("%Y/%M/%d")
0    2020/01/01
1    2021/02/02
2    2022/03/03
3    2023/04/04
4    2024/05/05
Name: date, dtype: object

C'est tout pour le moment.

Recommended Posts

[Pandas] Principes de base du traitement des données de date à l'aide de dt
Exemple de traitement efficace des données avec PANDAS
100 langage de traitement knock-20 (à l'aide de pandas): lecture de données JSON
100 Language Processing Knock-32 (utilisant des pandas): Prototype de verbe
Principes de base de Pandas pour les débutants ② Présentation des données de saisie
100 traitement du langage knock-36 (en utilisant des pandas): fréquence d'occurrence des mots
100 Language Processing Knock: Chapitre 2 Principes de base des commandes UNIX (à l'aide de pandas)
Traiter les données csv avec python (traitement du comptage à l'aide de pandas)
python: principes de base de l'utilisation de scikit-learn ①
Analyse de données à l'aide de pandas python
Conseils de traitement des données avec Pandas
Principes de base de Pandas pour les débutants ④ Gestion des éléments de date et d'heure
Principes de base de Pandas pour les débutants ① Lecture et traitement
Principes de base de Pandas pour les débutants ⑧ Traitement des chiffres
Méthode de visualisation de données utilisant matplotlib (+ pandas) (3)
100 traitement du langage knock-31 (en utilisant des pandas): verbe
Recommandation d'analyse des données à l'aide de MessagePack
Méthode de visualisation de données utilisant matplotlib (+ pandas) (4)
100 traitement du langage knock-38 (en utilisant des pandas): histogramme
[Introduction à Data Scientist] Bases du calcul scientifique, du traitement des données et comment utiliser la bibliothèque de dessins graphiques graph Bases de Pandas
Bases du traitement d'images binarisées par Python
Python: principes de base de la reconnaissance d'image à l'aide de CNN
Bases de la théorie de l'information quantique: compression de données (1)
[Pour les débutants] Script dans les 10 lignes (5. Rééchantillonnage des données de séries chronologiques à l'aide de pandas)
100 traitement du langage knock-93 (en utilisant des pandas): calcul du taux de précision de la tâche d'analogie
100 Language Processing Knock-33 (en utilisant des pandas): nom sahen
100 traitement du langage knock-91: Préparation des données d'analogie
Notions de base sur les pandas
100 traitement du langage knock-35 (utilisant des pandas): concaténation de nomenclature
[Python] Divers traitements de données utilisant le tableau Numpy
Principes de base de Tableau (visualisation à l'aide d'informations géographiques)
Notions de base sur les pandas
100 Language Processing Knock-39 (en utilisant des pandas): la loi de Zipf
Bases de la théorie de l'information quantique: compression de données (2)
100 traitement de langage knock-34 (utilisant des pandas): "B of A"
[Introduction au Data Scientist] Bases de Python ♬
Connaissance de l'utilisation de l'API de données Aurora Severless
Utiliser des décorateurs pour empêcher la ré-exécution du traitement des données
Traitement de 100 langues knock-98 (en utilisant des pandas): Clustering par méthode Ward
100 traitement du langage knock-75 (en utilisant scicit-learn): poids de l'identité
100 traitement du langage knock-99 (à l'aide de pandas): visualisation par t-SNE
Étude introductive sur Python-Sortie des données de vente à l'aide de tapple-
100 traitement du langage knock-95 (en utilisant des pandas): Note avec WordSimilarity-353
Vérifiez l'état des données à l'aide de pandas_profiling
Gratter les données gagnantes de Numbers à l'aide de Docker
lecture de données pandas
Les bases de Python ①
Bases de python ①
Traitement d'image par matrice Basics & Contents-Reinventor of Python image processing-
100 langage traitement knock-92 (utilisant Gensim): application aux données d'analogie
Analyse des données financières par pandas et leur visualisation (2)
Traitement pleine largeur et demi-largeur des données CSV en Python
Bases de l'écran d'entrée / sortie en utilisant tkinter en python3
[Python] [Word] [python-docx] Analyse simple des données de diff en utilisant python
Obtenez des données Amazon RDS (PostgreSQL) à l'aide de SQL avec pandas
Analyse des données financières par pandas et leur visualisation (1)
Comment récupérer des données de courses de chevaux à l'aide de pandas read_html
Dessinez sur Jupyter en utilisant la fonction de tracé des pandas
Vérification des performances du prétraitement des données dans le traitement du langage naturel
Récapitulatif des méthodes Pandas utilisées lors de l'extraction de données [Python]
100 Language Processing Knock-83 (en utilisant des pandas): Mesure de la fréquence des mots / contextes