Application Python: Pandas Partie 1: Basique

Je publierai sur les pandas à partir d'aujourd'hui.

Qu'est-ce que les pandas

Une bibliothèque de bases de données en python.

En particulier Une bibliothèque pour gérer des ensembles de données comme NumPy. NumPy peut traiter les données comme une matrice mathématique et se spécialise dans les calculs scientifiques.

Les pandas, par contre, peuvent effectuer des opérations qui peuvent être effectuées avec des bases de données communes. En plus des valeurs numériques, vous pouvez facilement gérer les données de chaîne de caractères telles que le nom et l'adresse.

Il est possible d'analyser efficacement les données en utilisant correctement NumPy et Pandas.

Deux types de structure de données

Il existe deux types de structures de données dans Pandas: Series et DataFrame.

DataFrame Il s'agit d'une structure de données principalement utilisée et représentée par un tableau à deux dimensions. Les données horizontales sont appelées une ligne et les données verticales sont appelées une colonne.

Chaque ligne et chaque colonne est étiquetée L'étiquette de ligne est index Les étiquettes de colonne sont appelées colonnes.

Series Il s'agit d'un tableau unidimensionnel qui peut être considéré comme une ligne ou une colonne dans un DataFrame. Encore une fois, chaque élément est étiqueté.

Exemple de structure de données

image.png

L'indice est [0, 1, 2, 3, 4]. En outre, les colonnes sont ["Préfecture", "Zone", "Population", "Région"].

Vérification des données Series et DataFrame

La série est des données de type dictionnaire ({clé1: valeur1, clé2: valeur2, ...}) En passant, la clé est triée par ordre croissant.

#Données de série

import pandas as pd

fruits = {"orange": 2, "banana": 3}
print(pd.Series(fruits))
#Résultat de sortie
banana    3
orange    2
dtype: int64
#De même, DataFrame est trié par clé dans l'ordre croissant si les colonnes ne sont pas spécifiées.
#Données dans DataFrame

import pandas as pd

data = {"fruits": ["apple", "orange", "banana", "strawberry", "kiwifruit"],
        "year": [2001, 2002, 2001, 2008, 2006],
        "time": [1, 4, 5, 6, 3]}
df = pd.DataFrame(data)
print(df)
#Résultat de sortie
       fruits  time  year
0       apple     1  2001
1      orange     4  2002
2      banana     5  2001
3  strawberry     6  2008
4   kiwifruit     3  2006
#Pour spécifier l'ordre de tri, utilisez des colonnes comme deuxième argument comme indiqué ci-dessous.=[liste]Est spécifié.

import pandas as pd
df = pd.DataFrame(data, columns=["year", "time", "fruits"])
print(df)
#Résultat de sortie
   year  time      fruits
0  2001     1       apple
1  2002     4      orange
2  2001     5      banana
3  2008     6  strawberry
4  2006     3   kiwifruit

Recommended Posts

Application Python: Pandas Partie 1: Basique
Application Python: Pandas Partie 2: Série
Application Python: visualisation de données partie 1: basique
Application de Python: Pandas Partie 4: Concaténation et combinaison de DataFrames
Mémorandum de base Python partie 2
Mémo de base Python - Partie 2
Mémo de base Python - Partie 1
Application Python: Pandas # 3: Dataframe
Python Basic --Pandas, Numpy-
Mémo de grammaire de base Python (1)
Application de Python: Nettoyage des données Partie 1: Notation Python
Application Python: Traitement des données # 3: Format des données
Application Python: Numpy Partie 3: Double tableau
1. Statistiques apprises avec Python 1-1. Statistiques de base (Pandas)
QGIS + Python Partie 2
RF Python Basic_01
Mes pandas (Python)
Application de Python: visualisation de données Partie 3: divers graphiques
QGIS + Python Partie 1
Écriture de base Python
Python: grattage partie 1
Grammaire de base Python3
Mémorandum de base Python Partie 3-A propos de l'orientation des objets-
RF Python Basic_02
mémo pandas python
Python3 commence la partie 1
Python: grattage, partie 2
série pandas partie 1
(Remarque) Statistiques de base sur Python et Pandas sur IBM DSX
Application de Python: Traitement des données Partie 2: Analyse de divers formats de données
Fonctionnement de base de Python Pandas Series et Dataframe (1)
Cours de base Python (12 fonctions)
Édition de base Python Memo
Cours de base Python (7 dictionnaire)
Cours de base Python (2 installation Python)
Tri de base en Python
Cours de base Python (9 itérations)
Fonctionnement de base des pandas
[python] méthode de base de la classe
Cours de base Python (11 exceptions)
Cours de base Python (6 sets)
Fonctionnement de base des Pandas
Aide-mémoire Python3 (basique)
Grammaire de base Python (divers)
Cours de base Python (Introduction)
Installer des pandas sur python2.6
python basic ② sous windows
Cours de base Python (13 cours)
Notes de commande de base Python
Connaissance de base de Python
Mémo de grammaire de base Python
Application de Python 3 vars
mémorandum python super basique
Cours de base Python (8 branches)
Instruction if de base Python