À propos de l'opération de base de création d'une table avec python. Un résumé de la création et du fonctionnement d'une table basée sur une liste de données pour une compréhension facile.
Utilisez pandas DataFrame pour créer la table.
listA = ['AAA', 'BBB', 'CCC', 'DDD', 'EEE']
pd.DataFrame (tableau)
└ "pd": pandas
Abréviation. importation PD
└ "DataFrame": données de table 2D
Créer une table
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
df1 = pd.DataFrame(listA)
df1
#production
0
0 AAA
1 BBB
2 CCC
3 DDD
-Le tableau est sorti sous forme de tableau ・ La première colonne est l'en-tête (numéro d'index à partir de 0) ・ La première ligne est le nom de la colonne (numéro d'index à partir de 0)
Créer une table (directement)
import pandas as pd
pd.DataFrame(['AAA', 'BBB', 'CCC', 'DDD'])
#production
0
0 AAA
1 BBB
2 CCC
3 DDD
Spécifiez colonnes = ['AAA']
dans l'option DataFrame.
└ "AAA": nom de la colonne (facultatif)
Renommer la colonne
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
df2 = pd.DataFrame(listA, columns=['Ah ah'])
df2
#production
Ah ah
0 AAA
1 BBB
2 CCC
3 DDD
df.columns = ['AAA']
└ "df": données de table
└ ".columns": obtient les noms de colonnes
└ "AAA": nom de colonne à attribuer
Attribuer à l'aide de la méthode des colonnes.
Renommer la colonne (plus tard)
df1.columns = ['Ah ah']
df1
#production
Ah ah
0 AAA
1 BBB
2 CCC
3 DDD
renommer peut spécifier le nom de colonne à modifier et comment.
{Nom de la colonne d'origine: nom de la colonne modifié}
Changer avec la méthode de changement de nom
df1.rename(columns={0:'Ah ah'})
#production
Ah ah
0 AAA
1 BBB
2 CCC
3 DDD
① Désigné lors de la création du tableau ② Changer plus tard ②-1. méthode d'index ②-2. renommer la méthode
Spécifiez ʻindex = ['AAA', 'BBB' ,,,,] `dans l'option DataFrame. └ "AAA" "BBB": Nom de la ligne (facultatif) └ Une chaîne de caractères ou une valeur numérique peut être spécifiée
** ▼ Spécifier par chaîne de caractères **
Renommer la colonne (chaîne de caractères)
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
df1 = pd.DataFrame(listA, index=['111','222','333','444'])
df1
#production
0
111 AAA
222 BBB
333 CCC
444 DDD
Changement de nom de colonne (valeur numérique)
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
df1 = pd.DataFrame(listA, index=[111,22.2,3.33,444])
df1
#production
0
111.00 AAA
22.20 BBB
3.33 CCC
444.00 DDD
Changement de nom de colonne (valeur numérique)
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
indexA = ['111','222','333','444']
df1 = pd.DataFrame(listA, index=indexA)
df1
#production
0
111 AAA
222 BBB
333 CCC
444 DDD
Spécifiez df.index = ['AAA', 'BBB' ,,,,]
.
└ "AAA" "BBB": Nom de la ligne (facultatif)
└ La chaîne de caractères et la valeur numérique peuvent être spécifiées
Changer le nom de l'index plus tard
df1.index = ['111','222','333','444']
df1
#production
0
111 AAA
222 BBB
333 CCC
444 DDD
renommer peut spécifier le nom de colonne à modifier et comment.
rename = (index = {nom de la ligne d'origine: nom de la ligne modifié})
Changer avec la méthode de changement de nom
df1.rename(index={1:'111',3:'333'})
#production
0
0 AAA
111 BBB
2 CCC
333 DDD
① Désigné lors de la création du tableau ② Changer plus tard ②-1. méthode d'index ②-2. renommer la méthode
Avec les options DataFrame
columns=['AAA','BBB',,,,]
index=['aaa','bbb',,,,]
Est spécifié.
└ "AAA" "BBB": nom de la colonne (facultatif)
└ "aaa" "bbb": Nom de la ligne (facultatif)
Spécifiez une matrice
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
df1 = pd.DataFrame(listA, columns=['Ah ah'], index=['111','222','333','444'])
df1
#production
Ah ah
111 AAA
222 BBB
333 CCC
444 DDD
Spécifiez une matrice (variable)
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
cols = ['Ah ah']
inds = ['111','222','333','444']
df1 = pd.DataFrame(listA, columns=cols, index=inds)
df1
#production
Ah ah
111 AAA
222 BBB
333 CCC
444 DDD
renommer peut spécifier le nom de colonne à modifier et comment.
rename (index = {nom de ligne d'origine: nom de ligne modifié}, colonnes = {nom de colonne d'origine: nom de colonne modifié})
Spécifiez une matrice (méthode de renommer)
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
df1 = pd.DataFrame(listA)
df1.rename(columns={0:'Bien'}, index={1:'111', 3:'333', 4:'444'})
#production
Bien
0 AAA
111 BBB
2 CCC
333 DDD
Créez une table à plusieurs colonnes à partir de plusieurs listes.
Combinez les deux listes.
list
listA = ['AAA', 'BBB', 'CCC', 'DDD']
listB = ['EEE', 'FFF', 'GGG', 'HHH']
Méthode ① Combinez dans l'état de liste ② Créez une table puis rejoignez
df['aaa'] = ['AAA', 'BBB',,,]
└ "df": table d'origine
└ "aaa": nom de colonne à ajouter (la valeur numérique est également acceptable)
└ "AAA" "BBB": éléments de colonne
Ajouter une colonne
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
df1= pd.DataFrame(listA)
df1[1] = ['EEE', 'FFF', 'GGG', 'HHH']
df1
#production
0 1
0 AAA EEE
1 BBB FFF
2 CCC GGG
3 DDD HHH
Erreur si le nombre d'éléments est différent
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
df1= pd.DataFrame(listA)
df1[1] = ['EEE', 'FFF', 'GGG']
df1
#production
# ValueError: Length of values does not match length of index
df['aaa']
= dfB
└ "df": table d'origine
└ "aaa": nom de colonne à ajouter (la valeur numérique est également acceptable)
└ "AAA" "BBB": éléments de colonneAjouter une colonne
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
dfA= pd.DataFrame(listA)
listB =['EEE', 'FFF', 'GGG', 'HHH']
dfB= pd.DataFrame(listB)
dfA['1'] = dfB
dfA
#production
0 1
0 AAA EEE
1 BBB FFF
2 CCC GGG
3 DDD HHH
Dans le cas de "+"
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
dfA= pd.DataFrame(listA)
listB =['EEE', 'FFF', 'GGG', 'HHH']
dfB= pd.DataFrame(listB)
dfA + dfB
#production
0
0 AAAEEE
1 BBBFFF
2 CCCGGG
3 DDDHHH
Table originale
listA = ['AAA', 'BBB', 'CCC', 'DDD']
listB = ['EEE', 'FFF', 'GGG', 'HHH']
listC = ['III', 'JJJ', 'KKK', 'LLL']
listD = ['MMM', 'NNN', 'OOO', 'PPP']
Joindre la table
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
listB = ['EEE', 'FFF', 'GGG', 'HHH']
listC = ['III', 'JJJ', 'KKK', 'LLL']
listD = ['MMM', 'NNN', 'OOO', 'PPP']
dfA = pd.DataFrame(listA)
dfA[1] = listB
dfA[2] = listC
dfA[3] = listD
dfA
#production
0 1 2 3
0 AAA EEE III MMM
1 BBB FFF JJJ NNN
2 CCC GGG KKK OOO
3 DDD HHH LLL PPP
Recommended Posts