Aus einer mit Pandas DataFrame erstellten Tabelle ・ ** So extrahieren Sie das angegebene Element **
▼ Zu verwendende Tabelle (der Variablen "df" zugeordnet)
Code zur Tabellenerstellung
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
listB = ['EEE', 'FFF', 'GGG', 'HHH']
listC = ['III', 'JJJ', 'KKK', 'LLL']
listD = ['MMM', 'NNN', 'OOO', 'PPP']
df = pd.DataFrame(listA)
df[1] = listB
df[2] = listC
df[3] = listD
df.columns = ['aaa', 'bbb', 'ccc', 'ddd']
df.index = [111,222,333,444]
df
Für Details zum Erstellen einer Tabelle klicken Sie hier ()
Verwenden Sie die .columns
-Methode
└ Extraktion der Liste der Spaltennamen
└ Die Ausgabe ist vom Typ Index / Int64Index usw.
└ Der Spaltentyp (dtype) wird ebenfalls ausgegeben
[Zu verwendende Tabelle und ihr Code](# Zu verwendende Tabelle)
Spaltennamen extrahieren
df.columns
#Ausgabe
# Index(['aaa', 'bbb', 'ccc', 'ddd'], dtype='object')
Die Ausgabe ist vom Typ Index.
▼ Der Indextyp kann aufgelistet sein.
Ausgabe als Listentyp
list(df.columns)
#Ausgabe
# ['aaa', 'bbb', 'ccc', 'ddd']
Auszug nach Spaltennummer
df.columns[2]
#Ausgabe
# 'ccc'
Extrahieren nach Spaltenname ①
df['bbb']
#Ausgabe
111 EEE
222 FFF
333 GGG
444 HHH
Name: bbb, dtype: object
Extrahieren nach Spaltenname ②
df.bbb
#Ausgabe
111 EEE
222 FFF
333 GGG
444 HHH
Name: bbb, dtype: object
Selbst für Zeichenketten ist kein Kontingent erforderlich. Wenn Sie es einschalten, tritt ein Fehler auf.
Error
df.'bbb'
#Ausgabe
# invalid syntax
df.loc[:, ['aaa', 'bbb',,,]]
└ "loc []": loc-Methode
└ ":,": Kein Zeilenname angegeben
└ "['aaa', 'bbb' ,,,]": Geben Sie den Spaltennamen an, den Sie extrahieren möchten.
Extrahieren nach Spaltenname ③ (loc)
df.loc[:, ['bbb', 'ccc']]
bbb ccc
111 EEE III
222 FFF JJJ
333 GGG KKK
444 HHH LLL
df.loc[:, 'aaa']
=df.loc[:, ['aaa']]
Mit iloc extrahieren
df.iloc[:, [1,2]]
#Ausgabe
bbb ccc
111 EEE III
222 FFF JJJ
333 GGG KKK
444 HHH LLL
df.loc[:, 2]
= df.loc[:, [2]]
** ▼ Nur eine Spalte extrahieren **
Mit iloc extrahieren (nur eine Spalte ①)
df.iloc[:, 2]
#Ausgabe
111 III
222 JJJ
333 KKK
444 LLL
Name: ccc, dtype: object
Mit iloc extrahieren (nur eine Spalte ②)
df.iloc[:, [2]]
#Ausgabe
ccc
111 III
222 JJJ
333 KKK
444 LLL
Verwenden Sie die Methode ".index" └ Extraktion der Liste der Spaltennamen └ Die Ausgabe ist vom Typ Index / Int64Index usw. └ Der Spaltentyp (dtype) wird ebenfalls ausgegeben
[Zu verwendende Tabelle und ihr Code](# Zu verwendende Tabelle)
Zeilennamen extrahieren
df.index
#Ausgabe
# Int64Index([111, 222, 333, 444], dtype='int64')
In diesem Fall ist die Ausgabe vom Typ Int64Index.
▼ index / int64 Der Indextyp kann aufgelistet werden.
Ausgabe als Listentyp
list(df.index)
#Ausgabe
# [111, 222, 333, 444]
Auszug nach Zeilennummer
df.index[2]
#Ausgabe
# '333'
Nach Zeilennamen extrahieren
df.loc[[111,333,444]]
#Ausgabe
aaa bbb ccc ddd
111 AAA EEE III MMM
333 CCC GGG KKK OOO
444 DDD HHH LLL PPP
Nach der angegebenen Zeile extrahieren
df.loc[333:]
#Ausgabe
aaa bbb ccc ddd
333 CCC GGG KKK OOO
444 DDD HHH LLL PPP
Mit loc extrahieren (nur eine Spalte ①)
df.loc[[111]]
#Ausgabe
aaa bbb ccc ddd
111 AAA EEE III MMM
** ▼ Beispiel für df.loc [111]
**
Mit loc extrahieren (nur eine Spalte ②)
df.loc[111]
#Ausgabe
aaa AAA
bbb EEE
ccc III
ddd MMM
Name: 111, dtype: object
③-1. df[n:m:l]
③-2. df.iloc[[n,m,,,,]]
(3-1)df[n:m:l]
Geben Sie die Zeilen an, die mithilfe von Slices extrahiert werden sollen.
└ "df": Variable mit Tabelle
└ "n": Startwert
└ "m": Endpreis
└ "l": Änderungsbetrag
・ "N" und "l" können weggelassen werden.
Zeilenextraktion
df[1:3]
#Ausgabe
aaa bbb ccc ddd
222 BBB FFF JJJ NNN
333 CCC GGG KKK OOO
df[1:5:2]
Extrahieren Sie aus der 1. bis 4. Zeile die Zeilen mit um 2 erhöhten Zahlen.
Zeilenextraktion
df[1:5:2]
#Ausgabe
aaa bbb ccc ddd
222 BBB FFF JJJ NNN
444 DDD HHH LLL PPP
df[:3]
Extrahieren Sie von 0 bis 2. Zeile.
Zeilenextraktion
df[:3]
#Ausgabe
aaa bbb ccc ddd
111 AAA EEE III MMM
222 BBB FFF JJJ NNN
333 CCC GGG KKK OOO
df.iloc[[n,m,,,]]
└ "df": Variable mit Tabelle
└ ".iloc []": Methode, die durch die Zeilen- / Spaltennummer angegeben wird
└ "n" "m": Geben Sie die Zeilennummer an
Angegeben durch Zeilennummer
df.iloc[[1,3]]
#Ausgabe
aaa bbb ccc ddd
222 BBB FFF JJJ NNN
444 DDD HHH LLL PPP
Unterschied in der Anzahl von []. Das Ausgabeergebnis ist jeweils unterschiedlich. └ Die Ausgabe ist mit df.iloc [[n]] leichter zu sehen.
** ▼ Beispiel: df.iloc [[n]]
**
Ausgabe für doppelte Klammern.
Angegeben durch Zeilennummer
df.iloc[[3]]
#Ausgabe
aaa bbb ccc ddd
444 DDD HHH LLL PPP
Angegeben durch Zeilennummer
df.iloc[3]
#Ausgabe
aaa DDD
bbb HHH
ccc LLL
ddd PPP
Name: 444, dtype: object
** ■ Es kann grob in zwei Typen eingeteilt werden, "loc" und "at" **
〇Zusatz: "at" ist schneller.
** ■ Vorhandensein oder Nichtvorhandensein von "i" ** Mit oder ohne das "i" am Anfang können Sie wählen, ob Sie nach Name oder nach Nummer angeben möchten.
・ Keine: Matrixname ・ Ja: Matrixnummer
Code zur Tabellenerstellung
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
listB = ['EEE', 'FFF', 'GGG', 'HHH']
listC = ['III', 'JJJ', 'KKK', 'LLL']
listD = ['MMM', 'NNN', 'OOO', 'PPP']
df = pd.DataFrame(listA)
df[1] = listB
df[2] = listC
df[3] = listD
df.columns = ['aaa', 'bbb', 'ccc', 'ddd']
df.index = [111,222,333,444]
df
(3-1) loc
df.loc ['Zeilenname', 'Spaltenname']
loc
df.loc[333,'bbb']
#Ausgabe
# 'GGG'
iloc
df.iloc[2,1]
#Ausgabe
# 'GGG'
at
df.at[333,'bbb']
#Ausgabe
# 'GGG'
iat
df.iat[2,1]
#Ausgabe
# 'GGG'
①loc ②iloc ③at ④iat
** ■ Vorhandensein oder Nichtvorhandensein von "i" ** Mit oder ohne das "i" am Anfang können Sie wählen, ob Sie nach Name oder nach Nummer angeben möchten.
・ Keine: Matrixname ・ Ja: Matrixnummer
Code zur Tabellenerstellung
import pandas as pd
listA = ['AAA', 'BBB', 'CCC', 'DDD']
listB = ['EEE', 'FFF', 'GGG', 'HHH']
listC = ['III', 'JJJ', 'KKK', 'LLL']
listD = ['MMM', 'NNN', 'OOO', 'PPP']
df = pd.DataFrame(listA)
df[1] = listB
df[2] = listC
df[3] = listD
df.columns = ['aaa', 'bbb', 'ccc', 'ddd']
df.index = [111,222,333,444]
df
(4-1) loc
loc
df.loc[333,'bbb'] = '@@@'
df
#Ausgabe
aaa bbb ccc ddd
111 AAA EEE III MMM
222 BBB FFF JJJ NNN
333 CCC @@@ KKK OOO
444 DDD HHH LLL PPP
(4-2) iloc
iloc
df.iloc[2,1] = '★★'
df
#Ausgabe
aaa bbb ccc ddd
111 AAA EEE III MMM
222 BBB FFF JJJ NNN
333 CCC ★★ KKK OOO
444 DDD HHH LLL PPP
(4-3) at
at
df.at[333,'bbb'] = 999
df
#Ausgabe
aaa bbb ccc ddd
111 AAA EEE III MMM
222 BBB FFF JJJ NNN
333 CCC 999 KKK OOO
444 DDD HHH LLL PPP
(4-4) iat
iat
df.iat[2,1] = '※※'
df
#Ausgabe
aaa bbb ccc ddd
111 AAA EEE III MMM
222 BBB FFF JJJ NNN
333 CCC ※※ KKK OOO
444 DDD HHH LLL PPP
② Später (gemeinsam) -Columns: Spaltenmethode -Line: Indexmethode
③ Später (bezeichnet) -Methode umbenennen └ "Spalten = {}": Spaltennamen ändern └ "index = {}": Zeilennamen ändern
** ▶ So ändern Sie den Zeilennamen und den Spaltennamen hier **
Recommended Posts