[Python] Zusammenfassung der Methode zur Tabellenerstellung mit DataFrame (Pandas)

[Python] Zusammenfassung der Methode zur Tabellenerstellung mit DataFrame (Pandas)

Es gibt mehrere Möglichkeiten, eine einzelne Tabelle mit Pandas DataFrames zu erstellen.

Zusammenfassung der grundlegenden Herstellungsmethode.

Der schnellste Weg, die Basistabelle zu lesen, besteht darin, sie als CSV-Datei zu erstellen.


**Inhaltsverzeichnis**
  1. [Zu erstellende Tabelle](# 1 Zu erstellende Tabelle)
  2. [Aus 2D-Liste erstellen](# 22 Aus 2D-Liste erstellen)
  3. [Matrixnamen später angeben](# 1 Matrixname später angeben)
  4. [Als Option beim Erstellen einer Tabelle angeben](# 2 Als Option beim Erstellen einer Tabelle angeben)
  5. [Geben Sie die Spalte an, die der Zeilenname aus der Tabelle sein soll](# 3 Geben Sie die Spalte an, die der Zeilenname aus der Tabelle sein soll.)
  6. [Aus eindimensionaler Liste erstellen](Aus # 31-dimensionaler Liste erstellen)
  7. [Kombiniere jede Liste zusammen](# 1 Kombiniere jede Liste zusammen)
  8. [Kombiniere jede Liste einzeln](# 2 Verbinde jede Liste einzeln)
  9. [Mit Formel kombinieren](# 3 Mit Formel kombinieren)
  10. [Mit CSV-Datei erstellen und lesen](# 4 Mit CSV-Datei erstellen und lesen)
  11. [Liste der verwendeten Methoden](# 5 Liste der verwendeten Methoden)

## 1. 1. Tabelle zu erstellen Erstellen Sie die folgende Tabelle.
image.png

## 2. Erstellt aus einer zweidimensionalen Liste ** ■ Was ist ein zweidimensionales Array ** `[['A','B',,],['C','D',,],,,]`

Eine eindimensionale Liste ['A', 'B' ,,] in derselben [] parallel.

Überprüfen Sie mit den folgenden 3 Mustern. (1) Geben Sie den Matrixnamen später an (2) Optional beim Erstellen einer Tabelle (3) Geben Sie die Spalte an, die der Zeilenname aus der Tabelle sein soll


### (1) Geben Sie den Matrixnamen später an

** ▼ Vorgehensweise ** ① Machen Sie jede Zeile zu einer Liste ② In Tabelle konvertieren ③ Ändern Sie den Zeilennamen ④ Spaltennamen ändern


** ① Ordne jede Zeile parallel als eine Liste an **

Zweidimensionales Array


list = [
[1, 100, 0.33, 'AAA', 'AAA100'], 
[2, 200, 0.67, 'BBB', 'BBB200'], 
[3, 300, 1, 'CCC', 'CCC300'], 
[4, 400, 1.33, 'DDD', 'DDD400'], 
[5, 500, 1.67, 'EEE', 'EEE500'], 
[6, 600, 2, 'FFF', 'FFF600']]

** ② In Tabelle konvertieren ** `pd.DataFrame(list)` └ In eine Tabelle mit pandas DataFrame konvertieren.

In Tabelle konvertieren


df = pd.DataFrame(list)
df
image.png

Den Zeilen- und Spaltennamen werden automatisch Nummern zugewiesen.


** ③ Zeilenname ändern ** `df.index = ['A','B',,,]`

Zeile umbenennen


df.index = ['row0','row1','row2','row3','row4','row5']
df
image.png

** ④ Spaltennamen ändern ** `df.columns = ['a','b',,,]`

Spalte umbenennen


df.columns = ['col0','col1','col2','col3','col4']
df
image.png

Damit ist der Vorgang abgeschlossen.


### (2) Optional beim Erstellen einer Tabelle

** ▼ Vorgehensweise ** ① Machen Sie jede Zeile zu einer Liste (2) In Tabelle konvertieren (Matrixnamen als Option angeben) 2-1 Spalten Option 2-2 Indexoption


** ① Ordne jede Zeile parallel als eine Liste an **

Zweidimensionales Array


list = [
[1, 100, 0.33, 'AAA', 'AAA100'], 
[2, 200, 0.67, 'BBB', 'BBB200'], 
[3, 300, 1, 'CCC', 'CCC300'], 
[4, 400, 1.33, 'DDD', 'DDD400'], 
[5, 500, 1.67, 'EEE', 'EEE500'], 
[6, 600, 2, 'FFF', 'FFF600']]

** ② In Tabelle konvertieren (Matrixnamen als Option angeben) ** `pd.DataFrame(list, index=['A','B',,,], columns=['a','b',,,])` └ "Liste": Array, das tabellarisch dargestellt werden soll └ index = ['A', 'B' ,,,]: Indexoption └ Spalten = ['a', 'b' ,,,]: Spaltenoption └ Die Option [] kann als Variable angegeben werden.

Optionaler Matrixname


ind = ['row0','row1','row2','row3','row4','row5']
col = ['col0','col1','col2','col3','col4']

df = pd.DataFrame(list, index=ind, columns=col)
df
image.png

Damit ist der Vorgang abgeschlossen.


### (3) Geben Sie die Spalte an, die der Zeilenname aus der Tabelle sein soll

** ▼ Vorgehensweise ** ① Machen Sie jede Zeile zu einer Liste ② In Tabelle konvertieren ③ Ändern Sie den Spaltennamen ④ Geben Sie die Spalte an, die der Zeilenname sein soll


** ① Machen Sie jede Zeile zu einer Liste ** Fügen Sie Zeilennamen in ein zweidimensionales Array ein.

Zweidimensionales Array


list = [
['row0', 1, 100, 0.33, 'AAA', 'AAA100'], 
['row1', 2, 200, 0.67, 'BBB', 'BBB200'], 
['row2', 3, 300, 1, 'CCC', 'CCC300'], 
['row3', 4, 400, 1.33, 'DDD', 'DDD400'], 
['row4', 5, 500, 1.67, 'EEE', 'EEE500'], 
['row5', 6, 600, 2, 'FFF', 'FFF600'], ]

** ② In Tabelle konvertieren ** `pd.DataFrame(list)` └ "Liste": Variable mit Array-Daten

In Tabelle konvertieren


df = pd.DataFrame(list)
df
image.png

Den Zeilen- und Spaltennamen werden automatisch Nummern zugewiesen.


** ③ Spaltennamen ändern ** `df.columns = ['a','b',,,]`

Spalte umbenennen


df.columns =  ['','col0','col1','col2','col3','col4']
df
image.png

** ④ Geben Sie die Spalte an, die der Zeilenname sein soll ** `set_index ('Spaltenname')`

Geben Sie die Spalte an, die der Zeilenname sein soll


df = df.set_index('')
df
image.png

Der Spaltenname "''" wurde in der Überschrift festgelegt.


## 3.1 Erstellt aus einer eindimensionalen Liste

Überprüfen Sie mit den folgenden 3 Mustern. (1) Kombinieren Sie jede Liste miteinander (2) Kombinieren Sie jede Liste einzeln (3) Mit Formel kombinieren


### (1) Kombinieren Sie jede Liste miteinander

** ▼ Vorgehensweise ** ① Erstellen Sie für jede Zeile eine Liste ② Sofort in eine Tabelle konvertieren ③ Ändern Sie den Zeilennamen ④ Spaltennamen ändern


** ① Erstellen Sie eine Liste für jede Zeile **

Erstelle Liste


listA = [1, 100, 0.33, 'AAA', 'AAA100']
listB = [2, 200, 0.67, 'BBB', 'BBB200']
listC = [3, 300, 1, 'CCC', 'CCC300']
listD = [4, 400, 1.33, 'DDD', 'DDD400']
listE = [5, 500, 1.67, 'EEE', 'EEE500']
listF = [6, 600, 2, 'FFF', 'FFF600']

** ② Alles zusammen in eine Tabelle konvertieren ** `pd.DataFrame([A,B,,,])` └ 1-dimensionale Liste "A" "B" └ Die Anzahl der Elemente ist gleich

Sofort in eine Tabelle konvertieren


pd.DataFrame([listA,listB,listC,listD,listE,listF])
image.png

** ③ Zeilenname ändern ** `df.index = ['A','B',,,]`

Zeile umbenennen


df.index = ['row0','row1','row2','row3','row4','row5']
df
image.png

** ④ Spaltennamen ändern ** `df.columns = ['a','b',,,]`

Spalte umbenennen


df.columns = ['col0','col1','col2','col3','col4']
df
image.png

Damit ist der Vorgang abgeschlossen.


### (2) Kombinieren Sie jede Liste einzeln

** ▼ Vorgehensweise ** ① Erstellen Sie für jede Zeile eine Liste ② Erstellen Sie eine Tabelle ③ Fügen Sie der Tabelle eine Spalte hinzu ④ Ändern Sie den Zeilennamen ⑤ Übertragen


** ① Erstellen Sie eine Liste für jede Zeile **

Erstelle Liste


listA = [1, 100, 0.33, 'AAA', 'AAA100']
listB = [2, 200, 0.67, 'BBB', 'BBB200']
listC = [3, 300, 1, 'CCC', 'CCC300']
listD = [4, 400, 1.33, 'DDD', 'DDD400']
listE = [5, 500, 1.67, 'EEE', 'EEE500']
listF = [6, 600, 2, 'FFF', 'FFF600']

** ② Erstellen einer Tabelle ** Generieren Sie eine Tabelle aus einer Liste. `pd.DataFrame(list, columns=['A'])` └ "listA": Sequenzdaten └ "column = ['A']": Setzen Sie den Spaltennamen auf A.

Eine Tabelle erstellen


df= pd.DataFrame(listA, columns=['row0'])
df

image.png

└ Beschreibe 'Spaltenname': [Array] in ({})

Erstellen mit Spaltenname ①


pd.DataFrame({'row0':[1, 100, 0.33, 'AAA', 'AAA100']})
image.png

Mit Spaltennamen erstellen (mehrere Spalten)


pd.DataFrame({'row0':[1, 100, 0.33, 'AAA', 'AAA100'], 'row1':[2, 200, 0.67, 'BBB', 'BBB200']})
image.png

** ③ Spalte zur Tabelle hinzufügen ** `df['B'] = pd.DataFrame(list)` └ "B": Spaltenname zum Hinzufügen └ "Liste": Zu fügende Tabellendaten

Spalte zur Tabelle hinzufügen


df['row1'] = pd.DataFrame(listB)
df['row2'] = pd.DataFrame(listC)
df['row3'] = pd.DataFrame(listD)
df['row4'] = pd.DataFrame(listE)
df['row5'] = pd.DataFrame(listF)
df

image.png


** ④ Zeilenname ändern ** `df.index = ['A','B',,,]`

Zeile umbenennen


df.index = ['col0','col1','col2','col3','col4']
df

image.png


** ⑤ Umzug ** `df.T` └ Tauschen Sie die Matrix aus.

Translokation


df = df.T
df
image.png

Damit ist der Vorgang abgeschlossen.


### (3) Mit Formel kombinieren Wenn jede Spalte Regelmäßigkeit aufweist, können Sie Formeln verwenden, um die Spalten zu verbinden.
image.png

** ▼ Regelmäßigkeit **

** ▼ Vorgehensweise ** ① Liste erstellen ② Erstellen Sie eine Tabelle ③ Fügen Sie der Tabelle eine Spalte mit einer Formel hinzu ④ Ändern Sie den Zeilennamen


** ① Liste erstellen ** Erstellen Sie eine Basisspalte.

Zwei für col0 und col3.

Erstelle Liste


listA = [1,2,3,4,5,6]
listD = ['AAA', 'BBB', 'CCC', 'DDD', 'EEE', 'FFF']

** ② Erstellen einer Tabelle ** `pd.DataFrame(list, columns=['A'])` └ "listA": Sequenzdaten └ "column = ['A']": Setzen Sie den Spaltennamen auf A.

Eine Tabelle erstellen


df = pd.DataFrame(listA, columns=['col0'])
df
image.png

** ③ Fügen Sie der Tabelle eine Spalte mit einer Formel hinzu ** ・ `Df ['B'] = df ['A'] / 2` └ "B": Spaltenname zum Hinzufügen └ "df ['A']" / 2: Ersetzen Sie den Wert des vorhandenen Spaltennamens A geteilt durch 2.

Df ['C'] = df ['A'] + df ['B'] └ Kombinieren Sie die Werte in den Spalten "A" und "B" └ * str + int ist ein Fehler (entspricht dem Typ)

Df ['A']. Astype (str) └ Ändern Sie die Spalte "A" in "str"

Fügen Sie der Tabelle Spalten mithilfe von Formeln hinzu


df['col1'] = df['col0'] * 100
df['col2'] = df['col0'] / 3
df['col3'] = pd.DataFrame(listD)
df['col4'] = df['col3'] + df['col1'].astype(str)
df
image.png

** ④ Zeilenname ändern ** `df.index = ['A','B',,,]`

Zeile umbenennen


df.index=['row0','row1','row2','row3','row4','row5']
df
image.png

Damit ist der Vorgang abgeschlossen.


## 4. Erstellen und Lesen mit CSV-Datei

** ▼ Vorgehensweise ** ① Erstellen Sie eine Tabelle mit einer CSV-Datei ② Importieren Sie mit der Methode read_csv └ Geben Sie die Überschriftenspalte an


** ① Erstellen Sie eine Tabelle mit CSV-Datei ** Erstellen Sie eine Tabelle wie die folgende.

image.png


** ② Import mit read_csv Methode ** `read_csv ('Falpath', index_col = n)` └ "'Dateipfad'": Absoluter Pfad oder relativer Pfad ist OK └ "index_col = n": Geben Sie die Spaltennummer (n: Ganzzahl) an, die die Überschrift sein soll
** ▼ Beim Lesen der Datei test.csv des Desktops **

CSV-Datei lesen


import pandas as pd
pd.read_csv('~/desktop/test.csv', index_col=0)
image.png

Damit ist der Vorgang abgeschlossen.

Klicken Sie hier, um eine Liste der Optionen zum Lesen von CSV-Dateien anzuzeigen (https://qiita.com/yuta-38/items/e1e890a647e77c7ccaad).


## 5. Liste der verwendeten Methoden ・ `Pd.DataFrame (Liste)` └ Liste in Tabelle konvertieren

Pd.DataFrame ([A, B ,,,]) └ Konvertieren Sie eine eindimensionale Liste sofort in eine Tabelle

Df.index = ['A', 'B' ,,,] └ Ändern Sie den Zeilennamen

Df.columns = ['a', 'b' ,,,] └ Spaltennamen ändern

Pd.DataFrame (Liste, Index = ['A', 'B' ,,,]) └ Geben Sie beim Erstellen der Tabelle den Zeilennamen an

Pd.DataFrame (Liste, Spalten = ['a', 'b' ,,,]) └ Geben Sie beim Erstellen der Tabelle den Spaltennamen an

Pd.DataFrame ({'A': [1,2 ,,], 'B': [3,4 ,,],}) └ Geben Sie beim Erstellen der Tabelle den Spaltennamen an └ Beschreibe 'Spaltenname': [Array] in ({})

Set_index ('a') └ Geben Sie die Spalte an, die der Zeilenname sein soll

Df ['b'] = pd.DataFrame (Liste) └ Spalte (Spaltenname b) zur Tabelle (df) hinzufügen

Df.T └ Translokation

Df ['B'] = df ['A'] / 2 └ "B": Spaltenname zum Hinzufügen └ "df ['A']" / 2: Ersetzen Sie den Wert des vorhandenen Spaltennamens A geteilt durch 2.

Df ['C'] = df ['A'] + df ['B'] └ Kombinieren Sie die Werte in den Spalten "A" und "B" └ * str + int ist ein Fehler (entspricht dem Typ)

Df ['A']. Astype (str) └ Ändern Sie die Spalte "A" in "str"

[['A', 'B' ,,], ['C', 'D' ,,] ,,,] └ Zweidimensionales Array


[Zurück nach oben](#)

Recommended Posts

[Python] Zusammenfassung der Methode zur Tabellenerstellung mit DataFrame (Pandas)
[Python] Operationsnotiz von Pandas DataFrame
[Pandas_flavor] Fügen Sie eine Methode von Pandas DataFrame hinzu
Python-Pandas: Suchen Sie mit regulären Ausdrücken nach DataFrame
[Python] Erstellen Sie eine Tabelle von Pandas DataFrame zu Postgres
[Python] Sortieren Sie die Tabelle nach sort_values (pandas DataFrame)
Zusammenfassung der Excel-Operationen mit OpenPyXL in Python
Grundlegende Bedienung von Python Pandas Series und Dataframe (1)
Zusammenfassung der Python-Argumente
Python-Anwendung: Pandas # 3: Dataframe
Zusammenfassung der Testmethode
Vergleich von Python (+ Pandas), R, Julia (+ DataFrames) (Zusammenfassung des Tabelleninhalts, Zugriff nach Spalte)
Zusammenfassung der Python-Sortierung (Liste, Wörterbuchtyp, Serie, DataFrame)
Zusammenfassung der beim Extrahieren von Daten verwendeten Pandas-Methoden [Python]
[Python] Verwenden der Linien-API [1. Erstellung des Beauty-Bots]
Zusammenfassung der Dinge, die bei der Verwendung von Pandas praktisch waren
Zusammenfassung der Python3-Listenoperationen
Python: Grundlagen der Verwendung von Scikit-Learn ①
Python Pandas Studie aktuelle Zusammenfassung
Zusammenfassung der grundlegenden Verwendung von Pandas
Verhalten der Pandas Rolling () Methode
Datenanalyse mit Python-Pandas
Die Kraft der Pandas: Python
Konvertieren Sie mit Python für .NET von Pandas DataFrame in System.Data.DataTable
[Python] Zufällige Datenextraktion / -kombination aus DataFrame mit Random und Pandas
Grundlegende Zusammenfassung der Datenoperationen mit Python Pandas - Erste Hälfte: Datenerstellung und -operationen
Python-Handspiel (Pandas / DataFrame-Beginn)
[Python] Laden von CSV-Dateien mit Pandas
Bilderfassung von Firefox mit Python
Zusammenfassung bei Verwendung von AWS Lambda (Python)
Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (5)
[Python] [Inhaltsverzeichnis Links] Python-Programmierung
Eine kurze Zusammenfassung der Python-Sammlung
Trübungsentfernung mit Python detailEnhanceFilter
[Python] So fügen Sie einer Tabelle Zeilen und Spalten hinzu (pandas DataFrame)
Implementierung von Desktop-Benachrichtigungen mit Python
Excel-Diagrammerstellung mit Python xlwings
Zusammenfassung der Unterschiede zwischen Python und PHP (Vergleichstabelle der Hauptelemente)
Erste Schritte mit Python3
[Python] Neunundneunzig Tabellen, die for-Anweisungen verwenden
[Python] -1 Bedeutung der Umformungsmethode von Numpy
Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (4)
Zusammenfassung der Python-Indizes und -Slices
[OpenCV; Python] Zusammenfassung der Funktion findcontours
GUI-Erstellung in Python mit tkinter 2
[Python] Lesen der CSV-Datei (Methode read_csv des Pandas-Moduls)
Holen Sie sich mit Python Bilder von großartigen Find / 47-Sites (1/2: Bis zur Erstellung der Zielliste)
Python: Grundlagen der Bilderkennung mit CNN
[Python] Was ist Pandas Series und DataFrame?
Informationen zum Erstellen einer GUI mit TKinter of Python
GUI-Erstellung in Python mit tkinter Teil 1
Zusammenfassung der häufig verwendeten Methoden bei Pandas
Übung, dies in Python zu verwenden (schlecht)
Zusammenfassung der Spezifikationsmethode für Gammaverteilungsparameter
Python + Selen Zusammenfassung der häufig verwendeten Operationsmethoden
Flexible Animationserstellung mit Animation.FuncAnimation von matplotlib
Python: Anwendung der Bilderkennung mit CNN