[PYTHON] Zusammenfassung der von Pandas 1 häufig ausgeführten Prozesse (CSV-, Excel-Datei-bezogene Vorgänge)

Es ist fast Zeit, Pandas für geschäftliche Zwecke einzusetzen Ich weiß nicht, welche Zahl ich brauen soll, aber ich möchte die häufig verwendeten Verfahren zusammenfassen.

Pandas Version 0.25.1 wird zur Überprüfung des Betriebs verwendet.

Beim Lesen aus einer CSV-Datei

import pandas as pd

#Dateiname: Beispiel.csv
#Der Inhalt der Datei wird unten beschrieben
# 1,Probieren Sie Taro,30
# 2,Probe Hanako,25
# 3,Probe Jiro,28
df = pd.read_csv('sample.csv', 
                 #Wenn Keine, gibt es keine Überschrift, und wenn Sie eine Zahl angeben, wird diese Zeile als Überschrift interpretiert.
                 header=None, 
                 #Geben Sie die zu indizierende Spalte an. * Hier die erste Spalte(1,2,Teil 3)
                 index_col=0, 
                 #Definieren Sie den Spaltennamen
                 names=('name', 'age'),
                 #Definieren Sie den Datentyp der Spalte
                 dtype={'name': str, 'age': int}
                )

Beim Lesen aus einer Excel-Datei

import pandas as pd

#Dateiname: Beispiel.xlsx
#* Der Inhalt der Datei entspricht dem der obigen CSV-Datei.
df = pd.read_excel('sample.xlsx', 
                   dtype={'name': str, 'age': int}
                  )

Beim gleichzeitigen Lesen mehrerer Blätter aus einer Excel-Datei

Es ist bequemer zu wissen, wann Sie ein Tool mit Pandas erstellen möchten, anstatt Daten zu analysieren.

import pandas as pd

excel_book = pd.ExcelFile('sample.xlsx')

#Sie können eine Liste der Blattnamen der geladenen Blätter in einer Liste abrufen.
sheet_name_list = excel_book.sheet_names

#Wenn Sie einen Blattnamen angeben, können Sie den Inhalt dieses Blattes abrufen.
df = excel_book.parse('sheet1')

Bei der Ausgabe des Inhalts eines Datenrahmens in eine CSV-Datei

import pandas as pd

#Das erste Argument ist der Name der Ausgabedatei
df.to_csv('sample.csv', 
          #Setzen Sie False, wenn kein Header benötigt wird
          header=False, 
          #Setzen Sie False, wenn kein Index benötigt wird
          index=False, 
          #Wird beim Begrenzen der Ausgabespalten festgelegt
          columns=['name']
         )

Bei der Ausgabe des Inhalts eines Datenrahmens in eine Excel-Datei

import pandas as pd

#Das erste Argument ist der Name der Ausgabedatei
df.to_excel('sample.xlsx', 
          #Setzen Sie False, wenn kein Header benötigt wird
          header=False, 
          #Setzen Sie False, wenn kein Index benötigt wird
          index=False, 
          #Wird beim Begrenzen der Ausgabespalten festgelegt
          columns=['name']
         )