[PYTHON] Zusammenfassung der von Pandas 1 häufig ausgeführten Prozesse (CSV-, Excel-Datei-bezogene Vorgänge)

Es ist fast Zeit, Pandas für geschäftliche Zwecke einzusetzen Ich weiß nicht, welche Zahl ich brauen soll, aber ich möchte die häufig verwendeten Verfahren zusammenfassen.

Beim Lesen aus einer CSV-Datei

import pandas as pd

#Dateiname: Beispiel.csv
#Der Inhalt der Datei wird unten beschrieben
# 1,Probieren Sie Taro,30
# 2,Probe Hanako,25
# 3,Probe Jiro,28
df = pd.read_csv('sample.csv', 
                 #Wenn Keine, gibt es keine Überschrift, und wenn Sie eine Zahl angeben, wird diese Zeile als Überschrift interpretiert.
                 header=None, 
                 #Geben Sie die zu indizierende Spalte an. * Hier die erste Spalte(1,2,Teil 3)
                 index_col=0, 
                 #Definieren Sie den Spaltennamen
                 names=('name', 'age'),
                 #Definieren Sie den Datentyp der Spalte
                 dtype={'name': str, 'age': int}
                )

Beim Lesen aus einer Excel-Datei

import pandas as pd

#Dateiname: Beispiel.xlsx
#* Der Inhalt der Datei entspricht dem der obigen CSV-Datei.
df = pd.read_excel('sample.xlsx', 
                   dtype={'name': str, 'age': int}
                  )

Beim gleichzeitigen Lesen mehrerer Blätter aus einer Excel-Datei

import pandas as pd

excel_book = pd.ExcelFile('sample.xlsx')

#Sie können eine Liste der Blattnamen der geladenen Blätter in einer Liste abrufen.
sheet_name_list = excel_book.sheet_names

#Wenn Sie einen Blattnamen angeben, können Sie den Inhalt dieses Blattes abrufen.
df = excel_book.parse('sheet1')

Bei der Ausgabe des Inhalts eines Datenrahmens in eine CSV-Datei

import pandas as pd

#Das erste Argument ist der Name der Ausgabedatei
df.to_csv('sample.csv', 
          #Setzen Sie False, wenn kein Header benötigt wird
          header=False, 
          #Setzen Sie False, wenn kein Index benötigt wird
          index=False, 
          #Wird beim Begrenzen der Ausgabespalten festgelegt
          columns=['name']
         )

Bei der Ausgabe des Inhalts eines Datenrahmens in eine Excel-Datei

import pandas as pd

#Das erste Argument ist der Name der Ausgabedatei
df.to_excel('sample.xlsx', 
          #Setzen Sie False, wenn kein Header benötigt wird
          header=False, 
          #Setzen Sie False, wenn kein Index benötigt wird
          index=False, 
          #Wird beim Begrenzen der Ausgabespalten festgelegt
          columns=['name']
         )

Recommended Posts

Zusammenfassung der von Pandas 1 häufig ausgeführten Prozesse (CSV-, Excel-Datei-bezogene Vorgänge)
Zusammenfassung der häufig verwendeten Methoden bei Pandas
Zusammenfassung der häufig mit asyncpg ausgeführten Vorgänge
Zusammenfassung der Excel-Operationen mit OpenPyXL in Python
Zusammenfassung der Python-Dateivorgänge
Zusammenfassung verschiedener Operationen in Tensorflow
Zusammenfassung der häufig verwendeten Grammatik bei Pandas
Zusammenfassung dessen, was bei 100 Pandas-Schlägen verwendet wurde (# 1 ~ # 32)
Persönliche Notizen zu Pandas-bezogenen Vorgängen, die in der Praxis verwendet werden können
[Python] Zusammenfassung der S3-Dateivorgänge mit boto3
Geschwindigkeitsbewertung der Ausgabe von CSV-Dateien in Python
Dateioperationen in Python
Lesen Sie die CSV-Datei: pandas
Zusammenfassung der Zeichenfolgenoperationen
[Python] Erstellen eines GUI-Tools, das die CSV von Temperaturanstiegsdaten in Excel automatisch verarbeitet
Zusammenfassung der von Pandas 2 häufig ausgeführten Prozesse (Datenreferenz, Bearbeitungsvorgang)
[Python] Öffnen Sie die CSV-Datei in dem von Pandas angegebenen Ordner
Zusammenfassung der Python3-Listenoperationen
Zusammenfassung der grundlegenden Verwendung von Pandas
So fügen Sie eine CSV-Datei mit Pandas in eine Excel-Datei ein
Zu beachtende Punkte, wenn Pandas CSV der Excel-Ausgabe lesen
Formatieren Sie die CSV-Datei "Nationalfeiertag" des Kabinetts mit Pandas