[PYTHON] Etosetra im Zusammenhang mit Pandas read_csv

Die Funktion read_csv des Pandas-Moduls wird häufig beim Lesen von CSV-Dateien in Python-Programmen verwendet. Der Schreibstil, den Sie häufig in Beispielprogrammen sehen, ist wie folgt.

import pandas as pd
df = pd.read_csv('./iris.csv')

Es ist Etosetra im Zusammenhang mit solchen read_csv.

Lesen Sie Dateien direkt im Internet

Nicht nur Dateien auf dem PC, sondern auch Dateien im Internet können durch Angabe der URL direkt gelesen werden. Ein Beispiel ist der Pandas-Iris-Datensatz auf Github.

url = 'https://github.com/pandas-dev/pandas/raw/master/pandas/tests/data/iris.csv'
df = pd.read_csv(url)

Liest die angegebene Anzahl von Zeilen

Dies ist praktisch, wenn Sie eine lange Datei lesen möchten.

df = pd.read_csv(url, nrows=10)

Geben Sie die zu lesende Spalte und den zu lesenden Typ an

Es können nur bestimmte Spalten gelesen werden.

df = pd.read_csv(url, usecols=['SepalLength', 'SepalWidth'])

Es ist auch möglich, durch Angabe des Typs zu lesen.

df = pd.read_csv(url, usecols=['SepalLength', 'SepalWidth'], dtype={'SepalLength': float, 'SepalWidth': float})
#Typbestätigung
df.dtypes

Excel-Datei lesen

Es kann auch aus Excel gelesen werden. Wir stellen read_excel vor, einen Freund von read_csv. Das xlrd-Modul wird benötigt, also installieren wir es.

pip install xlrd

Die Verwendung ist die gleiche wie bei read_csv. Wie erwartet ist es ein Freund.

dfx = pd.read_excel('iris.xlsx')

Schreiben Sie in eine CSV-Datei

Es ist die Menschheit, die Sie nach dem Lesen schreiben möchten.

In Clip kopieren

Es gibt auch eine solche Anweisung. Sie können sich das Auswählen und Kopieren ersparen.

dfx.to_clipboard()

In CSV-Datei schreiben

Verwenden Sie to_csv. Es wird im angegebenen Dateipfad gespeichert.

dfx.to_csv('iris_out.csv')

Wenn Sie es dem Druck beilegen, wird das Ergebnis von csv auf dem Bildschirm angezeigt.

print(dfx.to_csv())

In Excel-Datei schreiben

Wenn Sie es aus Excel lesen, möchten Sie es schreiben. Ich werde to_excel verwenden. Das openpyxl-Modul ist erforderlich und wird installiert.

!pip install openpyxl

Die Verwendung ist dieselbe wie bei to_csv.

dfx.to_excel('iris_out.xlsx')

Ich war überrascht, die neueste Office 365 Excel-Datei lesen zu können. Wie erwartet.

Recommended Posts

Etosetra im Zusammenhang mit Pandas read_csv
[Python] Zusammenfassung der Verwendung von Pandas
Pandas verwandte Links
[Python] Lesen der CSV-Datei (Methode read_csv des Pandas-Moduls)
Herkunft dieses Namens im Zusammenhang mit Programmierung # 1 Sprachname 1
Der Header ist falsch ausgerichtet mit read_csv () und read_table () von Pandas
Anordnung von selbst erwähnten Dingen im Zusammenhang mit maschinellem Lernen
Verwendung von Pandas 2
Konvertieren Sie 202003 bis 2020-03 mit Pandas
Grundlegende Bedienung von Pandas
UnicodeDecodeError in pandas read_csv
Grundlegende Bedienung von Pandas
So geben Sie die CSV eines mehrzeiligen Headers mit Pandas aus
So erhalten Sie einen Überblick über Ihre Daten in Pandas
[Einführung in cx_Oracle] Übersicht über cx_Oracle
Zuweisung von Ressourcen zum Testen
Wichtige Ergänzungen zu den Pandas 1.1.0 und 1.0.0
Wie man Pandas Rolling benutzt
Zusammenfassung der grundlegenden Verwendung von Pandas
Verhalten der Pandas Rolling () Methode
Index der Verwendung bestimmter Pandas
Exportieren Sie den Pandas-Datenrahmen nach Excel
Die Kraft der Pandas: Python
Zu beachtende Punkte, wenn Pandas CSV der Excel-Ausgabe lesen
Ich habe versucht, mit Pandas eine Pferderenn-Datenbank zu erstellen
So ermitteln Sie die Speicheradresse des Pandas-Datenrahmenwerts
Was tun, wenn "Unbenannt: 0" in_csv-> read_csv von Pandas hinzugefügt wird?
Was tun, wenn UnicodeDecodeError während read_csv in Pandas auftritt (pd.read_table ())