Die Funktion read_csv des Pandas-Moduls wird häufig beim Lesen von CSV-Dateien in Python-Programmen verwendet. Der Schreibstil, den Sie häufig in Beispielprogrammen sehen, ist wie folgt.
import pandas as pd
df = pd.read_csv('./iris.csv')
Es ist Etosetra im Zusammenhang mit solchen read_csv.
Nicht nur Dateien auf dem PC, sondern auch Dateien im Internet können durch Angabe der URL direkt gelesen werden. Ein Beispiel ist der Pandas-Iris-Datensatz auf Github.
url = 'https://github.com/pandas-dev/pandas/raw/master/pandas/tests/data/iris.csv'
df = pd.read_csv(url)
Dies ist praktisch, wenn Sie eine lange Datei lesen möchten.
df = pd.read_csv(url, nrows=10)
Es können nur bestimmte Spalten gelesen werden.
df = pd.read_csv(url, usecols=['SepalLength', 'SepalWidth'])
Es ist auch möglich, durch Angabe des Typs zu lesen.
df = pd.read_csv(url, usecols=['SepalLength', 'SepalWidth'], dtype={'SepalLength': float, 'SepalWidth': float})
#Typbestätigung
df.dtypes
Es kann auch aus Excel gelesen werden. Wir stellen read_excel vor, einen Freund von read_csv. Das xlrd-Modul wird benötigt, also installieren wir es.
pip install xlrd
Die Verwendung ist die gleiche wie bei read_csv. Wie erwartet ist es ein Freund.
dfx = pd.read_excel('iris.xlsx')
Es ist die Menschheit, die Sie nach dem Lesen schreiben möchten.
Es gibt auch eine solche Anweisung. Sie können sich das Auswählen und Kopieren ersparen.
dfx.to_clipboard()
Verwenden Sie to_csv. Es wird im angegebenen Dateipfad gespeichert.
dfx.to_csv('iris_out.csv')
Wenn Sie es dem Druck beilegen, wird das Ergebnis von csv auf dem Bildschirm angezeigt.
print(dfx.to_csv())
Wenn Sie es aus Excel lesen, möchten Sie es schreiben. Ich werde to_excel verwenden. Das openpyxl-Modul ist erforderlich und wird installiert.
!pip install openpyxl
Die Verwendung ist dieselbe wie bei to_csv.
dfx.to_excel('iris_out.xlsx')
Ich war überrascht, die neueste Office 365 Excel-Datei lesen zu können. Wie erwartet.
Recommended Posts