La fonction read_csv du module Pandas est souvent utilisée par les programmes Python pour lire les fichiers CSV. Le style d'écriture que vous voyez souvent dans les exemples de programmes est le suivant.
import pandas as pd
df = pd.read_csv('./iris.csv')
C'est Etosetra lié à un tel read_csv.
Non seulement les fichiers sur le PC mais aussi les fichiers sur Internet peuvent être lus directement en spécifiant l'URL. Un exemple est le jeu de données Pandas iris sur Github.
url = 'https://github.com/pandas-dev/pandas/raw/master/pandas/tests/data/iris.csv'
df = pd.read_csv(url)
Ceci est pratique lorsque vous souhaitez lire un long fichier.
df = pd.read_csv(url, nrows=10)
Seules des colonnes spécifiques peuvent être lues.
df = pd.read_csv(url, usecols=['SepalLength', 'SepalWidth'])
Il est également possible de lire en spécifiant le type.
df = pd.read_csv(url, usecols=['SepalLength', 'SepalWidth'], dtype={'SepalLength': float, 'SepalWidth': float})
#Confirmation de type
df.dtypes
Il peut également être lu à partir d'Excel. Présentation de read_excel, un ami de read_csv. Le module xlrd est requis, alors installons-le.
pip install xlrd
L'utilisation est la même que read_csv. Comme prévu, c'est un ami.
dfx = pd.read_excel('iris.xlsx')
C'est l'humanité que vous voulez écrire après avoir lu.
Il existe également une telle instruction. Vous pouvez éviter les problèmes de sélection et de copie.
dfx.to_clipboard()
Utilisez to_csv. Il sera enregistré dans le chemin de fichier spécifié.
dfx.to_csv('iris_out.csv')
Si vous le joignez à l'impression, le résultat de csv sera affiché à l'écran.
print(dfx.to_csv())
Si vous le lisez depuis Excel, vous voudrez l'écrire. J'utiliserai to_excel. Le module openpyxl est requis et sera installé.
!pip install openpyxl
L'utilisation est la même que to_csv.
dfx.to_excel('iris_out.xlsx')
J'ai été surpris de pouvoir lire le dernier fichier Excel Office 365. Comme prévu.
Recommended Posts