[PYTHON] Etosetra lié à Pandas read_csv

La fonction read_csv du module Pandas est souvent utilisée par les programmes Python pour lire les fichiers CSV. Le style d'écriture que vous voyez souvent dans les exemples de programmes est le suivant.

import pandas as pd
df = pd.read_csv('./iris.csv')

C'est Etosetra lié à un tel read_csv.

Lire les fichiers directement sur Internet

Non seulement les fichiers sur le PC mais aussi les fichiers sur Internet peuvent être lus directement en spécifiant l'URL. Un exemple est le jeu de données Pandas iris sur Github.

url = 'https://github.com/pandas-dev/pandas/raw/master/pandas/tests/data/iris.csv'
df = pd.read_csv(url)

Lit le nombre de lignes spécifié

Ceci est pratique lorsque vous souhaitez lire un long fichier.

df = pd.read_csv(url, nrows=10)

Spécifiez la colonne et le type à lire

Seules des colonnes spécifiques peuvent être lues.

df = pd.read_csv(url, usecols=['SepalLength', 'SepalWidth'])

Il est également possible de lire en spécifiant le type.

df = pd.read_csv(url, usecols=['SepalLength', 'SepalWidth'], dtype={'SepalLength': float, 'SepalWidth': float})
#Confirmation de type
df.dtypes

Lire le fichier Excel

Il peut également être lu à partir d'Excel. Présentation de read_excel, un ami de read_csv. Le module xlrd est requis, alors installons-le.

pip install xlrd

L'utilisation est la même que read_csv. Comme prévu, c'est un ami.

dfx = pd.read_excel('iris.xlsx')

Écrire dans un fichier CSV

C'est l'humanité que vous voulez écrire après avoir lu.

Copier dans le clip

Il existe également une telle instruction. Vous pouvez éviter les problèmes de sélection et de copie.

dfx.to_clipboard()

Écrire dans un fichier CSV

Utilisez to_csv. Il sera enregistré dans le chemin de fichier spécifié.

dfx.to_csv('iris_out.csv')

Si vous le joignez à l'impression, le résultat de csv sera affiché à l'écran.

print(dfx.to_csv())

Écrire dans un fichier Excel

Si vous le lisez depuis Excel, vous voudrez l'écrire. J'utiliserai to_excel. Le module openpyxl est requis et sera installé.

!pip install openpyxl

L'utilisation est la même que to_csv.

dfx.to_excel('iris_out.xlsx')

J'ai été surpris de pouvoir lire le dernier fichier Excel Office 365. Comme prévu.

Recommended Posts

Etosetra lié à Pandas read_csv
[Python] Résumé de l'utilisation des pandas
liens relatifs aux pandas
[Python] Comment lire le fichier csv (méthode read_csv du module pandas)
Origine de ce nom liée à la programmation # 1 Nom de la langue 1
L'en-tête est mal aligné avec read_csv () et read_table () de Pandas
Disposition des éléments auto-mentionnés liés à l'apprentissage automatique
Comment utiliser Pandas 2
Convertir 202003 en 2020-03 avec les pandas
Fonctionnement de base des pandas
À propos de MultiIndex of Pandas
UnicodeDecodeError dans pandas read_csv
Fonctionnement de base des Pandas
Comment générer un CSV d'en-tête multiligne avec des pandas
Comment obtenir un aperçu de vos données dans Pandas
[Introduction à cx_Oracle] Présentation de cx_Oracle
Allocation de ressources aux tests
Ajouts clés aux pandas 1.1.0 et 1.0.0
Comment utiliser Pandas Rolling
Résumé de l'utilisation de base de Pandas
Comportement de la méthode pandas rolling ()
Index d'utilisation de certains pandas
Exporter la trame de données pandas vers Excel
Le pouvoir des pandas: Python
Points à noter lorsque les pandas lisent le csv de la sortie Excel
J'ai essayé d'obtenir une base de données sur les courses de chevaux en utilisant Pandas
Comment trouver l'adresse mémoire de la valeur de la trame de données Pandas
Que faire si «Sans nom: 0» est ajouté dans to_csv-> read_csv des pandas
Que faire quand UnicodeDecodeError se produit pendant read_csv dans pandas (pd.read_table ())