[PYTHON] [Für Anfänger] Lesen Sie Excel / CSV-Dateien mit Google Colaboratory in DataFrame

Hallo, das ist CE Sabo.

Dies ist Qiitas erster Beitrag.

Ich möchte Daten mit Python analysieren.

In einem solchen Fall ist das erste, woran Anfänger festhalten, das "Lesen von Daten". (Ich bin auch zuerst gestolpert.)

Was kann ich tun, wenn es sich bei den zu analysierenden Daten um Tabellendaten handelt (Excel-Daten, CSV-Daten usw.)?

Dieses Mal werde ich kurz erklären, wie Sie Excel-Dateien (.xlsx) und CSV-Dateien (.csv) lesen, die Sie am häufigsten verwenden.

Der echte Code ist nur ** 2 Zeilen **. Lassen Sie es uns schnell beenden und mit der Welt der Datenanalyse fortfahren.

Entwicklungsumgebung

・ Google Colaboratory

Wir verwenden Google Colaboratory, was jeder mit einem Google-Konto tun kann.

Importieren Sie zunächst die erforderlichen Bibliotheken

Python verfügt über viele Bibliotheken, mit denen Sie Ihre Daten analysieren können.

Es ist relativ einfach zu implementieren.

Diesmal sind nur "Pandas" in Ordnung.

#Pandas importieren
import pandas as pd

Sie können eine beliebige Zeichenfolge verwenden, indem Sie "as ~" auf die importierte setzen.

Im Allgemeinen wird Pandas als pd abgekürzt.

Laden Sie Dateien in Google Colaboratory hoch

Laden Sie die Datei, die Sie lesen möchten, in Google Colaboratory hoch. andere ① Wie schreibe ich Code? ② Lesen einer lokalen Datei ③ Es scheint, dass es eine Methode zum Mounten und Laden von Google Drive gibt (ich persönlich empfehle sie), aber dieses Mal werde ich die einfachste Methode vorstellen.

Verfahren

① Klicken Sie ganz links auf das Dateisymbol ② Klicken Sie auf Hochladen (roter Rahmen im Bild) und wählen Sie die Datei aus, die Sie lesen möchten, oder ziehen Sie sie per Drag & Drop.

google colab.png

Wenn Sie nicht viele Daten haben, werden diese bald enden und Sie können loslegen.

Verwenden Sie pd.read_excel und pd.read_csv, um Daten zu lesen

Lass es uns jetzt machen. Der Code ist eine Zeile.

Verwenden Sie die Pandas-Funktionen read_excel und read_csv.

Wie benutzt man Für Excel-Dateien pd.read_excel (Dateipfad) Für die CSV-Datei pd.read_csv (Dateipfad) ist.

Dieses Mal werden wir Excel / CSV in DataFrame laden, also nennen wir es df und df2 und laden es.

Ich habe diesmal die 2020-Datumsdaten date_2020.xlsx und date_2020.csv in Google Colaboratory hochgeladen, sodass der Pfad nur anhand des Dateinamens gelesen werden kann.

Die oben erwähnte Methode von ①②③ wird etwas länger sein.


#Laden Sie die Excel / CSV-Datei in DataFrame

df = pd.read_excel("date_2020.xlsx")

df2 = pd.read_csv("date_2020.csv")

Versuchen Sie anzuzeigen, ob es tatsächlich mit head () gelesen wurde.

e? Sind Sie besorgt, wenn Sie es deswegen lesen könnten?

Wenn es keine Fehler gibt, können Sie es lesen, aber lassen Sie es uns für alle Fälle überprüfen.

Die ersten 5 Zeilen können mit dem definierten DataFrame.head () angezeigt werden.

#Erste Zeile anzeigen
df.head()

Ausgabeergebnis ↓

df.head.png

Es scheint, dass es fest gelesen wurde.

Referenz

Sie können auch Details und angewandte Verwendung lernen ↓

  1. CSV / TsV-Datei mit Pandas lesen (read_csv, read_table)
  2. Excel-Datei (xlsx, xls) mit Pandas (read_excel) lesen
  3. Lesen einer Excel-Datei mit Pandas read_excel

Recommended Posts

[Für Anfänger] Lesen Sie Excel / CSV-Dateien mit Google Colaboratory in DataFrame
Stilvolle Technik zum Einfügen von CSV-Daten in Excel mit Python
Behandeln Sie Excel-CSV-Dateien mit Python
INSERT in MySQL mit Python [Für Anfänger]
[Python] Bilder mit OpenCV lesen (für Anfänger)
So laden Sie Dateien in Google Drive mit Google Colaboratory
Legen Sie alle CSV-Dateien in einem beliebigen Verzeichnis in DataFrame ab
Lesen Sie Excel mit openpyxl
■ Kaggle-Übung für Anfänger - Einführung von Python - von Google Colaboratory
[Python] Die größten Schwächen und Nachteile von Google Colaboratory [Für Anfänger]
Lesen Sie CSV mit Python-Pandas
Lernen Sie Python mit Google Colaboratory
Probieren Sie OpenCV mit Google Colaboratory aus
So importieren Sie CSV- und TSV-Dateien mit Python in SQLite
[Für Anfänger] Skript innerhalb von 10 Zeilen (3. Datenleser / CSV-Konvertierung)
Erstellen Sie eine CP932-CSV-Datei für Excel mit Chalice und geben Sie sie zurück
Behandeln Sie CSV-Dateien mit Django (Django-Import-Export)
OpenCV-Funktionserkennung mit Google Colaboratory
100 Sprachverarbeitung klopfen 2020 "für Google Colaboratory"
Lesen Sie Dateien parallel zu Python
Excel, CSV Import / Export mit Django
Lesen Sie die CSV-Datei mit Python und konvertieren Sie sie unverändert in DataFrame
Fehler aufgrund von UnicodeDecodeError beim Lesen der CSV-Datei mit Python [Für Anfänger]