Hallo, das ist CE Sabo.
Dies ist Qiitas erster Beitrag.
Ich möchte Daten mit Python analysieren.
In einem solchen Fall ist das erste, woran Anfänger festhalten, das "Lesen von Daten". (Ich bin auch zuerst gestolpert.)
Was kann ich tun, wenn es sich bei den zu analysierenden Daten um Tabellendaten handelt (Excel-Daten, CSV-Daten usw.)?
Dieses Mal werde ich kurz erklären, wie Sie Excel-Dateien (.xlsx) und CSV-Dateien (.csv) lesen, die Sie am häufigsten verwenden.
Der echte Code ist nur ** 2 Zeilen **. Lassen Sie es uns schnell beenden und mit der Welt der Datenanalyse fortfahren.
・ Google Colaboratory
Wir verwenden Google Colaboratory, was jeder mit einem Google-Konto tun kann.
Python verfügt über viele Bibliotheken, mit denen Sie Ihre Daten analysieren können.
Es ist relativ einfach zu implementieren.
Diesmal sind nur "Pandas" in Ordnung.
#Pandas importieren
import pandas as pd
Sie können eine beliebige Zeichenfolge verwenden, indem Sie "as ~" auf die importierte setzen.
Im Allgemeinen wird Pandas als pd abgekürzt.
Laden Sie die Datei, die Sie lesen möchten, in Google Colaboratory hoch. andere ① Wie schreibe ich Code? ② Lesen einer lokalen Datei ③ Es scheint, dass es eine Methode zum Mounten und Laden von Google Drive gibt (ich persönlich empfehle sie), aber dieses Mal werde ich die einfachste Methode vorstellen.
Verfahren
① Klicken Sie ganz links auf das Dateisymbol ② Klicken Sie auf Hochladen (roter Rahmen im Bild) und wählen Sie die Datei aus, die Sie lesen möchten, oder ziehen Sie sie per Drag & Drop.
Wenn Sie nicht viele Daten haben, werden diese bald enden und Sie können loslegen.
Lass es uns jetzt machen. Der Code ist eine Zeile.
Verwenden Sie die Pandas-Funktionen read_excel und read_csv.
Wie benutzt man Für Excel-Dateien pd.read_excel (Dateipfad) Für die CSV-Datei pd.read_csv (Dateipfad) ist.
Dieses Mal werden wir Excel / CSV in DataFrame laden, also nennen wir es df und df2 und laden es.
Ich habe diesmal die 2020-Datumsdaten date_2020.xlsx und date_2020.csv in Google Colaboratory hochgeladen, sodass der Pfad nur anhand des Dateinamens gelesen werden kann.
Die oben erwähnte Methode von ①②③ wird etwas länger sein.
#Laden Sie die Excel / CSV-Datei in DataFrame
df = pd.read_excel("date_2020.xlsx")
df2 = pd.read_csv("date_2020.csv")
e? Sind Sie besorgt, wenn Sie es deswegen lesen könnten?
Wenn es keine Fehler gibt, können Sie es lesen, aber lassen Sie es uns für alle Fälle überprüfen.
Die ersten 5 Zeilen können mit dem definierten DataFrame.head () angezeigt werden.
#Erste Zeile anzeigen
df.head()
Ausgabeergebnis ↓
Es scheint, dass es fest gelesen wurde.
Sie können auch Details und angewandte Verwendung lernen ↓
Recommended Posts