Dieser Artikel ist der dritte Tag von Furukawa Lab Advent_calendar. Dieser Artikel wurde von einem Studenten des Furukawa Lab als Teil seines Lernens geschrieben. Der Inhalt kann mehrdeutig sein oder der Ausdruck kann leicht abweichen.
In diesem Artikel werde ich die Befehle zusammenfassen, die nützlich waren, als ich Pandas für die Datenformatierung verwendete. Es wird von Anfängern des Programms gesendet, daher wäre es hilfreich, wenn Sie es mit warmen Augen sehen könnten ^^
python
import pandas as pd
df=pd.read_csv('Dateipfad')
Grundsätzlich lesen Sie CSV damit Eigentlich sollte es Situationen geben, in denen Sie mehrere Dateien lesen müssen, daher wird die in solchen Fällen verwendete Methode unten gezeigt.
python
import glob
#Gleiche Hierarchie
file_pass = glob.glob('*.csv')
#Sie können auch die Hierarchie angeben
file_pass = glob.glob('○○/○○/*.csv')
Dadurch wird der Pfad der CSV-Datei in der angegebenen Hierarchie verwendet. In einem Verzeichnis namens ○○ / ○○ data_1.csv , data_1.txt , data_2.csv , data_2.txt Wenn vorhanden
python
[○○/○○/data_1.csv,○○/○○/data_2.csv]
Ist zurück gekommen. Der Rest ist eine for-Anweisung
python
counter = -1
for i in file_pass
df = pd.read_csv(i)
counter = counter + 1
#Fügen Sie eine Operation hinzu
#Wenn Sie erneut speichern und ohne Index speichern möchten, indexieren Sie=Fügen Sie einfach False hinzu
df.to_csv('new_name_{0}.csv'.format(counter))
Sie können die Daten sofort formatieren (to_csv, counter usw.).
os Dies ist praktisch bei der Benennung
python
import os
# ()Bring den Weg hinein"../"Und beziehen Sie sich auf die Stelle, an der dieser Code geschrieben ist
path = os.path.abspath(filepath)
#Bringen Sie den Dateinamen aus dem Pfad
#Es war bequem mit glob zu verwenden
name = os.path.basename(filepath)
#Manchmal brauche ich nicht einmal eine Erweiterung.Teilen und teilen mit
name = name.split(".")
name = name[0]
Es wurde gesagt, dass es einfach ist, die CSV-Datei auf einmal zu lesen und den gleichen Vorgang hinzuzufügen, wenn Glob und OS verwendet werden. Ich dachte, als ich es selbst gemacht habe, aber der Betrieb von Pandas selbst kommt heraus, wenn ich es wie "pandas ○○" google, aber ich kann nicht beurteilen, ob es eine Pandas-Funktion oder eine Python-Bibliothek ist und es gut funktioniert Es gab viele Situationen, in denen ich nicht suchen konnte. Ich möchte wissen, was ich tun kann und die Fähigkeit entwickeln, richtig zu googeln ╭ (・ ㅂ ・) و
Recommended Posts