[PYTHON] Zusammenfassung der Dinge, die bei der Verwendung von Pandas praktisch waren

Dieser Artikel ist der dritte Tag von Furukawa Lab Advent_calendar. Dieser Artikel wurde von einem Studenten des Furukawa Lab als Teil seines Lernens geschrieben. Der Inhalt kann mehrdeutig sein oder der Ausdruck kann leicht abweichen.

Einführung

In diesem Artikel werde ich die Befehle zusammenfassen, die nützlich waren, als ich Pandas für die Datenformatierung verwendete. Es wird von Anfängern des Programms gesendet, daher wäre es hilfreich, wenn Sie es mit warmen Augen sehen könnten ^^

Text

python


import pandas as pd

df=pd.read_csv('Dateipfad')

Grundsätzlich lesen Sie CSV damit Eigentlich sollte es Situationen geben, in denen Sie mehrere Dateien lesen müssen, daher wird die in solchen Fällen verwendete Methode unten gezeigt.

Wenn Sie mehrere Dateien gleichzeitig lesen möchten

python


import glob

#Gleiche Hierarchie
file_pass = glob.glob('*.csv')

#Sie können auch die Hierarchie angeben
file_pass = glob.glob('○○/○○/*.csv')

Dadurch wird der Pfad der CSV-Datei in der angegebenen Hierarchie verwendet. In einem Verzeichnis namens ○○ / ○○ data_1.csv , data_1.txt , data_2.csv , data_2.txt Wenn vorhanden

python


[○○/○○/data_1.csv,○○/○○/data_2.csv]

Ist zurück gekommen. Der Rest ist eine for-Anweisung

python


counter = -1
for i in file_pass
    df = pd.read_csv(i)
    counter = counter + 1
    #Fügen Sie eine Operation hinzu
    #Wenn Sie erneut speichern und ohne Index speichern möchten, indexieren Sie=Fügen Sie einfach False hinzu
    df.to_csv('new_name_{0}.csv'.format(counter))

Sie können die Daten sofort formatieren (to_csv, counter usw.).

os Dies ist praktisch bei der Benennung

python


import os

# ()Bring den Weg hinein"../"Und beziehen Sie sich auf die Stelle, an der dieser Code geschrieben ist
path = os.path.abspath(filepath)

#Bringen Sie den Dateinamen aus dem Pfad
#Es war bequem mit glob zu verwenden
name = os.path.basename(filepath)

#Manchmal brauche ich nicht einmal eine Erweiterung.Teilen und teilen mit
name = name.split(".")
name = name[0]

Zusammenfassung

Es wurde gesagt, dass es einfach ist, die CSV-Datei auf einmal zu lesen und den gleichen Vorgang hinzuzufügen, wenn Glob und OS verwendet werden. Ich dachte, als ich es selbst gemacht habe, aber der Betrieb von Pandas selbst kommt heraus, wenn ich es wie "pandas ○○" google, aber ich kann nicht beurteilen, ob es eine Pandas-Funktion oder eine Python-Bibliothek ist und es gut funktioniert Es gab viele Situationen, in denen ich nicht suchen konnte. Ich möchte wissen, was ich tun kann und die Fähigkeit entwickeln, richtig zu googeln ╭ (・ ㅂ ・) و

Recommended Posts

Zusammenfassung der Dinge, die bei der Verwendung von Pandas praktisch waren
Zusammenfassung bei Verwendung von Fabric
Zusammenfassung der beim Extrahieren von Daten verwendeten Pandas-Methoden [Python]
[Python] Zusammenfassung der Methode zur Tabellenerstellung mit DataFrame (Pandas)
Bequeme Nutzungsübersicht von Flask
Zusammenfassung der grundlegenden Verwendung von Pandas
Zusammenfassung der Dinge, die installiert werden müssen, um die tf-Pose-Schätzung auszuführen
Vorsichtsmaßnahmen bei der Verwendung von Codecs und Pandas
Hier finden Sie eine Zusammenfassung der Dinge, die beim Umgang mit komplexen Zahlen in Python hilfreich sein können
Dinge, die beim Erstellen eines Empfehlungssystems mit Item2Vec zu beachten sind
[Python] Zusammenfassung der Verwendung von Pandas
Zusammenfassung der häufig verwendeten Methoden bei Pandas
Vorsichtsmaßnahmen bei Verwendung der for-Anweisung in Pandas
Snippet-Zusammenfassung bei der Entwicklung mit Go
Sprechen Sie über die Funktionen, für die Pandas und ich im Projekt verantwortlich waren
Zusammenfassung der Scikit-Learn-Datenquellen, die beim Schreiben von Analyseartikeln verwendet werden können
Zusammenfassung der Linux-Befehlstechniken, die ich als junger Ingenieur kannte
Zusammenfassung von Beispielen, die nicht rückwärts pyTorch sein können
Zusammenfassung dessen, was bei 100 Pandas-Schlägen verwendet wurde (# 1 ~ # 32)
[Pandas] Grundlagen der Verarbeitung von Datumsdaten mit dt
Zeichenkodierung bei Verwendung des CSV-Moduls von Python 2.7.3
100 Sprachverarbeitung Knock-32 (mit Pandas): Prototyp des Verbs
Dokumentzusammenfassung bei Verwendung von Cloud Firestore aus Java
Zusammenfassung der Fehlerbehandlungsmethoden bei der Installation von TensorFlow (2)
Zusammenfassung der Excel-Operationen mit OpenPyXL in Python
Zusammenfassung der statistischen Datenanalysemethoden mit Python, die im Geschäftsleben verwendet werden können