[PYTHON] [Tipps] Meine Pandas-Notiz

Einführung

Ich werde eine Nachricht hinterlassen, weil ich die Operation von Pandas bald vergessen werde. Bitte beachten Sie, dass die Beschreibung eine Verzerrung enthält, da es sich um einen Stil handelt, der denjenigen, nach denen ich gesucht habe, immer mehr hinzufügt.

Es wird davon ausgegangen, dass es wie unten gezeigt importiert wurde.

import pandas as pd

Anzeigesystem

Vermeiden Sie Spaltenauslassungen im Jupyter-Notizbuch

Setzen Sie den Wert von max_columns auf einen großen Wert

pd.set_option('display.max_columns', 100)

Dateivorgang im Zusammenhang

CSV importieren


data = pd.read_csv('filename.csv', parse_dates=['timestamp'])

Kann mit parse_dates als datetime-Typ gelesen werden

Export nach CSV


data = pd.to_csv('filename.csv', index=False, sep='\t')
# index:Vorhandensein / Nichtvorhandensein der Anzeige
# sep:Separator-Spezifikation

Werte manipulieren

Betrieb mit derselben Seriennummer, solange derselbe Wert fortgesetzt wird

df = pd.DataFrame(['a', 'a', 'b', 'b', 'c','c','c', 'd', 'e'])
df['idx'],_ = pd.factorize(df[0])
print(df)
   0  idx
0  a    0
1  a    0
2  b    1
3  b    1
4  c    2
5  c    2
6  c    2
7  d    3
8  e    4

Datenzugriff mit mehreren Indizes

diff_df.loc['A', 'B'] # A=level1 B=level2

Zwischen Tabellen verbinden

Geben Sie den Schlüssel mit dem Argument on an. Wählen Sie die Verbindungsmethode mit wie.

pd.merge(a, b, on=['first_key', 'second_key'], how='left')

Recommended Posts

[Tipps] Meine Pandas-Notiz
Meine Pandas (Python)
[Pandas] GroupBy-Tipps
[Anmerkung] Pandas entstapeln
Meine Pandas zu spät?
Python-Tipps (mein Memo)
Datenverarbeitungstipps mit Pandas
Memo
Pandas / DataFrame-Tipps für den praktischen Gebrauch
Pandas
Memo
Memo
[Mein Memo] Djangos benutzerdefiniertes Benutzermodell
Tipps zum Zeichnen mehrerer Linien mit Pandas