――Ich werde zusammenfassen, wie Pandas, die ich normalerweise verwende, für jeden Zweck als Memorandum verwendet werden.
# Extrahieren Sie Spalten aus dem Datenrahmen und wechseln Sie zu Serien
aaa = df['sts']
# Die erste Zeile wird als "erstes Mal" ausgegeben.
for index, item in enumerate(aaa):
if index < 1:
drucken ("erstes Mal")
else:
Drucken ("zweite und nachfolgende Zeiten")
# Definieren Sie die Spalten, die als Array abgerufen werden sollen
use_idx = ['aaa','bbb','ccc']
# Extrahieren Sie die definierten Spalten und erstellen Sie einen neuen Datenrahmen
df2 = df[ use_idx ]
# Konvertieren Sie das Datum in den Datum / Uhrzeit-Typ
data['date'] = pd.to_datetime(date['date'])
# Tag vom Datum extrahieren (SUN = 6, MON = 0)
date['day_of_week'] = date['date'].dt.dayofweek
data = [1,8,14,56]
# Benennen Sie die Spalte mit dem optionalen Namen
s = pd.Series(data, name=['day', 'hour', 'c1', 'c2'])
name = df.columns.values
df = df.drop('AAAA', axis = 1)
# Kombinieren Sie die Zeichenfolge mit dem vorhandenen Spaltennamen
newcol = []
for i in df.columns:
print(i + "_2day")
newcol.append(i + "_2day")
# Geben Sie den Spaltennamen erneut an
df.columns = newcol
# Sortierung
dfl = df.sort_values(by="A")
# Mehrere Sorten
dfl = df.sort_values(by=["A","B","C","D"])
# Nach Spalte verbinden
df_union = pd.concat( [df, df2], axis=1 )
# Mit der Linie verbinden
df_union = pd.concat( [df, df2], axis=0 )
* Fügen Sie die Option "sort = False" als Gegenmaßnahme gegen das Ändern der Spaltenreihenfolge hinzu.
# Innerer Join unter der Bedingung des Schlüssels
df = pd.merge(left, right, on='key')
# Linke äußere Verbindung unter der Bedingung des Schlüssels
df = pd.merge(left, right, on='key', how = 'left')
"""
Die Kombinationsmethode wird durch das Schlüsselwort how angegeben.
inner: Standard. Innere Verbindung. Lassen Sie nur die Schlüssel in beiden Daten.
links: Linke äußere Verbindung. Lassen Sie alle Schlüssel für die ersten Daten.
rechts: Rechte äußere Verbindung. Lassen Sie alle Schlüssel für die zweiten Daten.
Outer: Vollständige äußere Verknüpfung. Lassen Sie alle Schlüssel.
"""
# Setzen Sie den Index auf die Spalte xxxx
df.set_index('xxxx')
# Index zurücksetzen
# Die fortlaufende Nummer wird auf index gesetzt und der ursprüngliche Index wird zur Datenspalte hinzugefügt
df.reset_index('xxxx')
# Index zurücksetzen
# Der alte Index wird gelöscht und der neue Index gesetzt
df.reset_index(drop=True)
"""
df2 = df.reset_index(drop=True)
Beachten Sie, dass reset_index nur angezeigt wird, wenn Sie die obigen Schritte ausführen ()
"""
#Datenrahmen df und Serie df_Kombinieren Sie ser
#Serie ist zu_frame()Mit Datenrahmen konvertieren mit
df2 = pd.concat( [ df, df_ser.to_frame() ], axis=1 )
to_pydatetime()
hoge = pd.DataFrame(hoge)
#aufsteigende Reihenfolge
hoge = hoge.sort_index()
#absteigende Reihenfolge
hoge = hoge.sort_index(ascending=False)
#Ein Parameter
sql "select * from aaa where opstime >= %s;"
df = pd.read_sql(sql, con=conn, params=("2020-02-13"))
#Zwei Parameter
sql "select * from aaa where opstime >= %s and opstime <= %s;"
df = pd.read_sql(sql, con=conn, params=("2020-02-13","2020-02-15"))
#Erstellen Sie einen Datenrahmen mit 3 Zeilen und 3 Spalten und dem Wert NULL
df = pd.DataFrame(index=range(3), columns=['a', 'b' , 'c'])
Recommended Posts