[PYTHON] Sammlung von Numpy, Pandas Tipps, die häufig auf dem Feld verwendet werden

import numpy as np
import pandas as pd
import sys
# encoding
print(sys.getdefaultencoding())

Datenerfassung

# numpy
x = np.array([[1,2,3],[4,5,6]],dtype=np.float64)
#Text lesen
y = np.loadtxt('text1',delimiter=',',skiprows=0,comments='#')

Scheibe

pandas.DataFrame
df=pd.read_csv('stock.csv',encoding='Shift_jis',names=('index','dekidaka','owarine'))
df.head() #Erste 5 Zeilen
pd.DataFrame({'a':[1,2,3],'b':[4,5,6]}) 
df.loc[:,['index','owaine']]
df.loc[100:115,['index','dekidaka']]
df.iloc[1:22,1:3] # 1 ~ 3 index,dekidaka,owarine
df.iloc[:,[0,2]] # 0 and 2 index,owarine
df.iloc[::2]  #Sogar
df.iloc[1::2]  #Seltsam
df['index'] < '1900' # False or True
df[(df['index'] == '1900')] # 171.0  1883,     49800     261

Datenmanagement

#verschmelzen
samp1 = pd.read_csv('sample1.csv',encoding='Shift_jis')
samp2 = pd.read_csv('sample2.csv',encoding='Shift_jis')
samp3 = pd.read_csv('sample3.csv',encoding='Shift_jis')
# concat(Vertikale Verbindung)
conc=pd.concat([samp1,samp2],ignore_index=True)
# merge(Horizontale Verbindung)
merg=pd.merge(conc,samp3[["label1","label2"]],on="label1",how="left") # 
#Datenextraktion
merg["label2_y"] # only label2_y 1000 ~ 1003
merg[["label2_x","label2_y"]].iloc[:,0:2] # 
####################
#Zusammengefasste Statistiken
merg["label1"].iloc[1:5].describe()
#Zusatz
merg["label1"] + merg["label2_y"] #Zusatz
#gesamt
merg["label1"].sum()
#Fehlender Wert
merg.isnull()
#Fehlende Information
merg.isnull().sum()
#Maximalwert+Mindestwert
print(merg.max() + merg.min())
#Datentypbestätigung
merg.dtype
#Typkonvertierung float64 ⇒ numerisch
merg["label1"]=pd.to_numeric(merg["label1"])
# float64 ⇒ datetime 
merg["label1"].dt.strftime("%Y%m")
# grouping
merg.groupby(["label1"]).sum()["label2_y"]

Datenkorrektur

#Einzigartige Nummer
print(len(pd.unique(merg.label3))) #18 Stück, nur ein Leerzeichen am linken Ende, gelten als unterschiedlich
#Richten Sie Kleinbuchstaben auf Großbuchstaben aus
merg["label3"]=merg["label3"].str.upper() 
print(len(pd.unique(merg.label3))) #17
merg["label3"]=merg["label3"].str.replace(" ","") 
print(len(pd.unique(merg.label3))) #16
#Sortieren
merg.sort_values(by=["label1"],ascending=True)

Recommended Posts

Sammlung von Numpy, Pandas Tipps, die häufig auf dem Feld verwendet werden
Python scikit-learn Eine Sammlung von Tipps für Vorhersagemodelle, die häufig im Feld verwendet werden
Python scikit-learn Eine Sammlung von Tipps für Vorhersagemodelle, die häufig im Feld verwendet werden
Eine Code-Sammlung, die häufig in persönlichem Python verwendet wird
Zusammenfassung der häufig verwendeten Methoden bei Pandas
Ein Timer (Ticker), der im Feld verwendet werden kann (kann überall verwendet werden)
Persönliche Notizen zu Pandas-bezogenen Vorgängen, die in der Praxis verwendet werden können
Eine Sammlung häufig verwendeter Befehle in der Serververwaltung
Goroutine (parallele Steuerung), die im Feld eingesetzt werden kann
Ich habe versucht, den in Pandas häufig verwendeten Code zusammenzufassen
Goroutine, die im Feld verwendet werden kann (errgroup.Group Edition)
[Django] Eine Sammlung von Skripten, die für die Entwicklung geeignet sind
Eine Sammlung von Methoden, die beim Aggregieren von Daten mit Pandas verwendet werden
Zusammenfassung der häufig verwendeten Grammatik bei Pandas
pandas Ruft den Namen einer Spalte ab, die ein bestimmtes Zeichen enthält
Eine Funktion, die die Verarbeitungszeit einer Methode in Python misst
Importieren Sie ein Modul, das häufig beim Starten des Python-Interpreters verwendet wird
Ich habe versucht, die Methoden zusammenzufassen, die häufig bei der grundlegenden Algo-Implementierung in Quantx Factory verwendet werden
Ich habe einen Fehler beim Abrufen der Hierarchie mit MultiIndex von Pandas gemacht
Verarbeiten von Memos, die häufig bei Pandas (Anfängern) verwendet werden
[Vollständiges Memorandum] Eine Sammlung von Codes, die ich oft benutze, aber nicht erinnern kann
Sprechen Sie über die Funktionen, für die Pandas und ich im Projekt verantwortlich waren
Suchen Sie den Index der Elemente, die den Bedingungen im Pandas-Datenrahmen / der Pandas-Serie entsprechen
Erstellen Sie einen BOT, der die Anzahl der infizierten Personen in der neuen Corona anzeigt
Ein Memorandum of Method, das häufig bei der Analyse von Daten mit Pandas verwendet wird (für Anfänger)
Ein Memorandum über Methoden, die häufig beim maschinellen Lernen mit Scikit-Learn (für Anfänger) verwendet werden.
Holen Sie sich den Aufrufer einer Funktion in Python
Zusammenfassung dessen, was bei 100 Pandas-Schlägen verwendet wurde (# 1 ~ # 32)
Kopieren Sie die Liste in Python
Finden Sie die Anzahl der Tage in einem Monat
Korrigieren Sie die Argumente der in map verwendeten Funktion
Ausgabe in Form eines Python-Arrays
Zu dem Problem, dass der Inhalt von Python print in Docker-Protokollen nicht sichtbar ist
[Python] Ein Programm, das die kürzeste Anzahl von Schritten in einem Spiel findet, das Wolken überquert
Ein Hinweis, der einen Job in Python implementiert, der eine GCS-Datei in BigQuery lädt
Eine Lösung für das Problem, dass Dateien mit [und] nicht in glob.glob () aufgeführt sind
Eine Geschichte, die den Aufwand für Betrieb / Wartung reduziert
[Python] Ein Programm, das die Anzahl der Täler zählt
Wird ab der Einführung von Node.js in der WSL-Umgebung verwendet
Erstellen Sie einen BOT, der die Discord-URL verkürzt
Notieren Sie sich die Liste der grundlegenden Verwendungszwecke von Pandas
#Eine Funktion, die den Zeichencode einer Zeichenfolge zurückgibt
Shell-Programm, das in Vielfachen von 3 aho wird
Erzeugen Sie diese Form des Bodens einer Haustierflasche
Super einfach: Eine Sammlung von Shells, die Daten ausgeben
Eine Geschichte, die die Lieferung von Nico Nama analysierte.
Ein Memorandum über die Umsetzung von Empfehlungen in Python
[Python] Ein Programm, das die Positionen von Kängurus vergleicht.
Ein Server, der mit Flasche.py und OpenCV die Anzahl der Personen vor der Kamera zurückgibt
Erstellen Sie eine Matrix mit numpy nur für Spalten, deren Gesamtwert der Elemente der Spalten der Matrix das oberste X ist
Kann mit AtCoder verwendet werden! Eine Sammlung von Techniken zum Zeichnen von Kurzcode in Python!
[Python] Programmieren, um die Nummer von a in einer Zeichenfolge zu finden, die eine bestimmte Anzahl von Malen wiederholt.
[Hinweis] Ein Shell-Skript, das die CPU-Auslastung eines bestimmten Prozesses in einer while-Schleife überprüft.
[Django] Feldnamen, die für das Benutzermodell, die Benutzerregistrierung und die Anmeldemethoden verwendet werden können
Financial Engineering bestätigte die Behauptung, dass "Leveraged Investment Trusts in einem volatilen Markt nachteilig sind".
Ein Werkzeug, das die Gacha von Soshage automatisch dreht
Hinweis zum Standardverhalten von collate_fn in PyTorch