[PYTHON] [Pandas] Finde den Quadranten und erkenne den Ausreißer

Beachten Sie, dass ich manchmal Quadranten verwenden wollte, um Ausreißer zu erkennen

Holen Sie sich den Quadranten der Serie

Q1 = series.quantile(.25)
Q3 = series.quantile(.75)

Oder

Q1 = series.describe()['25%']
Q3 = series.describe()['75%']

Erkennung von Ausreißern anhand von Quadranten

#Extrahieren Sie nur die Daten, deren Wert in Spalte A nicht in Ordnung ist
IQR = Q3 - Q1
threshold = Q3 + 1.5 * IQR

df_outlier = df[df['A'].apply(lambda x:x > threshold)]

Im Gegenteil, wenn Sie die Daten wollen, die passen, können Sie eine logische Ablehnung wie df [~ df ...] nehmen. Es ist gut, wenn Sie die Richtung der Ungleichung ändern.

Zusammenfassung

Es scheint einen Mann zu geben, der mit einem Schuss aus dem Preis herauskommt, ohne dies zu tun ...

Statistik-Anfänger basteln mit Pandas an Daten. Ich wäre Ihnen dankbar, wenn Sie mir sagen könnten, ob es einen guten Weg gibt.

Referenz

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.quantile.html

In diesem Dokument finden Sie Quadranten http://www.contents-station.net/gacco/Data_Analysis_Innovation/Week03/3-4.pdf

Recommended Posts

[Pandas] Finde den Quadranten und erkenne den Ausreißer
Pandas Index und Reindex
Füllen Sie Ausreißer mit NaN basierend auf Quadranten in Pandas
Pandas resample und rollen
Pandas Mittelwertbildung und Auflistung
Wichtige Ergänzungen zu den Pandas 1.1.0 und 1.0.0