Beachten Sie, dass ich manchmal Quadranten verwenden wollte, um Ausreißer zu erkennen
Q1 = series.quantile(.25)
Q3 = series.quantile(.75)
Oder
Q1 = series.describe()['25%']
Q3 = series.describe()['75%']
#Extrahieren Sie nur die Daten, deren Wert in Spalte A nicht in Ordnung ist
IQR = Q3 - Q1
threshold = Q3 + 1.5 * IQR
df_outlier = df[df['A'].apply(lambda x:x > threshold)]
Im Gegenteil, wenn Sie die Daten wollen, die passen, können Sie eine logische Ablehnung wie df [~ df ...] nehmen. Es ist gut, wenn Sie die Richtung der Ungleichung ändern.
Es scheint einen Mann zu geben, der mit einem Schuss aus dem Preis herauskommt, ohne dies zu tun ...
Statistik-Anfänger basteln mit Pandas an Daten. Ich wäre Ihnen dankbar, wenn Sie mir sagen könnten, ob es einen guten Weg gibt.
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.quantile.html
In diesem Dokument finden Sie Quadranten http://www.contents-station.net/gacco/Data_Analysis_Innovation/Week03/3-4.pdf