[PYTHON] [Pandas] Trouvez le quadrant et détectez la valeur aberrante

Notez que j'ai parfois voulu utiliser des quadrants pour détecter les valeurs aberrantes

Obtenez le quadrant des séries

Q1 = series.quantile(.25)
Q3 = series.quantile(.75)

Ou

Q1 = series.describe()['25%']
Q3 = series.describe()['75%']

Détection des valeurs aberrantes à l'aide de quadrants

#Extraire uniquement les données dont la valeur est dans le désordre dans la colonne A
IQR = Q3 - Q1
threshold = Q3 + 1.5 * IQR

df_outlier = df[df['A'].apply(lambda x:x > threshold)]

Au contraire, si vous voulez les données qui correspondent, vous pouvez prendre un déni logique comme df [~ df ...] C'est bien si vous changez la direction de l'inégalité.

Résumé

Il semble y avoir un gars qui peut sortir du prix d'un seul coup sans faire ça ...

Les débutants en statistique bricolent des données à l'aide de pandas. Je vous serais reconnaissant de bien vouloir me dire s’il existe un bon moyen.

référence

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.quantile.html

Reportez-vous à ce document pour les quadrants http://www.contents-station.net/gacco/Data_Analysis_Innovation/Week03/3-4.pdf

Recommended Posts

[Pandas] Trouvez le quadrant et détectez la valeur aberrante
index et réindexation des pandas
Remplissez les valeurs aberrantes avec NaN en fonction des quadrants dans Pandas
pandas rééchantillonner et rouler
Moyenne et liste des pandas
Ajouts clés aux pandas 1.1.0 et 1.0.0