[PYTHON] Mémorandum de méthodes utiles pour organiser les colonnes dans DataFrame

Méthodes que j'ai trouvées utiles après avoir lu le noyau de kaggle

Récemment, j'ai commencé à travailler sur kaggle, et il y avait une méthode pour simplifier le traitement des colonnes que j'avais essayé de faire à la main, donc je vais la résumer sous forme de mémorandum. Seule l'utilisation utilisée dans le concours que nous faisons est brièvement résumée, veuillez donc passer à l'article auquel vous avez fait référence pour une utilisation détaillée.

Lorsque vous souhaitez afficher la valeur souhaitée

Dans le concours que je fais cette fois, les données données existaient sous forme de train_data et train_label, et il y avait des éléments en double dans les deux csv. En fin de compte, ces deux données doivent être combinées et fournies au modèle, de sorte que le contenu dupliqué doit être éclairci avant d'être combiné.

Je souhaite prendre plusieurs cibles et effectuer le même traitement, tel que le regroupement par colonne

--groupby ([nom de la première colonne que vous voulez grouper'`, nom de la deuxième colonne que vous souhaitez grouper']) .Processus que vous souhaitez appliquer `.mean () ou son côté Calculez le prix moyen du groupe B qui appartient au groupe A. Utilisez-le comme ça. Il n'y aura pas de duplication du nom de colonne spécifié.

--agg ({ Nom de la colonne à traiter'`: [ Ce que vous voulez traiter 1 (min, max, etc.) '' , Ce que vous voulez traiter 2`]}) Pratique à utiliser après groupby

Articles référencés

note.nkmk.me CUBE SUGAR CONTAINER

Recommended Posts

Mémorandum de méthodes utiles pour organiser les colonnes dans DataFrame
Résumé des méthodes fréquemment utilisées chez les pandas
Résumé des méthodes pour déterminer automatiquement les seuils
Résumé de diverses instructions for en Python
Résumé des méthodes intégrées, etc. de la liste Python
Résumé des techniques utiles de Scrapy en Python
Un mémorandum de méthode souvent utilisé dans l'apprentissage automatique utilisant scikit-learn (pour les débutants)
Divulgation complète des méthodes utilisées dans l'apprentissage automatique
Recherchez vous-même à partir des méthodes du modèle de Django
Histoire de base de l'héritage en Python (pour les débutants)
Selenium-Screenshot est utile pour les captures d'écran de pages Web dans Python3, Selenium et Google Chrome