[Python] Extrait les blocs de données de Pandas qui ne correspondent pas à une colonne spécifique avec d'autres blocs de données

Écrire cela

C'est comme ça si vous écrivez d'abord la conclusion.

df3 = df1[~df1['row1'].isin(df2['row2'])]

Je veux faire quelque chose comme ça

À partir d'une trame de données df1 La colonne'row1 'de la trame de données et Comparer la colonne 'Row2' de la trame de données df2 à comparer Je veux extraire une ligne de df1 qui a row1 qui n'existe pas dans row2.

C'est comme ça quand il est écrit en SQL.

SELECT * FROM df1
WHER df1.row1 NOT IN (SELECT row2 FROM df2)

Données de df1

color row1
red eagle
blue shark
yellow lion
green elephant
white tiger
black world

données df2

name row2
Sela shark
Leo lion
Tusk elephant
Amu tiger

Données que vous souhaitez récupérer à partir de df1

color row1
red eagle
black world

la mise en oeuvre

Zyuohger.py


import pandas as pd
df1 = pd.DataFrame({
        'color':['red',  'blue', 'yellow','green',   'white','black',],
        'row1' :['eagle','shark','lion',  'elephant','tiger','world',],
    })
df2 = pd.DataFrame({
        'name':['Sela', 'Leo', 'Tusk',    'Amu',],
        'row2':['shark','lion','elephant','tiger',],
    })

df3 = df1[~df1['row1'].isin(df2['row2'])]

print df3

résultat

Une fois exécuté, ce sera comme suit.

$ python Zyuohger.py
   color   row1
0    red  eagle
5  black  world

Recommended Posts

[Python] Extrait les blocs de données de Pandas qui ne correspondent pas à une colonne spécifique avec d'autres blocs de données
pandas Récupère le nom d'une colonne contenant un caractère spécifique
Ne changez pas l'ordre des colonnes lors de la concaténation des trames de données pandas.
Conseils: [Python] Extraire uniquement les lignes qui ne contiennent pas de chaîne spécifique
Un serveur qui fait écho aux données POSTées avec flask / python
Python2 / numpy> Remplacer uniquement une colonne spécifique d'un fichier par les données de colonne d'un autre fichier> numpy.c_
J'ai créé une fonction pour récupérer les données de la colonne de base de données par colonne en utilisant sql avec sqlite3 de python [sqlite3, sql, pandas]
Détecter les objets d'une couleur et d'une taille spécifiques avec Python
Une collection de méthodes utilisées lors de l'agrégation de données avec des pandas
Un ensemble de fichiers de script qui font wordcloud avec Python3
L'histoire de la création d'un Bot qui affiche les membres actifs dans un canal spécifique de Slack avec Python
Un one-liner Python qui imprime json json. N'échappez pas au japonais.
[Python] Comment forcer une méthode d'une sous-classe à effectuer un processus spécifique
L'histoire de la création d'un module qui ignore le courrier avec python
Introduction de "scikit-mobility", une bibliothèque qui vous permet d'analyser facilement les données de flux humain avec Python (Partie 1)
Résumé du livre électronique Python utile pour l'analyse de données gratuite
Lecture de code de faker, une bibliothèque qui génère des données de test en Python
Recommandation d'Altair! Visualisation des données avec Python
Faisons la manipulation des données MySQL avec Python
Un monde typé qui commence par Python
Exemple de traitement efficace des données avec PANDAS
Analyse des données de pratique Python Résumé de l'apprentissage que j'ai atteint environ 10 avec 100 coups
Autour de l'authentification de PyDrive2, un package pour faire fonctionner Google Drive avec Python
Installez séparément une version de Python qui n'est pas préinstallée sur votre Mac
Extraire les périodes qui correspondent à un modèle spécifique des données qualitatives de séries chronologiques de pandas
Un mémorandum de méthode souvent utilisé lors de l'analyse de données avec des pandas (pour les débutants)
[Introduction à Python] Comment obtenir l'index des données avec l'instruction for
[AtCoder] Résoudre un problème de ABC101 ~ 169 avec Python
Créez des données de test comme ça avec Python (partie 1)
Fonctionnement automatique de Chrome avec Python + Sélénium + pandas
Créer une page qui se charge indéfiniment avec python
Résolvez A ~ D du codeur yuki 247 avec python
Une histoire sur la gestion des données binaires en Python
Folium: Visualisez les données sur une carte avec Python
Transformez les données de vacances en une trame de données avec les pandas
Extraire des données d'une page Web avec Python
[Python Data Frame] Lorsque la valeur est vide, remplissez-la avec la valeur d'une autre colonne.
Obtenez une grande quantité de données Twitter de Starba avec python et essayez l'analyse de données Partie 1
Prédire le temps objectif d'un marathon complet avec l'apprentissage automatique-③: j'ai essayé de visualiser les données avec Python-
Consolider un grand nombre de fichiers CSV dans des dossiers avec python (données sans en-tête)
Programme qui résume les données csv de l’historique des transactions de l’action SBI Securities [Python3]
Lors de la lecture d'un fichier csv avec read_csv de pandas, la première colonne devient index
J'ai essayé de créer un cadre de données pandas en grattant les informations de rappel d'aliments avec Python