Notieren Sie sich die Vorgänge, die ich beim Schreiben von Python als R-Benutzer häufig vergesse. Selbst wenn ich jedes Mal nach "R% in% in Python" suchte, konnte ich die gewünschten Informationen nicht sofort finden.
Datenrahmen: Iris Spezifischer Spaltenname: Spezies Mehrere Elemente: cond (nur "setosa" oder "virginica" extrahieren)
Operationen, die mit dem Operator% in% in R geschrieben werden können, sind
### R ###
library(dplyr)
cond <- c("setosa", "virginica")
df <- iris %>% dplyr::filter(., Species %in% cond)
Mit Pandas können Sie mit .isin () schreiben.
### python ###
import pandas as pd
from sklearn import datasets
###Vorbereitung des Iris-Datensatzes
iris_sk = datasets.load_iris()
iris = pd.DataFrame(iris_sk.data, columns=iris_sk.feature_names)
iris['Species'] = iris_sk.target_names[iris_sk.target]
cond = ["setosa", "virginica"]
df = iris[iris["Species"].isin(cond)]
Wenn Sie übereinstimmende Zeilen ausschließen möchten, verwenden Sie !
Und ~
.
### R ###
df2 <- iris %>% dplyr::filter(., !Species %in% cond)
### Python ###
df2 = iris[~iris["Species"].isin(cond)]
Recommended Posts