[PYTHON] 8rep --Pandas String Löschcode

Löschen Sie unnötige Zeichen mit Pandas

from sqlalchemy import create_engine
import pandas as pd

fname="{Pth}.csv"
reader = pd.read_csv(fname, chunksize=1000, sep='\t',low_memory = False)
df_all = reader.get_chunk() #Chunk zum Datenrahmen

#Beurteilung der fehlenden Wertigkeit der Zeileneinheit
df_all.isnull().any(axis=1)

#Einige Zeilen, die NaN sind, wurden gelöscht
df_all=df_all.dropna(how="any")

#Zeichenspezifikation löschen
replace_str={
    '@': '',
    '\+': '',
    '\$': '',
    '\|': '',
    '\<': '',
    '\>': '',
    '\-': '',
    '\;': ''
}

#Löschen Sie eine bestimmte Zeichenfolge
df_all["comment"]=df_all["comment"].replace(replace_str, regex=True, encoding='utf-8')

print(df_all)
df_all.to_csv('{Pth}/replace.csv', sep='\t', index=False)

Recommended Posts

8rep --Pandas String Löschcode
9rep - Pandas MySQL
[Pandas] Doppelte Löschung bei gleichzeitiger Ergänzung von Fehlern
Erstellen Sie einen Pandas-Datenrahmen aus einer Zeichenfolge.
Pandas Memo ~ Keine, np.nan, über leere Zeichen ~