[PYTHON] 8rep --Code de suppression de chaîne Pandas
Supprimer les caractères inutiles avec Pandas
from sqlalchemy import create_engine
import pandas as pd
fname="{Pth}.csv"
reader = pd.read_csv(fname, chunksize=1000, sep='\t',low_memory = False)
df_all = reader.get_chunk() #bloc en dataframe
#Unité de ligne sans jugement de valeur
df_all.isnull().any(axis=1)
#Suppression de certaines lignes qui sont NaN
df_all=df_all.dropna(how="any")
#Supprimer la spécification de caractère
replace_str={
'@': '',
'\+': '',
'\$': '',
'\|': '',
'\<': '',
'\>': '',
'\-': '',
'\;': ''
}
#Supprimer une chaîne spécifique
df_all["comment"]=df_all["comment"].replace(replace_str, regex=True, encoding='utf-8')
print(df_all)
df_all.to_csv('{Pth}/replace.csv', sep='\t', index=False)