Wenn Sie eine CSV-Datei mit Pandas lesen, ist dies sehr praktisch, da Sie nur "read_csv" benötigen.
import pandas as pd
pd.read_csv("file/to/path")
Normalerweise gibt es kein Problem mit den oben genannten, aber wenn die CSV fehlerhafte Zeichen enthält, wird der folgende Fehler ausgegeben.
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x83 in position 0: invalid start byte
Es scheint, dass er wütend ist: "Ich kann es nicht entschlüsseln."
Da der von Excel erstellte Zeichencode von CSV "shift-jis" ist, werde ich versuchen, ihn vorerst mit "Kodierung" des Lesens anzugeben.
import pandas as import pd
pd.read_csv("file/to/path", encoding="shift-jis")
Immerhin ist es ein Fehler. Korrekt.
UnicodeDecodeError: 'shift_jis' codec can't decode byte 0x87 in position 0: illegal multibyte sequence
Geben Sie als Lösung in "codecs.open" "ignore" an, ignorieren Sie den Fehler und öffnen Sie ihn. Es scheint, dass er von "pd.read_table" gelesen werden kann.
with codecs.open("file/to/path", "r", "Shift-JIS", "ignore") as file:
df = pd.read_table(file, delimiter=",")
print(df)
Es scheint, dass Sie es als StreamReaderWriter-Objekt übergeben können, ohne file.read ()
auszuführen.
Ich bin süchtig danach, also habe ich mir eine Notiz gemacht.