Öffnen Sie UTF-8 mit Stückliste in Python

Zunächst aus der Schlussfolgerung

Beim Lesen mit UTF-8-Stückliste in Python codieren

Geben Sie ** 'utf_8_sig' ** an.

Beispiel für das Lesen einer Datei io.opne(filename, "r", encoding="utf_8_sig")

Konvertieren Sie vom str-Typ (UTF-8) in den Unicode-Typ uni_string = unicode(str_string, 'utf_8_sig')

Einführung in das Kratzen

Ich war ein wenig süchtig danach, UTF-8 in Python zu lesen, also werde ich es aufschreiben, um nicht zu vergessen.

Was ist Stückliste?

UTF-8 kann eine Stückliste (Byte Order Mark) haben. Dies ist eine Kennung, dass die Codierung UTF-8 ist. Die ersten 3 Bytes der Datei sind 'EF BB BF'.

Das Problem ist, dass es UTF-8 mit Stückliste und UTF-8 ohne Stückliste gibt.

Die Stückliste wird UTF-8 in Windows 'Notepad' und Excel hinzugefügt. Linux und Mac scheinen UTF-8 grundsätzlich ohne Stückliste zu handhaben.

Behandeln Sie Dateien mit UTF-8-Stückliste in Python

Dieses Mal wollte ich die in Excel bearbeitete CSV-Datei laden, daher musste ich die Stückliste berücksichtigen.

Ich dachte, ich habe es in das Dokument geschrieben.

Offizielles Dokument UTF-8 mit Stücklistenzeichen

Wenn Sie den Codierungscode auf 'utf_8_sig' setzen, Wenn eine Stückliste vorhanden ist, wird diese übersprungen und gelesen. Wenn keine Stückliste vorhanden ist, kann sie so wie sie ist als UTF-8 gelesen werden.

Beispielprogramm

ImportCSV.py



import io

with io.open('sample.csv', 'rt', encoding='utf_8_sig') as f:
    print(f.readlines())

Schließlich

Zeichencodes machen in Python in der Regel süchtig. Wenn Sie jedoch beim Konvertieren in einen Unicode-Typ mit Zeichencodes richtig umgehen können, müssen Sie sich keine Gedanken über Zeichencodes machen.

Recommended Posts

Öffnen Sie UTF-8 mit Stückliste in Python
UTF8-Textverarbeitung mit Python
Schaben mit Selen in Python
Betreiben Sie LibreOffice mit Python
Debuggen mit pdb in Python
Umgang mit Sounds in Python
Scraping mit Selen in Python
Scraping mit Tor in Python
Tweet mit Bild in Python
Kombiniert mit Ordnungszahl in Python
Zahlenerkennung in Bildern mit Python
Testen mit Zufallszahlen in Python
GOTO in Python mit erhabenem Text 3
Arbeiten mit LibreOffice in Python: Importieren
Scraping mit Selen in Python (Basic)
CSS-Analyse mit cssutils in Python
Numer0n mit Elementen, die mit Python erstellt wurden
Verwenden Sie rospy mit virtualenv in Python3
Verwenden Sie Python in pyenv mit NeoVim
Heatmap mit Dendrogramm in Python + Matplotlib
Hash-Methode (Open-Address-Methode) in Python
Lesen Sie Dateien parallel zu Python
Passwort für Lehrbuch mit Python generieren
Verwenden Sie OpenCV mit Python 3 in Window
Bis zum Umgang mit Python in Atom
Beginnen Sie mit Python mit Blender
Arbeiten mit DICOM-Bildern in Python
Holen Sie sich mit Python zusätzliche Daten zu LDAP
Spiralbuch in Python! Python mit einem Spiralbuch! (Kapitel 14 ~)
Versuchen Sie, sich mit Python bei qiita anzumelden
Stresstest mit Locust in Python geschrieben
Python3> im Schlüsselwort> Wahr mit teilweiser Übereinstimmung?
Erhalten Sie Wechselkurse von offenen Wechselkursen in Python
Exklusive Steuerung mit Sperrdatei in Python
Geräteüberwachung durch On-Box Python von IOS-XE
Versuchen Sie, mit Binärdaten in Python zu arbeiten
Zeichnen Sie Nozomi Sasaki in Excel mit Python
Tipps zum Umgang mit Binärdateien in Python
Zeigen Sie Python 3 im Browser mit MAMP an
So arbeiten Sie mit BigQuery in Python
Trump-Klasse in Python (mit Vergleich)
Umgang mit "Jahren und Monaten" in Python
Verarbeiten Sie mehrere Listen mit for in Python
Ersetzen Sie Nicht-ASCII durch reguläre Ausdrücke in Python
Einzeiler webServer (mit CGI) in Python
Beginnen wir mit TopCoder in Python (Version 2020)
Verarbeiten Sie Bilder in Python ganz einfach mit Pillow
So betreiben Sie die Zeitstempelstation in Python
Rufen Sie APIGateWay mit APIKey in Python-Anforderungen auf
Lesen von Zeichen in Bildern mit Python OCR
Einführung von sip-4.14 in der Python3.2.2-Umgebung mit MacOS 10.7.4
Python in der Optimierung
CURL in Python
FizzBuzz in Python3
Metaprogrammierung mit Python
Python 3.3 mit Anaconda
Geokodierung in Python