Umgang mit Zeichencodes von Dateien in IronPython

Lesen und Schreiben von SJIS-Dateien. Das Endergebnis ist ganz normal, aber ...

Zunächst gibt es ein Beispiel für die Verwendung von codecs.getreader / writer, wenn Sie sich normal bewegen.

Also nicht möglich. Verwenden Sie abschließend string.encode (), decode ()

Lesen:

for line in open('file.txt', 'rt'):
    linedec = line.decode('cp932')
   ...

Auch das Schreiben ist

str(a_unicode_string)

Aufgrund der netten Spezifikation orz, die zu UnicodeEncodeError führt, untypisierte Objekte Bei der Verarbeitung können Sie sich nicht auf die Standardoperation verlassen und müssen diese selbst in eine Zeichenfolge konvertieren. Warum ist die Notation dieses Teils

'%s' % obj

Du kannst es schaffen. (Ich denke, es kann das gleiche sein wie das Verhalten str () dieses Codes)

Wenn ich versuche, eine Unicode-Zeichenfolge in eine geöffnete Datei zu schreiben, ohne einen Zeichencode festzulegen, wird außerdem ein UnicodeEncodeError angezeigt. Wenn Sie es im Textmodus öffnen, erfolgt es außerdem zum Löschen, anstatt es zu schreiben, sodass eine Fehlerbehebung nicht möglich ist, was ein ziemliches Problem darstellt. Es scheint es nicht als UTF16-Binärdatei zu behandeln.

Also exportieren:

f=open('sjis.txt', 'wt')
lineenc = linestr.encode('cp932')
print >>f, lineenc
print >>f, ('%s' % some_object).encode('cp932')

Recommended Posts

Umgang mit Zeichencodes von Dateien in IronPython
[Python] Ruft den Zeichencode der Datei ab
[Python] [chardet] Automatische Erkennung von Zeichencode in Dateien
Konvertieren Sie den Zeichencode der Datei mit Python3
Umgang mit Zitaten in [bash]
2.x, 3.x Serienzeichencode von Python
In Python gelernter Zeichencode
Umgang mit JSON-Dateien in Python
Die Geschichte des "Lochs" in der Akte
Csv spuckte eine Liste mit Dateinamen, zuletzt geänderten Daten und Zeichencodes in Python3 aus
Zeichencode
Verwendung der in Pip 7.1 hinzugefügten Einschränkungsdatei
Lesen Sie die Datei, indem Sie den Zeichencode angeben.
Zeichencode-Konvertierung von CSV-Dateien mit Loop (Shift JIS to UTF8)
Python-Zeichencode
Unsicherheit des japanischen Unite-Codes in der Tacotron 2-Serie
Links und Memos von Python-Zeichencodezeichenfolgen
[Python] Kapitel 02-02 Grundlagen von Python-Programmen (Umgang mit Zeichenketten)
Geschwindigkeitsbewertung der Ausgabe von CSV-Dateien in Python
Eine Code-Sammlung, die häufig in persönlichem Python verwendet wird
Speichern Sie Japanisch (Multibyte-Zeichenfolge) in sqlite3 von Python
#Eine Funktion, die den Zeichencode einer Zeichenfolge zurückgibt
Ruby, Python-Codefragment Ausführung der Auswahl in Emacs
Liste des Python-Codes, der bei der Big-Data-Analyse verwendet wird
Listen Sie schnell mehrere Textzeilen auf, die Sie in Ihren Code schreiben
Dateioperationen in Python
Dateiverarbeitung in Python
Umgang mit Json in Python
Dateimanipulation mit Python
Fehlerbehandlung in PythonBox
Umgang mit Hexadezimal in Python3
Reimport der .py-Datei
Code, der bei AttributeError Standardwerte festlegt
Scraping Excel-Datei der Liste der Geschäfte, die regionale gemeinsame Gutscheine verarbeiten
Vergleich des in Python geschriebenen EMA-Codes (Exponential Moving Average)
[Hinweis] Import von Dateien in das übergeordnete Verzeichnis in Python
Entschlüsseln Sie eine Codezeile in Python Lambda, Karte, Liste
Vergleich der Datenrahmenbehandlung in Python (Pandas), R, Pig
Behandlung des HSV-Farbraums unten und oben in OpenCV
Google sucht mit Python nach der Zeichenfolge in der letzten Zeile der Datei
Ein Befehl zum Auflisten aller Dateien in der Reihenfolge des Dateinamens