In Python gelernter Zeichencode

Zusammenfassung dessen, was ich aus dem Lesen der Python 2.7-Dokumentation gelernt habe

Unicode HOWTO — Python 2.7.13 documentation https://docs.python.org/2/howto/unicode.html

7.8. codecs — Codec registry and base classes — Python 2.7.13 documentation https://docs.python.org/2/library/codecs.html#encodings-and-unicode

Historische Geschichte

Um 1968

Die Nummern 0-127 wurden den Buchstaben von ASCII (American Standard Code for Information Interchange) zugewiesen. Beispiel) a: 97

$ python -V
Python 2.7.10

>>> unichr(97)
u'a'

>>> ord('a')
97

unichr(i) - 2. Built-in Functions — Python 2.7.13 documentation ord(i) - 2. Built-in Functions — Python 2.7.13 documentation

Es konnte jedoch nicht die in Europa verwendeten é- und russischen Kirill-Zeichen darstellen.

1980er Jahre

8-Bit-Computer (2 ^ 8 = 256) wurden zum Mainstream, und 128-255 wurden jeweils Zeichen in ihrem eigenen Format zugewiesen.

Unicode wurde entwickelt, um diesen Unterschied zu beseitigen.

Unicode

Definition

The Unicode standard describes how characters are represented by code points.

Character: a code points: 97 (0x61)

Zu verwendende Nummer

Anfangs verwendete Unicode 16 Bit (65.536). Es hat derzeit eine Breite von 0–1.114.111 (0x10ffff).

a Unicode string is a sequence of code points, which are numbers from 0 to 0x10ffff.

Encodings

The rules for translating a Unicode string into a sequence of bytes are called an encoding.

>>> 'a'.encode('hex')
'61'

Python-Code

$ python -V
Python 2.7.10

>>> s = 'a b c x y z'
>>> s.encode('hex')
'612062206320782079207a'

vim - Einfügemodus

"A" wird mit "STRG-v + u0061" eingegeben.

Referenz

Python Character Mapping Codec cp1252 generated from 'MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1252.TXT' with gencodec.py.

Recommended Posts

In Python gelernter Zeichencode
Python-Zeichencode
Mit Python erlerntes Refactoring (Basic)
Python-Kurs zum Lernen mit Chemoinfomatik
2.x, 3.x Serienzeichencode von Python
Was ich in Python gelernt habe
Python-Funktionen mit Chemoinfomatik gelernt
Zeichencode
[Python] Generiert QR-Code im Speicher
Formatieren Sie Python-Code automatisch mit Vim
Schreiben Sie Selentestcode in Python
Ich habe versucht, den Prozess mit Python zu studieren
Grundlegende ITK-Verwendung mit Python gelernt
Code-Tests rund um die Uhr in Python
Quadtree in Python --2
Python in der Optimierung
CURL in Python
Metaprogrammierung mit Python
Python 3.3 mit Anaconda
Geokodierung in Python
SendKeys in Python
Umgang mit Zeichencodes von Dateien in IronPython
Metaanalyse in Python
Unittest in Python
Epoche in Python
Zwietracht in Python
Deutsch in Python
DCI in Python
Quicksort in Python
nCr in Python
Plink in Python
Konstante in Python
FizzBuzz in Python
[Python] Code, der Algorithmen kennt
SQLite in Python
Schritt AIC in Python
LINE-Bot [0] in Python
Reverse Assembler mit Python
Reflexion in Python
Konstante in Python
[Python] Ruft den Zeichencode der Datei ab
Format in Python
Scons in Python 3
Puyopuyo in Python
Python in Virtualenv
PPAP in Python
Ruft die EDINET-Codeliste in Python ab
Quad-Tree in Python
Reflexion in Python
Chemie mit Python
Hashbar in Python
DirectLiNGAM in Python
LiNGAM in Python
In Python reduzieren
In Python flach drücken
Python> Code kopieren und einfügen> SyntaxError: Nicht-ASCII-Zeichen '\ xe3' in Datei> - * - Codierung: utf-8 - * - Hinzufügen
Python-Variablen und Datentypen, die mit Chemoinfomatik gelernt wurden