[PYTHON] Grober Unterschied zwischen Unicode und UTF-8 (und seinen Begleitern)

Unicode and UTF-8.png

Was ist Unicode?

Ein Zeichensatz. Verwalten Sie, indem Sie jedem Zeichen einen ganzzahligen Wert mit dem Namen Sign Position zuweisen. Es gibt.

Was sind UTF-8, UTF-16, UTF-32?

[Zeichencodierungsmethode](https://ja.wikipedia.org/wiki/%E6%96%87%E5%AD%97%E7%AC%A6%E5%8F%B7%E5%8C%96% E6% 96% B9% E5% BC% 8F). Konvertiert den ganzzahligen Wert der Codeposition in eine Bytezeichenfolge für die Verwendung durch den Computer.

Was ist ein Endian?

Die Reihenfolge, in der die Bytes angeordnet sind, wenn Daten aufgezeichnet werden, die aus mehreren Bytes im Speicher bestehen, oder wenn über ein Netzwerk gesendet und empfangen wird. Manchmal auch als ** Bytereihenfolge ** bezeichnet. Bei großen Endianern von oben und bei kleinen Endianern von unten anordnen.

エンディアン.png

Verifizierungs-Schlüssel

Dies ist der Code, als ich ihn beim Schreiben dieses Artikels mit Python überprüft habe.

In [1]: import unicodedata

In [2]: import binascii

In [3]: unicodedata.name('Depression') #Schlagen Sie den Namen nach
Out[3]: 'CJK UNIFIED IDEOGRAPH-9B31'

In [4]: ord('Depression') #Überprüfen Sie die Codeposition
Out[4]: 39729

In [5]: binascii.hexlify('Depression'.encode('UTF-8')) # UTF-Bei 8 in eine Byte-Zeichenfolge codieren und dann in eine hexadezimale Darstellung konvertieren
Out[5]: b'e9acb1'

In [6]: binascii.hexlify('Depression'.encode('UTF-16'))
Out[6]: b'fffe319b'

In [7]: binascii.hexlify('Depression'.encode('UTF-16LE'))
Out[7]: b'319b'

In [8]: binascii.hexlify('Depression'.encode('UTF-16BE'))
Out[8]: b'9b31'

In [9]: binascii.hexlify('Depression'.encode('UTF-32'))
Out[9]: b'fffe0000319b0000'

In [10]: binascii.hexlify('Depression'.encode('UTF-32LE'))
Out[10]: b'319b0000'

In [11]: binascii.hexlify('Depression'.encode('UTF-32BE'))
Out[11]: b'00009b31'

In [12]: binascii.hexlify('Vergnügen'.encode('UTF-16'))
Out[12]: b'fffeeb5f1f61'

In [13]: binascii.hexlify('Vergnügen'.encode('UTF-16LE'))
Out[13]: b'eb5f1f61'

In [14]: binascii.hexlify('Vergnügen'.encode('UTF-16BE'))
Out[14]: b'5feb611f'

Recommended Posts

Grober Unterschied zwischen Unicode und UTF-8 (und seinen Begleitern)
Was ist der Unterschied zwischen "pip" und "conda"?
Über den Unterschied zwischen "==" und "is" in Python
Über den Unterschied zwischen PostgreSQL su und sudo
Was ist der Unterschied zwischen Unix und Linux?
Kann BERT den Unterschied zwischen "Ame (Süßigkeiten)" und "Ame (Regen)" verstehen?
Was ist der Unterschied zwischen usleep, nanosleep und clock_nanosleep?
EP 3 Kennen Sie die Unterschiede zwischen Bytes, Str und Unicode
Wie man Argparse benutzt und den Unterschied zwischen Optparse
Unterschied zwischen Prozess und Job
Unterschied zwischen "categoryical_crossentropy" und "sparse_categorical_crossentropy"
Unterschied zwischen Regression und Klassifikation
Unterschied zwischen np.array und np.arange
Unterschied zwischen MicroPython und CPython
Unterschied zwischen ps a und ps -a
Unterschied zwischen Return und Print-Python
Was ist der Unterschied zwischen symbolischen und harten Links?
Verstehen Sie den Unterschied zwischen der kumulativen Zuordnung zu Variablen und der kumulativen Zuordnung zu Objekten
Eine grobe Zusammenfassung der Unterschiede zwischen Windows und Linux
Unterschied zwischen Vordergrundprozess und Hintergrundprozess, prinzipiell verstanden
Unterschied zwischen Ruby und Python Split
Unterschied zwischen Java und Python (Memo)
Unterschied zwischen list () und [] in Python
Unterschied zwischen SQLAlchemy filter () und filter_by ()
Unterschied zwischen == und ist in Python
Memorandum (Unterschied zwischen csv.reader und csv.dictreader)
(Hinweis) Unterschied zwischen Gateway und Standard-Gateway
Unterschied zwischen Numpys Randint und Randoms Randint
Unterschied zwischen sortiert und sortiert (Denkmal)
Unterschied zwischen der Python2-Serie und der Python3-Serie dict.keys ()
Ich untersuchte das Verhalten bezüglich des Unterschieds zwischen Hard Link und Symbolic Link
[Python] Unterschied zwischen Funktion und Methode
Unterschied zwischen SQLAlchemy flush () und commit ()
Python - Unterschied zwischen exec und eval
[Python] Unterschied zwischen randrange () und randint ()
[Python] Unterschied zwischen sortiert und sortiert (Colaboratory)
[Einführung in Python] Was ist der Unterschied zwischen einer Liste und einem Taple?
[Xg Boost] Unterschied zwischen Softmax und Softprob
Unterschied zwischen Anweisungen (Anweisungen) und Ausdrücken (Ausdrücken) in Python
[Django ORM] Unterschied zwischen Werten () und nur ()
Unterschiede in der Beziehung zwischen PHP und Python schließlich und beenden
Unterschied zwischen @classmethod und @staticmethod in Python
Unterschied zwischen Anhängen und + = in der Python-Liste
Unterschied zwischen nicht lokal und global in Python
Unterschied zwischen linearer Regression, Ridge-Regression und Lasso-Regression
[Python] Unterschied zwischen Klassenmethode und statischer Methode
Unterschied zwischen Docker-Compose-Datei env_file und .env-Datei
Die subtile Beziehung zwischen Gentoo und Pip
[Python3] Wechseln Sie zwischen Shift_JIS, UTF-8 und ASCII
Über die Beziehung zwischen Git und GitHub
[Python Iroha] Unterschied zwischen Liste und Tupel
[Python] Unterschied zwischen Rand- und Randn-Ausgabe
Geschwindigkeitsunterschied zwischen wsgi, Flasche und Flasche
Unterschied zwischen numpy.ndarray und list (Dimension, Größe)
Unterschied zwischen ls -l und cat Befehl
Differenz- und Kompatibilitätsprüfung zwischen Keras und tf.keras # 1
Zusammenfassung der Unterschiede zwischen PHP und Python
Die Antwort von "1/2" unterscheidet sich zwischen Python2 und 3
Unterschied zwischen Verwendung und Import in der Schildsprache
Unterschied zwischen Variablen und Selbst. Variablen in der [Python] -Klasse
Bayes Modellierung-Schätzung des Unterschieds zwischen den beiden Gruppen-