Code de caractère appris en Python

Résumé de ce que j'ai appris en lisant la documentation Python 2.7

Unicode HOWTO — Python 2.7.13 documentation https://docs.python.org/2/howto/unicode.html

7.8. codecs — Codec registry and base classes — Python 2.7.13 documentation https://docs.python.org/2/library/codecs.html#encodings-and-unicode

Histoire historique

Vers 1968

Les numéros 0-127 ont été attribués aux lettres par ASCII (American Standard Code for Information Interchange). Exemple) a: 97

$ python -V
Python 2.7.10

>>> unichr(97)
u'a'

>>> ord('a')
97

unichr(i) - 2. Built-in Functions — Python 2.7.13 documentation ord(i) - 2. Built-in Functions — Python 2.7.13 documentation

Cependant, il ne pouvait pas représenter les caractères é et russe Kirill utilisés en Europe.

Années 1980

Les ordinateurs 8 bits (2 ^ 8 = 256) sont devenus courants et 128 à 255 ont chacun reçu des caractères dans leur propre format.

Unicode a été développé pour éliminer cette différence.

Unicode

Définition

The Unicode standard describes how characters are represented by code points.

Character: a code points: 97 (0x61)

Numéro à utiliser

Initialement, Unicode utilisait 16 bits (65 536). Il a actuellement une largeur de 0 à 1 114 111 (0x10ffff).

a Unicode string is a sequence of code points, which are numbers from 0 to 0x10ffff.

Encodings

The rules for translating a Unicode string into a sequence of bytes are called an encoding.

>>> 'a'.encode('hex')
'61'

Code Python

$ python -V
Python 2.7.10

>>> s = 'a b c x y z'
>>> s.encode('hex')
'612062206320782079207a'

vim --Mode d'insertion

ʻAest entré avecCTRL-v + u0061`.

référence

Python Character Mapping Codec cp1252 generated from 'MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1252.TXT' with gencodec.py.

Recommended Posts

Code de caractère appris en Python
code de caractère python
Refactoring appris avec Python (Basic)
Classe Python pour apprendre avec la chimioinfomatique
2.x, 3.x code de caractères des séries python
Ce que j'ai appris en Python
Fonctions Python apprises avec la chimioinfomatique
Code de caractère
[Python] Générer un code QR en mémoire
Formater automatiquement le code Python avec Vim
Ecrire le code de test du sélénium en python
J'ai essayé d'étudier le processus avec Python
Utilisation élémentaire d'ITK apprise avec Python
Tests de code dans le temps en Python
Quadtree en Python --2
Python en optimisation
CURL en Python
Métaprogrammation avec Python
Python 3.3 avec Anaconda
Géocodage en python
SendKeys en Python
Gestion des codes de caractères des fichiers en IronPython
Méta-analyse en Python
Unittest en Python
Époque en Python
Discord en Python
Allemand en Python
DCI en Python
tri rapide en python
nCr en python
Plink en Python
Constante en Python
FizzBuzz en Python
[Python] Code conscient des algorithmes
Sqlite en Python
Étape AIC en Python
LINE-Bot [0] en Python
Assemblage inversé avec Python
Réflexion en Python
Constante en Python
[Python] Récupère le code de caractère du fichier
format en python
Scons en Python 3
Puyopuyo en python
python dans virtualenv
PPAP en Python
Obtenir la liste de codes EDINET en Python
Quad-tree en Python
Réflexion en Python
Chimie avec Python
Hashable en Python
DirectLiNGAM en Python
LiNGAM en Python
Aplatir en Python
Aplatir en python
python> Copier et coller du code> SyntaxError: Caractère non-ASCII '\ xe3' dans le fichier> - * - codage: utf-8 - * - Ajouter
Variables Python et types de données appris avec la chimio-automatique