7.1.1 Unicode
--Unicode ist ein sich entwickelnder internationaler Standard, der versucht, Symbole für die gesamte Literatur und Mathematik der Weltsprachen und anderer Disziplinen zu definieren.
>>> def unicode_test(v):
... import unicodedata
#Extrahieren Sie den Namen aus den Buchstaben
... name=unicodedata.name(v)
#Extrahieren Sie eine Zeichenfolge aus dem Namen.
... v2=unicodedata.lookup(name)
... print("v=%s,name=%s,v2=%s"%(v,name,v2))
...
>>> unicode_test("A")
v=A,name=LATIN CAPITAL LETTER A,v2=A
#Unicode-ASCII-Symbol
>>> unicode_test("$")
v=$,name=DOLLAR SIGN,v2=$
#Unicode-Währungssymbol
>>> unicode_test("\u00a2")
v=¢,name=CENT SIGN,v2=¢
>>> unicode_test("\u20ac")
v=€,name=EURO SIGN,v2=€
#Anzeige alternativer Symbole
>>> unicode_test("\u2603")
v=☃,name=SNOWMAN,v2=☃
>>> place = "cafe"
>>> place
'cafe'
>>> import unicodedata
>>> unicodedata.name('\u00e9')
'LATIN SMALL LETTER E WITH ACUTE'
>>> unicodedata.lookup('LATIN SMALL LETTER E WITH ACUTE')
'é'
#Geben Sie eine Zeichenfolge per Code an
>>> place = "caf\u00e9"
>>> place
'café'
#Zeichenfolge mit Namen angegeben
>>> place = "caf\N{LATIN SMALL LETTER E WITH ACUTE}"
>>> place
'café'
>>> u="\N{LATIN SMALL LETTER U WITH DIAERESIS}"
>>> u
'ü'
#len()Zählt die Anzahl der Unicode-Zeichen, nicht die Anzahl der Bytes.
>>> len("&")
1
>>> len("\U0001f47b")
1
Es gibt einige Wörter, an die ich mich nicht erinnern kann, wie Codierung, Decodierung und Byte-Strings. Lassen Sie uns jeden einzelnen überprüfen.
"Einführung in Python3 von Bill Lubanovic (veröffentlicht von O'Reilly Japan)"
Recommended Posts