Wenn das Skript in R Japanisch enthält, führt dies manchmal zu Unannehmlichkeiten. Daher gehen wir folgendermaßen damit um.
# R
intToUtf8(c(12371, 12435, 12395, 12385, 12399))
## [1] "Hallo"
Welcher Nummer das gewünschte Zeichen entspricht
# R
utf8ToInt("Hallo")
[1] 12371 12435 12395 12385 12399
Ich habe es einmal überprüft und versucht, es in das Skript zu schreiben, ohne Japanisch zu verwenden.
Sie können es auch in Python nachschlagen.
# python3
[ord(s) for s in "Hallo"]
## [12371, 12435, 12395, 12385, 12399]
Für die Python2-Serie ist u "" erforderlich.
# python2
[ord(s) for s in u"Hallo"]
## [12371, 12435, 12395, 12385, 12399]
Es scheint, dass Sie in R auch einen einheitlichen Code angeben können.
"\u3053\u3093\u306b\u3061\u306f"
## [1] "Hallo"
Ist der Code hexadezimal angegeben? Es gibt viele Möglichkeiten, den hexadezimalen Code abzurufen.
In R sieht es so aus.
# R
sprintf("%x", utf8ToInt("Hallo"))
[1] "3053" "3093" "306b" "3061" "306f"
Sie können hex in Python verwenden.
# python3
[hex(ord(s)) for s in "Hallo"]
['0x3053', '0x3093', '0x306b', '0x3061', '0x306f']
Übrigens, wenn Sie beim Einbetten in ein R-Paket eine Zeichenfolge im Format "\ u ..." in der Funktionsdefinition verwenden, scheint die folgende Warnung zu erscheinen.
plotat.Rd: non-ASCII input and no declared encoding
Es wird anscheinend nicht empfohlen, Zeichen in voller Breite in der R-Hilfe zu verwenden.
Recommended Posts