[PYTHON] R: Verwenden Sie im Skript Japanisch anstelle von Japanisch

Wenn das Skript in R Japanisch enthält, führt dies manchmal zu Unannehmlichkeiten. Daher gehen wir folgendermaßen damit um.

# R
intToUtf8(c(12371, 12435, 12395, 12385, 12399))
## [1] "Hallo"

Welcher Nummer das gewünschte Zeichen entspricht

# R
utf8ToInt("Hallo")
[1] 12371 12435 12395 12385 12399

Ich habe es einmal überprüft und versucht, es in das Skript zu schreiben, ohne Japanisch zu verwenden.

Sie können es auch in Python nachschlagen.

# python3
[ord(s) for s in "Hallo"]
## [12371, 12435, 12395, 12385, 12399]

Für die Python2-Serie ist u "" erforderlich.

# python2
[ord(s) for s in u"Hallo"]
## [12371, 12435, 12395, 12385, 12399]

Nachtrag (danke: @shiracamus)

Es scheint, dass Sie in R auch einen einheitlichen Code angeben können.

"\u3053\u3093\u306b\u3061\u306f"
## [1] "Hallo"

Ist der Code hexadezimal angegeben? Es gibt viele Möglichkeiten, den hexadezimalen Code abzurufen.

In R sieht es so aus.

# R
sprintf("%x", utf8ToInt("Hallo"))
[1] "3053" "3093" "306b" "3061" "306f"

Sie können hex in Python verwenden.

# python3
[hex(ord(s)) for s in "Hallo"]
['0x3053', '0x3093', '0x306b', '0x3061', '0x306f']

Nachtrag

Übrigens, wenn Sie beim Einbetten in ein R-Paket eine Zeichenfolge im Format "\ u ..." in der Funktionsdefinition verwenden, scheint die folgende Warnung zu erscheinen.

plotat.Rd: non-ASCII input and no declared encoding

Es wird anscheinend nicht empfohlen, Zeichen in voller Breite in der R-Hilfe zu verwenden.

Recommended Posts

R: Verwenden Sie im Skript Japanisch anstelle von Japanisch
Verwenden wir usercustomize.py anstelle von sitecustomize.py
Verwenden wir Tomotopie anstelle von Gensim
Verwendung der in Pip 7.1 hinzugefügten Einschränkungsdatei
Hallo Welt nicht localhost in Django
Setzen Sie Linux in Chromebook ein und verwenden Sie R ...
Holen Sie sich das Ergebnis der umgekehrten GeoCoding auf Japanisch mit dem Java SDK von GoogleMapsAPI.
Zusammenfassung der Verwendung von MNIST mit Python
Unsicherheit des japanischen Unite-Codes in der Tacotron 2-Serie
Machen Sie mit Python eine Joyplot-ähnliche Handlung von R.
Datum der bereits verwendeten Adresse Fehler in der Flasche
[Erklärung zur Implementierung] Verwendung der japanischen Version von BERT in Google Colaboratory (PyTorch)
Verwenden Sie für Python-URL-Verknüpfungen urlparse.urljoin anstelle von os.path.join
Verwenden wir die offenen Daten von "Mamebus" in Python
Verwenden Sie das Datum auf der x-Achse des in seaborn dargestellten tsplot
Verwendung des japanischen Spacy-Modells mit Google Colaboratory
Ich möchte R-Datensatz mit Python verwenden
EP 7 Listenverständnisse anstelle von Karte und Filter verwenden
Bequeme Verwendung von Ipython
Verwenden Sie config.ini mit Python
Verwenden Sie Datumsangaben in Python
Verwenden Sie Mean mit DataFrame
Verwenden Sie Valgrind mit Python
R bei Anaconda (in Ubuntu 14.04)
Japanische Ausgabe mit Python
Verwenden Sie den Profiler in Python
Japanische Lokalisierung von Pycharm
Englisch PDF wird ins Japanische übersetzt
Umfrage zum Einsatz von maschinellem Lernen in realen Diensten
Sortieren Sie das String-Array nach Länge und japanischer Silbe
Machen Sie die Funktion zum Zeichnen japanischer Schriftarten in OpenCV allgemein
Vergleich der Datenrahmenbehandlung in Python (Pandas), R, Pig