[PYTHON] R: Verwenden Sie im Skript Japanisch anstelle von Japanisch

Wenn das Skript in R Japanisch enthält, führt dies manchmal zu Unannehmlichkeiten. Daher gehen wir folgendermaßen damit um.

# R
intToUtf8(c(12371, 12435, 12395, 12385, 12399))
## [1] "Hallo"

Welcher Nummer das gewünschte Zeichen entspricht

# R
utf8ToInt("Hallo")
[1] 12371 12435 12395 12385 12399

Ich habe es einmal überprüft und versucht, es in das Skript zu schreiben, ohne Japanisch zu verwenden.

Sie können es auch in Python nachschlagen.

# python3
[ord(s) for s in "Hallo"]
## [12371, 12435, 12395, 12385, 12399]

Für die Python2-Serie ist u "" erforderlich.

# python2
[ord(s) for s in u"Hallo"]
## [12371, 12435, 12395, 12385, 12399]

Nachtrag (danke: @shiracamus)

Es scheint, dass Sie in R auch einen einheitlichen Code angeben können.

"\u3053\u3093\u306b\u3061\u306f"
## [1] "Hallo"

Ist der Code hexadezimal angegeben? Es gibt viele Möglichkeiten, den hexadezimalen Code abzurufen.

In R sieht es so aus.

# R
sprintf("%x", utf8ToInt("Hallo"))
[1] "3053" "3093" "306b" "3061" "306f"

Sie können hex in Python verwenden.

# python3
[hex(ord(s)) for s in "Hallo"]
['0x3053', '0x3093', '0x306b', '0x3061', '0x306f']

Nachtrag

Übrigens, wenn Sie beim Einbetten in ein R-Paket eine Zeichenfolge im Format "\ u ..." in der Funktionsdefinition verwenden, scheint die folgende Warnung zu erscheinen.

plotat.Rd: non-ASCII input and no declared encoding

Es wird anscheinend nicht empfohlen, Zeichen in voller Breite in der R-Hilfe zu verwenden.

Recommended Posts

R: Verwenden Sie im Skript Japanisch anstelle von Japanisch

Verwenden wir usercustomize.py anstelle von sitecustomize.py

Verwenden wir Tomotopie anstelle von Gensim

Verwendung der in Pip 7.1 hinzugefügten Einschränkungsdatei

Hallo Welt nicht localhost in Django

Setzen Sie Linux in Chromebook ein und verwenden Sie R ...

Holen Sie sich das Ergebnis der umgekehrten GeoCoding auf Japanisch mit dem Java SDK von GoogleMapsAPI.

Zusammenfassung der Verwendung von MNIST mit Python

Unsicherheit des japanischen Unite-Codes in der Tacotron 2-Serie

Machen Sie mit Python eine Joyplot-ähnliche Handlung von R.

Datum der bereits verwendeten Adresse Fehler in der Flasche

[Erklärung zur Implementierung] Verwendung der japanischen Version von BERT in Google Colaboratory (PyTorch)

Verwenden Sie für Python-URL-Verknüpfungen urlparse.urljoin anstelle von os.path.join

Verwenden wir die offenen Daten von "Mamebus" in Python

Verwenden Sie das Datum auf der x-Achse des in seaborn dargestellten tsplot

Verwendung des japanischen Spacy-Modells mit Google Colaboratory

Ich möchte R-Datensatz mit Python verwenden

EP 7 Listenverständnisse anstelle von Karte und Filter verwenden

Bequeme Verwendung von Ipython

Verwenden Sie config.ini mit Python

Verwenden Sie Datumsangaben in Python

Verwenden Sie Mean mit DataFrame

Verwenden Sie Valgrind mit Python

R bei Anaconda (in Ubuntu 14.04)

Japanische Ausgabe mit Python

Verwenden Sie den Profiler in Python

Japanische Lokalisierung von Pycharm

Englisch PDF wird ins Japanische übersetzt

Umfrage zum Einsatz von maschinellem Lernen in realen Diensten

Sortieren Sie das String-Array nach Länge und japanischer Silbe

Machen Sie die Funktion zum Zeichnen japanischer Schriftarten in OpenCV allgemein

Vergleich der Datenrahmenbehandlung in Python (Pandas), R, Pig