[Python] Japanische CSV mit Pandas ohne verstümmelte Zeichen lesen (weitere auf Japanisch geschriebene Spalten extrahieren)

Ich lerne für Python 2.7.6 mit Pycharm.

Dieses Mal habe ich die auf Japanisch geschriebene CSV-Datei gelesen, um sie zu analysieren Eine wunderbar verstümmelte Datei wurde ausgegeben. Als Ergebnis verschiedener Untersuchungen wurde es mit der folgenden Methode gelöst.

Warum die CSV-Datei verstümmelt ist

Verstümmelte Dateien können auf die gleiche Weise wie der zuvor erstellte [Eintrag] erstellt werden (http://qiita.com/redAlgae/items/1d9788b6f0b6613bf711). Ich habs gemacht.

import pandas as pd
import os

#Geben Sie den Pfad zum Arbeitsverzeichnis an, in dem die Daten gespeichert sind
os.chdir("/Dateipfad zum Verzeichnis")
#Lesen Sie csv
df= pd.read_csv("japanese.csv")
print df

Beim Lesen von csv wurde der Zeichencode jedoch nicht angegeben Die verstümmelte Datei wurde erfolgreich gelesen.

Wie man japanische CSV-Datei ohne verstümmelte Zeichen liest

Wenn ich also die CSV-Datei mit SHIFT-JIS mit der folgenden Methode lese, Die CSV-Datei wurde auf Japanisch angezeigt!

import pandas as pd
import os

#Geben Sie den Pfad zum Arbeitsverzeichnis an, in dem die Daten gespeichert sind
os.chdir("/Dateipfad zum Verzeichnis")
#CSV mit angegebenem Zeichencode lesen
df= pd.read_csv("japanese.csv",encoding="SHIFT-JIS")
print df

Nachdem die japanische CSV-Datei auf diese Weise gelesen wurde, ist es Zeit, die Daten zu verarbeiten! Während ich mit dem Zeichencode herumspielte, änderte ich jedoch die auf Japanisch angegebene Spalte. Ich konnte es nicht bekommen und kämpfte wieder ...

Extrahieren Sie nur Spalten, die in Japanisch geschrieben sind

Geben Sie explizit eine Spalte an, um nur die gewünschten Spalten abzurufen loc [:, "gewünschter Spaltenname"] Wenn Sie schreiben, werden alle Spalten unter "Gewünschter Spaltenname" angezeigt. Hier enthält eine ausführliche Erklärung. Wenn Sie also wie folgt schreiben: Die Spalte, in der "der Name der gewünschten Spalte" geschrieben ist Ich konnte es sanft bekommen!

import pandas as pd
import os

#Geben Sie den Pfad zum Arbeitsverzeichnis an, in dem die Daten gespeichert sind
os.chdir("/Dateipfad zum Verzeichnis")
#CSV mit angegebenem Zeichencode lesen
df= pd.read_csv("japanese.csv,encoding="SHIFT-JIS"")
column = df.loc[:,[u'Name der gewünschten Spalte']]
print column 

Ich bin auch dieses Mal über die Grundlagen gestolpert, Wenn jemand das gleiche Problem hat, wäre es hilfreich ...

Recommended Posts

[Python] Japanische CSV mit Pandas ohne verstümmelte Zeichen lesen (weitere auf Japanisch geschriebene Spalten extrahieren)
Lesen Sie CSV mit Python-Pandas
Das japanische Zeichen verstümmelte die Eliminierung von Matplotlib und NetworkX der Python-Bibliothek
Extrahieren Sie Text aus [python] pdf und lesen Sie Zeichen mit Open-Jtalk vor
Laden Sie csv mit doppelten Spalten in Pandas
Lesen Sie CSV und analysieren Sie mit Pandas und Seaborn
Lesen und formatieren Sie CSV-Dateien gemischt mit Komma-Registerkarten mit Python-Pandas
Lesen Sie Python-CSV-Daten mit Pandas ⇒ Graph mit Matplotlib
Lesen Sie JSON mit Python und geben Sie CSV aus
Erstellen Sie ein Bild mit Zeichen mit Python (Japanisch)
[Python] Lesen Sie die CSV-Datei und zeigen Sie die Abbildung mit matplotlib an
Extrahieren Sie das Bigquery-Dataset und die Tabellenliste mit Python und geben Sie es in CSV aus
[Python3] Speichern Sie die Mittelwert- und Kovarianzmatrix in json mit Pandas
Extrahieren Sie bestimmte mehrere Spalten mit Pandas
Lesen Sie Dateien parallel zu Python
Lesen und Schreiben von CSV mit Python
# Zeile ignorieren und mit Pandas lesen
Datenbanktabellen mit CSV extrahieren [ODBC-Verbindung von R und Python]
Erstellen und lesen Sie Messagepacks in Python
Füllen Sie die Zeichenfolge mit Nullen in Python und zählen Sie bestimmte Zeichen aus der Zeichenfolge
Lesen Sie die CSV-Datei mit Python und konvertieren Sie sie unverändert in DataFrame
Verbinden Sie Daten mit dem Hauptschlüssel (erforderlich) und dem Unterschlüssel (optional) in Python-Pandas
Stresstest mit Locust in Python geschrieben
[Anmerkung] Japanische Schriftzeichen sind mit Atom-Runner verstümmelt
CSV-Datei mit Python lesen (CSV-Datei herunterladen und analysieren)
Lesen und Schreiben von CSV-Dateien mit Numpy
Umgang mit "Jahren und Monaten" in Python
Lesen Sie Python csv und exportieren Sie es nach txt
Lesen und schreiben Sie JSON-Dateien mit Python
Windows Qt5.4 Python3.4 QProcess Japanische verstümmelte Zeichen
Lesen von CSV-Dateien mit Pandas
Laden Sie csv mit Pandas und spielen Sie mit Index
Hinzufügen von Serien zur Spalte in Python-Pandas
Lesen von Zeichen in Bildern mit Python OCR
[Einführung in Pandas] Lesen Sie eine CSV-Datei ohne Spaltennamen und geben Sie ihr einen Spaltennamen
Python-Grundkurs CSV-Verarbeitung (Funktionen und Klassen Nr. 1 CSV wird gelesen und geschrieben)
Lesen einer CSV-Datei mit Python 2/3
Kratzen Sie das Essen mit Python und geben Sie es an CSV aus
Japanische Textvorverarbeitung ohne Aussage in Pandas
Lesen Sie eine Datei mit verstümmelten Linien in Python
[Automatisierung] Extrahieren Sie die Tabelle als PDF mit Python
[Python] Wie man Excel-Dateien mit Pandas liest
Lesen Sie Tabellendaten in einer PDF-Datei mit Python
Lesen und Schreiben von CSV- und JSON-Dateien mit Python
Behandeln Sie Zip-Dateien mit japanischen Dateinamen in Python 3
[Python3] Lesen und Schreiben mit datetime isoformat mit json
Zip mit Python extrahieren (unterstützt japanische Dateinamen)
Extrahieren Sie E-Mail-Anhänge, die Thunderbird mit Python erhalten hat
Korrigieren Sie verstümmelte Zeichen beim Umgang mit Japanisch in Anfragen
[Python] Umgang mit japanischen Zeichen mit openCV
Fügen Sie mit Pandas Summen zu Zeilen und Spalten hinzu
Beispiel für das Lesen und Schreiben von CSV mit Python
Vergleichen Sie die Lese- / Schreibgeschwindigkeit und Kapazität von CSV, Pickle, Joblib und Parkett in einer Python-Umgebung
Konsolidieren Sie eine große Anzahl von CSV-Dateien in Ordnern mit Python (Daten ohne Header).
CSV in Python
Verarbeitung von CSV-Daten in voller und halber Breite in Python
Um Japanisch mit Python in der Docker-Umgebung verwenden zu können
Lesen und analysieren Sie den Datensatz im Arff-Format mit python scipy.io
Lesen Sie die CSV-Datei und zeigen Sie sie im Browser an
Lesen Sie die Linkliste im CSV-Format mit dem Graph-Tool