Verarbeitung von CSV-Daten in voller und halber Breite in Python

So vereinheitlichen Sie Daten, die eine Mischung aus Katakana, Symbolen, Alphabeten und Zahlen sind.

Referenz:

https://qiita.com/shakechi/items/d12641d6cad01479785f

Da es problematisch ist, CSV mit Pandas zu öffnen, wird es zu einer Funktion gemacht, so dass für jede Spalte eine Verarbeitung in voller und halber Breite durchgeführt werden kann. Fügen Sie einfach den Spaltennamen in die Liste der Spalten = [] ein und es ist OK.

Was zu verarbeiten ist: Machen Sie alle Katakana, Symbole (Leerzeichen usw.) und Zahlen zur halben Breite.


#Installieren Sie pip install jaconv mit einem Terminal oder einem Befehlszeilentool vor.
import jaconv


def shori(column):
    list=  df[column].values.tolist()
    new_list = []
    
    for li in list:
        li = jaconv.z2h(li,digit=True, ascii=True,kana=True)
        new_list.append(li)
        
    df[column] = new_list
    
    return df[column]

##Listen Sie die Spaltennamen auf, die Sie verarbeiten möchten.
columns = []

#Drehen Sie mit für.
for column in columns:
    shori(column)

Recommended Posts

Verarbeitung von CSV-Daten in voller und halber Breite in Python
Korrigieren Sie Schwankungen der Notation in halber und voller Breite in Python
Zusammenfassung der Datumsverarbeitung in Python (Datum / Uhrzeit und Datum)
Hashing von Daten in R und Python
Verarbeitung zur Verwendung von notMNIST-Daten in Python (und versucht, sie zu klassifizieren)
Dateneingabe / -ausgabe in Python (CSV, JSON)
Zeichnen Sie Daten einfach in Shell und Python
Trennung von Design und Daten in matplotlib
CSV in Python
Status jedes Python-Verarbeitungssystems im Jahr 2020
Projekt Euler # 1 "Vielfaches von 3 und 5" in Python
Datenanalyse: Einfache Anwendung deskriptiver Statistiken und Schätzungsstatistiken auf CSV-Daten in Python
Ich habe 0 Jahre Programmiererfahrung und fordere die Datenverarbeitung mit Python heraus
Zeichnen Sie die CSV von Zeitreihendaten mit einem Unixtime-Wert in Python (matplotlib).
Python: Vorverarbeitung beim maschinellen Lernen: Umgang mit fehlenden / Ausreißern / unausgeglichenen Daten
Python-Variablen und Datentypen, die mit Chemoinfomatik gelernt wurden
Empfangen und Anzeigen von HTML-Formulardaten in Python
Zeigen Sie das Ergebnis der Geometrieverarbeitung in Python an
[Python] Vertauschen von Zeilen und Spalten mit Numpy-Daten
Echtzeitvisualisierung von Thermografie AMG8833-Daten in Python
Lesen und Schreiben von CSV- und JSON-Dateien mit Python
Die Geschichte des Lesens von HSPICE-Daten in Python
J / N-Verarbeitung mit Bash, Python und Go
Aufgezeichnete Umgebung für die Datenanalyse mit Python
Erläuterung der Bearbeitungsentfernung und Implementierung in Python
Geschwindigkeitsbewertung der Ausgabe von CSV-Dateien in Python
Beispiel für das Lesen und Schreiben von CSV mit Python
Dateiverarbeitung in Python
Multithread-Verarbeitung in Python
Textverarbeitung mit Python
Verarbeitung in Python beenden
Verschiedene Verarbeitung von Python
[Python] Von der morphologischen Analyse von CSV-Daten bis zur CSV-Ausgabe und Diagrammanzeige [GiNZA]
Verarbeitung (Python) Diagramm der Koordinaten der Liste Geben Sie an, wie oft in draw ()
[Python] So benennen Sie Tabellendaten und geben sie mit csv aus (to_csv-Methode)
"Lineare Regression" und "Probabilistische Version der linearen Regression" in Python "Bayes lineare Regression"
Zusammenfassung der Tools, die zum Analysieren von Daten in Python benötigt werden
Berechnung der Standardabweichung und des Korrelationskoeffizienten in Python
Liste der Python-Bibliotheken für Datenwissenschaftler und Dateningenieure
Registrieren Sie gemeinsam Daten im Firestore mithilfe der CSV-Datei in Python
Unterschied zwischen Ruby und Python in Bezug auf Variablen
[Python] Berechnung der Differenz von Datum und Zeit in Monaten und Jahren
Leistungsüberprüfung der Datenvorverarbeitung in der Verarbeitung natürlicher Sprache
Den Inhalt der Daten in Python nicht kennen
Liste des Python-Codes, der bei der Big-Data-Analyse verwendet wird
Verwenden wir die offenen Daten von "Mamebus" in Python
Asynchrone Verarbeitung von Python ~ Asynchron vollständig verstehen und warten ~
Verarbeiten Sie CSV-Daten mit Python (Zählverarbeitung mit Pandas)
Ich habe in Python ein Programm erstellt, das FX-CSV-Daten liest und eine große Anzahl von Diagrammbildern erstellt
Beispiel für das Abrufen des Modulnamens und des Klassennamens in Python
Überblick über die Verarbeitung natürlicher Sprache und ihre Datenvorverarbeitung
Vergleichen Sie die Lese- / Schreibgeschwindigkeit und Kapazität von CSV, Pickle, Joblib und Parkett in einer Python-Umgebung
Konsolidieren Sie eine große Anzahl von CSV-Dateien in Ordnern mit Python (Daten ohne Header).
Überprüfen Sie die Verarbeitungszeit und die Anzahl der Aufrufe für jeden Prozess mit Python (cProfile).
Behandeln Sie Umgebungsdaten in Python
UTF8-Textverarbeitung mit Python
Bis Sie tägliche Daten für mehrere Jahre japanischer Bestände erhalten und diese in einer einzigen CSV (Python) speichern
Zeigen Sie UTM-30LX-Daten in Python an
Asynchrone Verarbeitung (Threading) in Python