Grundlegende Datenrahmenoperationen, die von Anfängern in einer Woche Python-Lernen geschrieben wurden

Dies ist mein eigenes Memo des Teils, in dem ich beim Schreiben des Codes gestolpert bin. Neben dem einfachen Lesen und Schreiben über Datenrahmen Dies ist ein Verarbeitungsbeispiel, wenn Sie eine neue Spalte B erstellen möchten, die 1 enthält, wenn sich in Spalte A ein Kreis befindet, und 2, wenn dies nicht der Fall ist.

Codebeispiel

In diesem Code wird "dfCsv" im Allgemeinen als "df" geschrieben.

dfex.py


import csv
import codecs
import os, os.path
import datetime
import pandas as pd
import warnings

CSVFILE="Nanna.csv"

def main():
    print(str(datetime.datetime.now())+"\t"+"Beginnen Sie mit dem Lesen der Zieldaten.")

    #Konvertieren von CSV-Datei in Datenrahmen dfCsv.
    dfCsv= pd.read_csv(CSVFILE,encoding='cp932', header=0)
    print(str(datetime.datetime.now())+"\t"+CSVFILE+":Das Laden ist abgeschlossen.")
    
    
    #Wenn Sie eine neue Spalte hinzufügen, können Sie dies folgendermaßen tun.
    dfCsv=textSearch(dfCsv)  
    
    #Ergebnis das Ausführungsergebnis.Export nach CSV
    with open("result.csv",mode='w') as f:
        s = ""
        f.write(s)
    dfCsv.to_csv("result.csv",mode="a")

#Zum vorhandenen Datenrahmen hinzugefügt.
def textSearch(dfTmp):
    #Deklarieren Sie eine leere Liste
    #Wenn Sie beim Lesen einer Zeile aus dem Datenrahmen anhängen, erhalten Sie eine Liste mit der gleichen Anzahl von Zeilen wie der Datenrahmen.
    profList=[]
    for profTxt in dfTmp['Profil']:
        profList.append(profTxt)

    retList=[]
    for prof in profList:
        if ("Japan" in str(prof))  : 
            ret="japanisch"
        else:
            ret="nicht japanisch"
        retList.append(ret)

    #Verbinden Sie die von dieser Unterroutine erstellte Liste mit dem übergebenen Datenrahmen.
    dfTmp['Japanisch?'] = retList 
    return(dfTmp)

if __name__ == "__main__":
    main()

Kommentar

Dies ist das Herz dieser Zeit.

    #Wenn Sie eine neue Spalte hinzufügen, können Sie dies folgendermaßen tun.
    dfCsv=textSearch(dfCsv)  

Es bedeutet nicht "Rufen Sie einfach eine Funktion namens textSearch auf!". Die textSearch selbst ist in diesem Programmcode definiert. Wenn Sie den Datenrahmen an eine Unterroutine übergeben und die Verarbeitung auf diese Weise durchführen Sie können dem Datenrahmen eine neue Spalte hinzufügen, in der die Verarbeitungsergebnisse gespeichert sind.

Recommended Posts

Grundlegende Datenrahmenoperationen, die von Anfängern in einer Woche Python-Lernen geschrieben wurden
Lassen Sie uns einen Teil des maschinellen Lernens mit Python berühren
Aufgezeichnete Umgebung für die Datenanalyse mit Python
Grundlegende Geschichte der Vererbung in Python (für Anfänger)
Gruppieren Sie nach aufeinanderfolgenden Elementen einer Liste in Python
Grundlegende Zusammenfassung der Datenoperationen in Python Pandas - Zweite Hälfte: Datenaggregation
Ein Memo, dass ich eine Grundfunktion in Python mit Wiederholung geschrieben habe
Vergleich der Datenrahmenbehandlung in Python (Pandas), R, Pig
Die Zusammenfassung des maschinellen Lernens in Python für Anfänger ist sehr kurz.
Zusammenfassung des maschinellen Lernens von Python-Anfängern
[Python] Ein Memo häufig verwendeter Phrasen in Python-Skripten
Lesen Sie die Standardausgabe eines Unterprozesses zeilenweise in Python
Impressionen von Touch, einem von Python erstellten Datenvisualisierungstool
Memorandum of Scraping & Machine Learning [Entwicklungstechnik] von Python (Kapitel 4)
Memorandum of Scraping & Machine Learning [Entwicklungstechnik] von Python (Kapitel 5)
"Der Typ, der alle Twitter-Konten in der Datenbank blockiert", erstellt von Anfängern des Python-Lerntages
[Lernnotiz] Grundlagen des Unterrichts mit Python
Zeigen Sie eine Liste der Alphabete in Python 3 an
So senden Sie ein visualisiertes Bild der in Python erstellten Daten an Typetalk
Python: Vorverarbeitung beim maschinellen Lernen: Datenerfassung
Python: Vorverarbeitung beim maschinellen Lernen: Datenkonvertierung
Gacha geschrieben in Python-Implementierung in grundlegende Datenstruktur-
Code lesen von faker, einer Bibliothek, die Testdaten in Python generiert
Python: Vorverarbeitung beim maschinellen Lernen: Umgang mit fehlenden / Ausreißern / unausgeglichenen Daten
Verwenden wir Python, um die Häufigkeit der in einem Datenrahmen enthaltenen Binärdaten in einem einzelnen Balkendiagramm darzustellen.
Ein Lehrbuch für Anfänger von Python-Anfängern
Datenanalyse in Python Zusammenfassung der Quellen, die Anfänger zuerst betrachten sollten
Ein Memorandum über Methoden, die häufig beim maschinellen Lernen mit Scikit-Learn (für Anfänger) verwendet werden.
[Python] Zeichnen Sie Daten nach Präfektur auf einer Karte (Anzahl der Autos im ganzen Land)
Holen Sie sich den Aufrufer einer Funktion in Python
Echtzeitvisualisierung von Thermografie AMG8833-Daten in Python
Memorandum der Extraktion durch Python BS4-Anfrage
Umschreiben von Elementen in einer Listenschleife (Python)
Videorahmeninterpolation durch tiefes Lernen Teil 1 [Python]
Die Geschichte des Lesens von HSPICE-Daten in Python
Machen Sie mit Python eine Joyplot-ähnliche Handlung von R.
Ausgabe in Form eines Python-Arrays
Geschichte rund um die Datenanalyse durch maschinelles Lernen
Zusammenfassung der Excel-Operationen mit OpenPyXL in Python
Erstellen eines Gesichtsbilddatensatzes für maschinelles Lernen (2: Rahmenanalyse von Videos, um Kandidatenbilder zu erhalten)
Vorhersage der Zielzeit eines vollständigen Marathons mit maschinellem Lernen - Visual: Visualisierung von Daten mit Python-
Konsolidieren Sie eine große Anzahl von CSV-Dateien in Ordnern mit Python (Daten ohne Header).
Ermitteln Sie die maximale Anzahl von Zeichen in mehrzeiligem Text, die in einem Datenrahmen gespeichert sind
Wie ein "Amateur Banker" in einer Woche die Python 3 Engineer Certification Basic Exam bestand
Analysieren Sie eine JSON-Zeichenfolge, die in eine Datei in Python geschrieben wurde
Erstellen Sie mit Selenium einen Datenerfassungsbot in Python
Zusammenfassung der Tools, die zum Analysieren von Daten in Python benötigt werden
Empfangen Sie Wörterbuchdaten von Python-Programmen mit AppleScript
Eine Code-Sammlung, die häufig in persönlichem Python verwendet wird
Tool MALSS (Basic), das maschinelles Lernen in Python unterstützt
Ich habe in Python ein Programm erstellt, das die 1-Minuten-Daten von FX auf eine beliebige Zeit (1 Stunde usw.) ändert.
Den Inhalt der Daten in Python nicht kennen
Liste des Python-Codes, der bei der Big-Data-Analyse verwendet wird
Bis Sie Daten in eine Tabelle in Python einfügen
Python-Übung für Anfänger # 1 [Grundlegende Datentypen / If-Anweisungen]
Verwenden wir die offenen Daten von "Mamebus" in Python
Zusammenfassung des grundlegenden Ablaufs des maschinellen Lernens mit Python