Opérations de base sur les blocs de données écrites par des débutants au cours d'une semaine d'apprentissage de Python

Ceci est mon propre mémo de la partie où j'ai trébuché en écrivant le code. Outre la simple lecture et l'écriture de trames de données Voici un exemple de traitement lorsque vous souhaitez créer une nouvelle colonne B qui contient 1 s'il y a un cercle dans la colonne A et 2 si ce n'est pas le cas.

Exemple de code

Dans ce code, "dfCsv" s'écrit généralement "df".

dfex.py


import csv
import codecs
import os, os.path
import datetime
import pandas as pd
import warnings

CSVFILE="Nanna.csv"

def main():
    print(str(datetime.datetime.now())+"\t"+"Commencez à lire les données cibles.")

    #Conversion d'un fichier CSV en trame de données dfCsv.
    dfCsv= pd.read_csv(CSVFILE,encoding='cp932', header=0)
    print(str(datetime.datetime.now())+"\t"+CSVFILE+":Le chargement est terminé.")
    
    
    #Lorsque vous ajoutez une nouvelle colonne, vous pouvez le faire comme ceci.
    dfCsv=textSearch(dfCsv)  
    
    #Résultat le résultat de l'exécution.Exporter vers csv
    with open("result.csv",mode='w') as f:
        s = ""
        f.write(s)
    dfCsv.to_csv("result.csv",mode="a")

#Ajouté au bloc de données existant.
def textSearch(dfTmp):
    #Déclarer une liste vide
    #Si vous ajoutez pendant la lecture d'une ligne du bloc de données, vous obtiendrez une liste avec le même nombre de lignes que le bloc de données.
    profList=[]
    for profTxt in dfTmp['profil']:
        profList.append(profTxt)

    retList=[]
    for prof in profList:
        if ("Japon" in str(prof))  : 
            ret="Japonais"
        else:
            ret="pas japonais"
        retList.append(ret)

    #Joignez la liste créée par ce sous-programme à la trame de données transmise.
    dfTmp['Japonais?'] = retList 
    return(dfTmp)

if __name__ == "__main__":
    main()

Commentaire

C'est le cœur de cette époque.

    #Lorsque vous ajoutez une nouvelle colonne, vous pouvez le faire comme ceci.
    dfCsv=textSearch(dfCsv)  

Cela ne signifie pas "simplement appeler une fonction appelée textSearch!". Le textSearch lui-même est défini dans ce code de programme. Si vous transmettez la trame de données à un sous-programme et effectuez le traitement de cette manière Vous pouvez ajouter une nouvelle colonne au bloc de données qui stocke les résultats du traitement.

Recommended Posts

Opérations de base sur les blocs de données écrites par des débutants au cours d'une semaine d'apprentissage de Python
Touchons une partie de l'apprentissage automatique avec Python
Environnement enregistré pour l'analyse des données avec Python
Histoire de base de l'héritage en Python (pour les débutants)
Regrouper par éléments consécutifs d'une liste en Python
Résumé de base des opérations de données dans Python Pandas - Deuxième moitié: agrégation de données
Un mémo que j'ai écrit une fonction de base en Python en utilisant la récurrence
Comparaison de la gestion des trames de données en Python (pandas), R, Pig
Un résumé de l'apprentissage automatique Python pour débutant est très concis.
Résumé de l'apprentissage automatique par les débutants de Python
[Python] Mémo des phrases fréquemment utilisées dans les scripts Python
Lire la sortie standard d'un sous-processus ligne par ligne en Python
Impressions de toucher Dash, un outil de visualisation de données réalisé par python
Mémorandum of scraping & machine learning [technique de développement] par Python (chapitre 4)
Mémorandum of scraping & machine learning [technique de développement] par Python (chapitre 5)
"Le gars qui bloque tous les comptes Twitter dans la base de données" créé par les débutants de la journée d'apprentissage Python
[Mémo d'apprentissage] Bases de la classe par python
Afficher une liste d'alphabets en Python 3
Comment envoyer une image visualisée des données créées en Python à Typetalk
Python: prétraitement en machine learning: acquisition de données
Python: prétraitement dans l'apprentissage automatique: conversion de données
Gacha écrit en python-Implémentation dans la structure de données de base-
Lecture de code de faker, une bibliothèque qui génère des données de test en Python
Python: prétraitement en machine learning: gestion des données manquantes / aberrantes / déséquilibrées
Utilisons Python pour représenter la fréquence des données binaires contenues dans une trame de données dans un graphique à barres unique.
Un manuel pour les débutants réalisé par des débutants Python
Analyse des données en Python Résumé des sources que les débutants devraient d'abord consulter
Un mémorandum de méthode souvent utilisé dans l'apprentissage automatique utilisant scikit-learn (pour les débutants)
[Python] Tracer les données par préfecture sur une carte (nombre de voitures possédées dans tout le pays)
Récupérer l'appelant d'une fonction en Python
Visualisation en temps réel des données thermographiques AMG8833 en Python
Mémorandum d'extraction par requête python bs4
Réécrire des éléments dans une boucle de listes (Python)
Interpolation d'images vidéo par apprentissage en profondeur, partie 1 [Python]
L'histoire de la lecture des données HSPICE en Python
Créez un tracé de R semblable à un joyplot avec python
Sortie sous la forme d'un tableau python
Histoire de l'analyse de données par apprentissage automatique
Résumé des opérations Excel utilisant OpenPyXL en Python
Comment créer un ensemble de données d'image de visage utilisé dans l'apprentissage automatique (2: Analyse d'image de la vidéo pour obtenir des images candidates)
Prédire le temps objectif d'un marathon complet avec l'apprentissage automatique-③: j'ai essayé de visualiser les données avec Python-
Consolider un grand nombre de fichiers CSV dans des dossiers avec python (données sans en-tête)
Découvrez le nombre maximum de caractères dans un texte multiligne stocké dans un bloc de données
Comment un "banquier amateur" a réussi l'examen de base de la certification d'ingénieur Python 3 en une semaine
Analyser une chaîne JSON écrite dans un fichier en Python
Créer un bot de collecte de données en Python à l'aide de Selenium
Résumé des outils nécessaires pour analyser les données en Python
Recevez des données de dictionnaire à partir de programmes Python avec AppleScript
Une collection de code souvent utilisée dans Python personnel
Outil MALSS (basique) qui prend en charge l'apprentissage automatique en Python
J'ai créé un programme en Python qui change les données de 1 minute de FX en une heure arbitraire (1 heure, etc.)
Ne pas être conscient du contenu des données en python
Liste du code Python utilisé dans l'analyse de Big Data
Jusqu'à ce que vous insériez des données dans une feuille de calcul en Python
Exercice Python pour les débutants # 1 [Types de données de base / instructions If]
Utilisons les données ouvertes de "Mamebus" en Python
Résumé du flux de base de l'apprentissage automatique avec Python