J'ai 0 ans d'expérience en programmation et je défie le traitement des données avec python

Tout d'abord, présentez-vous brièvement. J'ai commencé à étudier la science des données en mai 2020.

・ C'est la première fois que vous touchez le langage de programmation lui-même jusqu'en mai 2020 ・ Comme Excel est souvent utilisé pour le travail, c'est un niveau qui peut gérer des fonctions simples.

Quand j'étudiais la science des données, je pensais Il y a peu d'endroits pour pratiquer le traitement des données, ce qui semble être le plus lourd en pratique! !! C'est.

Pendant ce temps, vers juin, la Data Scientist Association a téléchargé les problèmes optimaux sur GitHub! Citation: General Incorporated Association Data Scientist Association Data Science 100 Knock (traitement des données structurées) https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess

Dans un premier temps, j'aimerais essayer ces 100 coups avec Python, SQL, R sans regarder le code de réponse. Comme mentionné ci-dessus, puisque je suis un véritable amateur en matière de programmation, il peut y avoir beaucoup de putain de code, mais jetez un coup d'œil chaleureux.


P-001: Affichez les 10 premiers éléments de tous les éléments du bloc de données (df_receipt) des détails du reçu et vérifiez visuellement le type de données dont vous disposez.

In



df_receipt.head(10)

Résultat de sortie: スクリーンショット 2020-09-05 18.40.20.png

P-002: indiquez les colonnes dans l'ordre de la date de vente (sales_ymd), de l'ID client (customer_id), du code produit (product_cd) et du montant des ventes (montant) à partir du bloc de données du relevé de réception (df_receipt) et affichez 10 éléments.

In



df_clms = df_receipt[["sales_ymd", "customer_id", "product_cd", "amount"]]
df_clms.head(10)

Résultat de sortie: スクリーンショット 2020-09-05 18.43.40.png

Je le mettrai à jour quand j'aurai le temps.

Recommended Posts

J'ai 0 ans d'expérience en programmation et je défie le traitement des données avec python
Traitement pleine largeur et demi-largeur des données CSV en Python
Défiez l'analyse des composants principaux des données textuelles avec Python
Traitement d'image avec Python (j'ai essayé de le binariser en art mosaïque 0 et 1)
J'ai essayé de comparer la vitesse de traitement avec dplyr de R et pandas de Python
Débarrassez-vous des données sales avec Python et les expressions régulières
J'ai joué avec PyQt5 et Python3
Coexistence de Python2 et 3 avec CircleCI (1.0)
J'ai comparé la vitesse de Hash avec Topaz, Ruby et Python
Livres et sources recommandés de programmation d'analyse de données (Python ou R)
Comparaison de vitesse du traitement de texte intégral de Wiktionary avec F # et Python
J'ai essayé d'enseigner Python à des programmeurs inexpérimentés
Bases du traitement d'images binarisées par Python
Construction de pipeline de données avec Python et Luigi
Gérer les "années et mois" en Python
J'ai installé et utilisé Numba avec Python3.5
Dessin avec Matrix-Reinventor of Python Image Processing-
Recommandation d'Altair! Visualisation des données avec Python
Exemple de traitement efficace des données avec PANDAS
J'ai remplacé le calcul numérique de Python par Rust et comparé la vitesse
Réhabilitation des compétences Python et PNL à partir de "100 Language Processing Knock 2015" (Chapitre 1)
J'ai mesuré la vitesse de la notation d'inclusion de liste, pendant et pendant avec python2.7.
J'ai essayé d'obtenir et d'analyser les données statistiques de la nouvelle Corona avec Python: données de l'Université John's Hopkins
Analyse des données de pratique Python Résumé de l'apprentissage que j'ai atteint environ 10 avec 100 coups
J'ai essayé des centaines de millions de SQLite avec python
[Python] J'ai joué avec le traitement du langage naturel ~ transformers ~
J'ai essayé la différenciation jacobienne et partielle avec python
J'ai essayé d'obtenir des données CloudWatch avec Python
J'ai essayé la synthèse de fonctions et le curry avec python
Implémentation de l'arbre TRIE avec Python et LOUDS
J'ai commencé l'apprentissage automatique avec le prétraitement des données Python
Résumé relatif aux E / S de python et fortran
Poursuite du développement multi-plateforme avec Electron et Python
Pratique de création d'une plateforme d'analyse de données avec BigQuery et Cloud DataFlow (traitement de données)
Exemple de lecture et d'écriture de CSV avec Python
Réhabilitation des compétences Python et PNL à partir de «Knock 100 Language Processing 2015» (chapitre 2 deuxième semestre)
Réhabilitation des compétences Python et PNL à partir de "100 Language Processing Knock 2015" (Chapitre 2 premier semestre)
Obtenez une grande quantité de données Twitter de Starba avec python et essayez l'analyse de données Partie 1
J'ai créé un graphique à barres empilées avec matplotlib de Python et ajouté une étiquette de données
Pour ceux qui débutent en programmation mais qui ont décidé d'analyser les données avec Python
Je voulais juste extraire les données de la date et de l'heure souhaitées avec Django
Essayez de résoudre le livre des défis de programmation avec python3
Liste des bibliothèques Python pour les data scientists et les data ingénieurs
Remarques sur le traitement d'images HDR et RAW avec Python
Je veux gérer l'optimisation avec python et cplex
[OpenCV / Python] J'ai essayé l'analyse d'image de cellules avec OpenCV
Téléchargez facilement et partiellement mp4 avec python et youtube-dl!
[Chapitre 5] Introduction à Python avec 100 coups de traitement du langage
Visualisez la gamme d'insertions internes et externes avec python
Vue d'ensemble et astuces de Seaborn avec visualisation de données statistiques
[python] Calcul des mois et des années de différence de date / heure
J'ai vérifié les versions de Blender et Python
J'ai essayé de faire LINE BOT avec Python et Heroku
[Chapitre 3] Introduction à Python avec 100 coups de traitement du langage
[Chapitre 2] Introduction à Python avec 100 coups de traitement du langage
Traitement asynchrone de Python ~ Comprenez parfaitement async et attendez ~
Traiter les données csv avec python (traitement du comptage à l'aide de pandas)
Étudiez l'échange de données Java et Python avec Apache Arrow