Ich habe 0 Jahre Programmiererfahrung und fordere die Datenverarbeitung mit Python heraus

Stellen Sie sich zunächst kurz vor. Ich habe im Mai 2020 angefangen, Datenwissenschaft zu studieren.

・ Bis Mai 2020 ist es das erste Mal, dass die Programmiersprache selbst berührt wird ・ Da Excel häufig für die Arbeit verwendet wird, ist es eine Ebene, die einfache Funktionen ausführen kann.

Als ich Data Science studierte, dachte ich Es gibt nur wenige Orte, an denen die Datenverarbeitung geübt werden kann, was in der Praxis am belastendsten zu sein scheint! !! Das ist.

In der Zwischenzeit, ungefähr im Juni, hat die Data Scientist Association die optimalen Ausgaben auf GitHub hochgeladen! Zitat: General Incorporated Association Data Scientist Association Data Science 100 Knock (Strukturierte Datenverarbeitung) https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess

Als ersten Schritt möchte ich diese 100 Schläge mit Python, SQL, R ausprobieren, ohne auf den Antwortcode zu achten. Wie oben erwähnt, da ich ein echter Amateur bin, wenn es um Programmierung geht, gibt es vielleicht viel verdammten Code, aber bitte schauen Sie ihn sich warm an.


P-001: Zeigen Sie die ersten 10 Elemente aller Elemente aus dem Datenrahmen (df_receipt) der Belegdetails an und überprüfen Sie visuell, welche Art von Daten Sie haben.

In



df_receipt.head(10)

Ausgabeergebnis: スクリーンショット 2020-09-05 18.40.20.png

P-002: Geben Sie Spalten in der Reihenfolge des Verkaufsdatums (sales_ymd), der Kunden-ID (customer_id), des Produktcodes (product_cd) und des Verkaufsbetrags (Betrag) aus dem Datenrahmen der Belegabrechnung (df_receipt) an und zeigen Sie 10 Artikel an.

In



df_clms = df_receipt[["sales_ymd", "customer_id", "product_cd", "amount"]]
df_clms.head(10)

Ausgabeergebnis: スクリーンショット 2020-09-05 18.43.40.png

Ich werde es aktualisieren, wenn ich Zeit habe.

Recommended Posts

Ich habe 0 Jahre Programmiererfahrung und fordere die Datenverarbeitung mit Python heraus
Verarbeitung von CSV-Daten in voller und halber Breite in Python
Fordern Sie die Hauptkomponentenanalyse von Textdaten mit Python heraus
Bildverarbeitung mit Python (ich habe versucht, es in 0 und 1 Mosaikkunst zu binarisieren)
Ich habe versucht, die Verarbeitungsgeschwindigkeit mit dplyr von R und pandas von Python zu vergleichen
Befreien Sie sich mit Python und regulären Ausdrücken von schmutzigen Daten
Ich habe mit PyQt5 und Python3 gespielt
Koexistenz von Python2 und 3 mit CircleCI (1.0)
Ich habe die Geschwindigkeit von Hash mit Topaz, Ruby und Python verglichen
Empfohlene Bücher und Quellen für die Datenanalyseprogrammierung (Python oder R)
Geschwindigkeitsvergleich der Volltextverarbeitung von Wiktionary mit F # und Python
Ich habe versucht, unerfahrenen Programmierern Python beizubringen
Grundlagen der binärisierten Bildverarbeitung durch Python
Datenpipeline-Aufbau mit Python und Luigi
Umgang mit "Jahren und Monaten" in Python
Ich habe Numba mit Python3.5 installiert und verwendet
Zeichnen mit Matrix-Reinventor von Python Image Processing-
Empfehlung von Altair! Datenvisualisierung mit Python
Beispiel für eine effiziente Datenverarbeitung mit PANDAS
Ich habe die numerische Berechnung von Python durch Rust ersetzt und die Geschwindigkeit verglichen
Rehabilitation von Python- und NLP-Kenntnissen ab "100 Language Processing Knock 2015" (Kapitel 1)
Ich habe die Geschwindigkeit der Listeneinschlussnotation für und während mit Python2.7 gemessen.
Ich habe versucht, die statistischen Daten der neuen Corona mit Python abzurufen und zu analysieren: Daten der Johns Hopkins University
Python-Übungsdatenanalyse Zusammenfassung des Lernens, dass ich ungefähr 10 mit 100 Schlägen getroffen habe
Ich habe Hunderte Millionen SQLite mit Python ausprobiert
[Python] Ich habe mit der Verarbeitung natürlicher Sprache ~ Transformatoren ~ gespielt
Ich habe Jacobian und teilweise Differenzierung mit Python versucht
Ich habe versucht, CloudWatch-Daten mit Python abzurufen
Ich habe Funktionssynthese und Curry mit Python versucht
TRIE-Baumimplementierung mit Python und LOUDS
Ich habe mit der maschinellen Vorverarbeitung von Python Data begonnen
E / A-bezogene Zusammenfassung von Python und Fortan
Fortsetzung der Multi-Plattform-Entwicklung mit Electron und Python
Praxis der Erstellung einer Datenanalyseplattform mit BigQuery und Cloud DataFlow (Datenverarbeitung)
Beispiel für das Lesen und Schreiben von CSV mit Python
Rehabilitation von Python- und NLP-Kenntnissen ab "Knock 100 Language Processing 2015" (Kapitel 2, zweite Hälfte)
Rehabilitation von Python- und NLP-Kenntnissen ab "100 Language Processing Knock 2015" (Kapitel 2, erste Hälfte)
Holen Sie sich mit Python eine große Menge von Starbas Twitter-Daten und probieren Sie die Datenanalyse Teil 1 aus
Ich habe ein gestapeltes Balkendiagramm mit matplotlib von Python erstellt und eine Datenbeschriftung hinzugefügt
Für diejenigen, die neu in der Programmierung sind, sich aber entschieden haben, Daten mit Python zu analysieren
Ich wollte nur die Daten des gewünschten Datums und der gewünschten Uhrzeit mit Django extrahieren
Versuchen Sie, das Programmier-Herausforderungsbuch mit Python3 zu lösen
Liste der Python-Bibliotheken für Datenwissenschaftler und Dateningenieure
Hinweise zur HDR- und RAW-Bildverarbeitung mit Python
Ich möchte die Optimierung mit Python und CPlex behandeln
[OpenCV / Python] Ich habe versucht, Bilder mit OpenCV zu analysieren
Laden Sie mp4 einfach teilweise mit Python und youtube-dl herunter!
[Kapitel 5] Einführung in Python mit 100 Klopfen Sprachverarbeitung
Visualisieren Sie den Bereich der internen und externen Einfügungen mit Python
Übersicht und Tipps von Seaborn mit statistischer Datenvisualisierung
[Python] Berechnung der Differenz von Datum und Zeit in Monaten und Jahren
Ich habe mir die Versionen von Blender und Python angesehen
Ich habe versucht, LINE BOT mit Python und Heroku zu machen
[Kapitel 3] Einführung in Python mit 100 Klopfen Sprachverarbeitung
[Kapitel 2] Einführung in Python mit 100 Klopfen Sprachverarbeitung
Asynchrone Verarbeitung von Python ~ Asynchron vollständig verstehen und warten ~
Verarbeiten Sie CSV-Daten mit Python (Zählverarbeitung mit Pandas)
Untersuchen Sie den Java- und Python-Datenaustausch mit Apache Arrow