Ich habe 0 Jahre Programmiererfahrung und fordere die Datenverarbeitung mit Python heraus

Stellen Sie sich zunächst kurz vor. Ich habe im Mai 2020 angefangen, Datenwissenschaft zu studieren.

・ Bis Mai 2020 ist es das erste Mal, dass die Programmiersprache selbst berührt wird ・ Da Excel häufig für die Arbeit verwendet wird, ist es eine Ebene, die einfache Funktionen ausführen kann.

Als ich Data Science studierte, dachte ich Es gibt nur wenige Orte, an denen die Datenverarbeitung geübt werden kann, was in der Praxis am belastendsten zu sein scheint! !! Das ist.

In der Zwischenzeit, ungefähr im Juni, hat die Data Scientist Association die optimalen Ausgaben auf GitHub hochgeladen! Zitat: General Incorporated Association Data Scientist Association Data Science 100 Knock (Strukturierte Datenverarbeitung) https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess

Als ersten Schritt möchte ich diese 100 Schläge mit Python, SQL, R ausprobieren, ohne auf den Antwortcode zu achten. Wie oben erwähnt, da ich ein echter Amateur bin, wenn es um Programmierung geht, gibt es vielleicht viel verdammten Code, aber bitte schauen Sie ihn sich warm an.

P-001: Zeigen Sie die ersten 10 Elemente aller Elemente aus dem Datenrahmen (df_receipt) der Belegdetails an und überprüfen Sie visuell, welche Art von Daten Sie haben.

`In`



df_receipt.head(10)

Ausgabeergebnis: スクリーンショット 2020-09-05 18.40.20.png

P-002: Geben Sie Spalten in der Reihenfolge des Verkaufsdatums (sales_ymd), der Kunden-ID (customer_id), des Produktcodes (product_cd) und des Verkaufsbetrags (Betrag) aus dem Datenrahmen der Belegabrechnung (df_receipt) an und zeigen Sie 10 Artikel an.

`In`



df_clms = df_receipt[["sales_ymd", "customer_id", "product_cd", "amount"]]
df_clms.head(10)

Ausgabeergebnis: スクリーンショット 2020-09-05 18.43.40.png

Ich werde es aktualisieren, wenn ich Zeit habe.

Recommended Posts

Ich habe 0 Jahre Programmiererfahrung und fordere die Datenverarbeitung mit Python heraus

Verarbeitung von CSV-Daten in voller und halber Breite in Python

Fordern Sie die Hauptkomponentenanalyse von Textdaten mit Python heraus

Bildverarbeitung mit Python (ich habe versucht, es in 0 und 1 Mosaikkunst zu binarisieren)

Ich habe versucht, die Verarbeitungsgeschwindigkeit mit dplyr von R und pandas von Python zu vergleichen

Befreien Sie sich mit Python und regulären Ausdrücken von schmutzigen Daten

Ich habe mit PyQt5 und Python3 gespielt

Koexistenz von Python2 und 3 mit CircleCI (1.0)

Ich habe die Geschwindigkeit von Hash mit Topaz, Ruby und Python verglichen

Empfohlene Bücher und Quellen für die Datenanalyseprogrammierung (Python oder R)

Geschwindigkeitsvergleich der Volltextverarbeitung von Wiktionary mit F # und Python

Ich habe versucht, unerfahrenen Programmierern Python beizubringen

Grundlagen der binärisierten Bildverarbeitung durch Python

Datenpipeline-Aufbau mit Python und Luigi

Umgang mit "Jahren und Monaten" in Python

Ich habe Numba mit Python3.5 installiert und verwendet

Zeichnen mit Matrix-Reinventor von Python Image Processing-

Empfehlung von Altair! Datenvisualisierung mit Python

Beispiel für eine effiziente Datenverarbeitung mit PANDAS

Ich habe die numerische Berechnung von Python durch Rust ersetzt und die Geschwindigkeit verglichen

Rehabilitation von Python- und NLP-Kenntnissen ab "100 Language Processing Knock 2015" (Kapitel 1)

Ich habe die Geschwindigkeit der Listeneinschlussnotation für und während mit Python2.7 gemessen.

Ich habe versucht, die statistischen Daten der neuen Corona mit Python abzurufen und zu analysieren: Daten der Johns Hopkins University

Python-Übungsdatenanalyse Zusammenfassung des Lernens, dass ich ungefähr 10 mit 100 Schlägen getroffen habe

Ich habe Hunderte Millionen SQLite mit Python ausprobiert

[Python] Ich habe mit der Verarbeitung natürlicher Sprache ~ Transformatoren ~ gespielt

Ich habe Jacobian und teilweise Differenzierung mit Python versucht

Ich habe versucht, CloudWatch-Daten mit Python abzurufen

Ich habe Funktionssynthese und Curry mit Python versucht

TRIE-Baumimplementierung mit Python und LOUDS

Ich habe mit der maschinellen Vorverarbeitung von Python Data begonnen

E / A-bezogene Zusammenfassung von Python und Fortan

Fortsetzung der Multi-Plattform-Entwicklung mit Electron und Python

Praxis der Erstellung einer Datenanalyseplattform mit BigQuery und Cloud DataFlow (Datenverarbeitung)

Beispiel für das Lesen und Schreiben von CSV mit Python

Rehabilitation von Python- und NLP-Kenntnissen ab "Knock 100 Language Processing 2015" (Kapitel 2, zweite Hälfte)

Rehabilitation von Python- und NLP-Kenntnissen ab "100 Language Processing Knock 2015" (Kapitel 2, erste Hälfte)

Holen Sie sich mit Python eine große Menge von Starbas Twitter-Daten und probieren Sie die Datenanalyse Teil 1 aus

Ich habe ein gestapeltes Balkendiagramm mit matplotlib von Python erstellt und eine Datenbeschriftung hinzugefügt

Für diejenigen, die neu in der Programmierung sind, sich aber entschieden haben, Daten mit Python zu analysieren

Ich wollte nur die Daten des gewünschten Datums und der gewünschten Uhrzeit mit Django extrahieren

Versuchen Sie, das Programmier-Herausforderungsbuch mit Python3 zu lösen

Liste der Python-Bibliotheken für Datenwissenschaftler und Dateningenieure

Hinweise zur HDR- und RAW-Bildverarbeitung mit Python

Ich möchte die Optimierung mit Python und CPlex behandeln

[OpenCV / Python] Ich habe versucht, Bilder mit OpenCV zu analysieren

Laden Sie mp4 einfach teilweise mit Python und youtube-dl herunter!

[Kapitel 5] Einführung in Python mit 100 Klopfen Sprachverarbeitung

Visualisieren Sie den Bereich der internen und externen Einfügungen mit Python

Übersicht und Tipps von Seaborn mit statistischer Datenvisualisierung

[Python] Berechnung der Differenz von Datum und Zeit in Monaten und Jahren

Ich habe mir die Versionen von Blender und Python angesehen

Ich habe versucht, LINE BOT mit Python und Heroku zu machen

[Kapitel 3] Einführung in Python mit 100 Klopfen Sprachverarbeitung

[Kapitel 2] Einführung in Python mit 100 Klopfen Sprachverarbeitung

Asynchrone Verarbeitung von Python ~ Asynchron vollständig verstehen und warten ~

Verarbeiten Sie CSV-Daten mit Python (Zählverarbeitung mit Pandas)

Untersuchen Sie den Java- und Python-Datenaustausch mit Apache Arrow